Bag of words (ראייה ממוחשבת)

בתחום ראייה ממוחשבת, מודל bag-of-words (מודל BoW) מיושם בבעיות של סיווג תמונה, על ידי כך שמסתכלים על חלקים בתמונה כעל מילים ויזואליות. בסיווג מסמך, bag-of-words הוא וקטור דליל של ספירת מופעים של מילים. כלומר, היסטוגרמה דלילה על אוצר המילים הנתון (הנקרא מילון). בראייה ממוחשבת, bag-of-visual-words הוא וקטור דליל של ספירת מופעים של מילים ויזואליות מתוך אוצר מילים ויזואליות נתון.

ייצוג על בסיס מודל BoW

ייצוג תמונה המבוסס על מודל BoW

על מנת לייצג תמונה באמצעות מודל זה, ניתן להתייחס לתמונה כמו אל מסמך. באנלוגיה, יש צורך להגדיר מהן "מילים" בתמונות. הגדרת המילים והמילון תעשה באמצעות שלושה שלבים עיקריים: גילוי מאפיינים (ראייה ממוחשבת), תיאור מאפיינים ויצירת מילון באמצעות המתארים.

ייצוג מאפיינים

לאחר זיהוי מאפיינים, כל תמונה מיוצגת ע”י חלקים מקומיים באזור המאפיינים. שיטות לייצוג מאפיינים מתמודדות עם השאלה איך לייצג את המאפיינים באמצעות וקטורים מספריים. וקטורים אלו נקראים מתארים (feature descriptors). מתאר טוב הוא מתאר שמסוגל להתמודד עם שינויי עוצמה בתמונה, סיבוב, שינוי קנה מידה במידה מסוימת. אחד מהמתארים המפורסמים ביותר הוא SIFT Scale-invariant feature transform. המייצג כל אזור נבחר בתמונה כוקטור מספרי 128 ממדים.

לאחר שלב ייצוג המאפיינים, כל תמונה היא אוסף של וקטורים מאותו הממד (128 ל-SIFT), שבו הסדר של וקטורים שונים הוא חסר חשיבות.

יצירת המילון

השלב האחרון במודל BoW הוא להמיר את האזורים שיוצגו באמצעות וקטורים לאוסף של "מילות קוד" או "מילים ויזואליות" (מילים באנלוגיה למסמכי טקסט), שגם מייצר codebook (אנלוגיה למילה במילון). מילת קוד יכולה לייצג מספר אזורים דומים. שיטה פשוטה אחת לקבלת המילים הוויזואליות היא ביצוע אשכול k-means על כל הווקטורים. [5] מילות קוד לאחר מכן הן המרכזים של הצבירים שנלמדו. מספר האשכולות הוא מספר המילים במילון הוויזואלי (אנלוגיה לגודל של המילון בטקסט).

לפיכך, כל אזור מאפיין בתמונה ממופה למילת קוד מסוימת בתהליך האשכול, והתמונה יכולה להיות מיוצג על ידי היסטוגרמה של מילות הקוד. הסטוגרמה זו מיוצרת על ידי ספירה של המופעים של המילים הוויזואליות מתוך המילון, בתמונה.

לקריאה נוספת

Szeliski, Richard. Computer vision: algorithms and applications. Springer, 2010. פרק 14
Csurka, Gabriella, et al. "Visual categorization with bags of keypoints." Workshop on statistical learning in computer vision, ECCV. Vol. 1. 2004.

הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0

Bag of words (ראייה ממוחשבת)38514317Q6884747

בינה מלאכותית
כללי	מבחן טיורינג • היסטוריה של הבינה המלאכותית • ציר הזמן של בינה מלאכותית • התקדמות הבינה המלאכותית • אוריינות AI • סוכן תבוני • AI-שלמות מערכת מומחה • אסדרת בינה מלאכותית (בישראל) • בינה מלאכותית צרה • בינה חישובית • הסברתיות בינה מלאכותית • הפרדוקס של מורבק • סוכן תבוני • אתיקה של בינה מלאכותית • זיהוי תוכן שנוצר על ידי בינה מלאכותית • Attention Is All You Need
תחומים	עיבוד שפה טבעית • ראייה ממוחשבת • בינה מלאכותית יוצרת • אומנות בינה מלאכותית • בינה מלאכותית כללית (AGI)
סוגי למידת מכונה	מערכת לומדת • למידה מונחית • למידה בלתי מונחית • למידה עמוקה • למידת חיזוק • סיווג בייסיאני נאיבי • רשת בייסיאנית
אלגוריתמי למידת מכונה קלאסית	פרספטרון • עץ החלטה • מכונת וקטורים תומכים • Bag of words • אלגוריתם k-מרכזים • אלגוריתם מיקסום התוחלת • הורדת ממד • אלגוריתם שכן קרוב • יער אקראי • Q-learning •‏ T-SNE •‏ Tf–idf • חיזוק גרדיאנט
למידה עמוקה	רשת עצבית מלאכותית • רשת זרימה קדימה • רשת עצבית רקורסיבית • פונקציית אקטיבציה • טרנספורמר • Attention •‏ GAN
עיבוד שפה טבעית	מודל שפה • שיכון מילים • בלשנות חישובית • תרגום מכונה • חילוץ מידע (אנ') • ניתוח סנטימנט • זיהוי חלקי דיבר (אנ') • מערכת זיהוי דיבור • זיהוי ישויות • כריית טקסט • תיוג תפקידים סמנטי • Word2vec • מודל שפה גדול • GPT •‏ BERT (אנ') • מודל Bag-of-words (אנ') • יצירת טקסט בשפה טבעית (אנ') • מילת עצירה • ניתוח מחרוזות • Stemming (אנ') • למטיזציה (אנ')
יישומים לבינה מלאכותית (אנ')	צ'אטבוט • זיהוי דובר • זיהוי עצמים • זיהוי תבניות • עוזר וירטואלי • זיהוי תווים אופטי • מחולל תמונות • הזיות
מערכות בינה מלאכותית	אלייזה • ChatGPT •‏ DALL-E •‏ Midjourney •‏ Gemini • קלוד •‏ Perplexity •‏ SearchGPT •‏ GitHub Copilot • דיפ־פייק • סירי • Google Assistant • אמזון אלכסה • מיקרוסופט קופיילוט • Qwen
סוגיות בטיחות בינה מלאכותית (אנ')	סכנה קיומית מבינה מלאכותית כללית • בינה מלאכותית חזקה (אנ') • יישור בינה מלאכותית (אנ') • בקרת יכולות בינה מלאכותית (אנ') • בינה מלאכותית ידידותית (אנ') • התכנסות אינסטרומנטלית (אנ') • סינגולריות טכנולוגית • השתלטות הבינה המלאכותית • המכתב הפתוח על בינה מלאכותית (2015)
ספריות בשימוש נרחב	TensorFlow •‏ PyTorch •‏ Torch •‏ Hugging Face •‏ Keras •‏ spaCy (אנ') •‏ Caffe
לקטגוריית הבינה המלאכותית

Bag of words (ראייה ממוחשבת)

תוכן עניינים

ייצוג על בסיס מודל BoW

ייצוג תמונה המבוסס על מודל BoW

ייצוג מאפיינים

יצירת המילון

לקריאה נוספת

תפריט ניווט

Bag of words (ראייה ממוחשבת)

ייצוג על בסיס מודל BoW

ייצוג תמונה המבוסס על מודל BoW

ייצוג מאפיינים

יצירת המילון

לקריאה נוספת

תפריט ניווט

חיפוש