ניתוח סנטימנט

מתוך המכלול, האנציקלופדיה היהודית
קפיצה לניווט קפיצה לחיפוש

ניתוח סנטימנט (הידוע גם ככריית דעות או כבינה מלאכותית רגשית) הוא השימוש בעיבוד שפה טבעית, כריית טקסט, בלשנות חישובית וביומטריה כדי לזהות, לחלץ, לכמת ולחקור מצבים רגשיים ומידע סובייקטיבי באופן שיטתי. ניתוח סנטימנט מיושם באופן נרחב על "קולם של הלקוחות", כגון ביקורות ותגובות לסקרים, רשתות מקוונת וחברתית, ועוד. התחום משתמש במודלי שפה עמוקה כדי לנתח גם תחומי נתונים "קשים" יותר, כגון טקסטים חדשותיים שנכתבים לרוב בשפה נייטרלית ונמנעים מהבעת דעה או רגש בצורה מפורשת.[1]

ניתוח סנטימנט הוכח כטכניקה בעלת ערך רב עבור מערכות המלצה (מערכות מספקות המלצות למשתמשים על פריטים שעשויים לעניין אותם).

דוגמאות

הדוגמאות הבאות ממחישות את מטרת ניתוח הסנטימנט ואת האתגרים הכרוכים בביצועו.

מקרים פשוטים

  • החרמון הוא ההר היפה ביותר בישראל.
  • סירות דיג משנות ה-80 בצבע פסטל הן מכוערות.
  • אני לא אוהב אופנועים גדולים ומיושנים.

מקרים מאתגרים יותר

  • אני לא לא אוהב (do not dislike) סירות דיג (טיפול בשלילה)
  • לא לאהוב כלי שיט זה לא ממש הקטע שלי (שלילה, סדר מילים הפוך)
  • כשאני ארצה לשמוע את הדעה שלך, אני אבקש אותה (סרקזם)
  • אני אוהב את הנייד שלי אבל לא הייתי ממליץ עליו לאף אחד מהקולגות שלי (סנטימנט חיובי מותנה)

סוגי משימות

זיהוי קוטביות

אחת המשימות המרכזיות בניתוח סנטימנט היא סיווג הקוטביות של טקסט נתון. כלומר, זיהוי האם הטקסט הוא חיובי, שלילי או נייטרלי. סיווג סנטימנט מתקדם יותר יזהה מצבים רגשיים נוספים, כמו הנאה, כעס, גועל, עצב, פחד והפתעה.[2]

זיהוי סובייקטיביות/אובייקטיביות

משימה נפוצה נוספת היא סיווג טקסט נתון, בדרך כלל משפט, לאחד מהשניים: אובייקטיבי או סובייקטיבי.[3] משימה זו עלולה להיות מאתגרת, מאחר שהסובייקטיביות של מילים וביטויים היא לעיתים תלוית הקשר, ומסמך אובייקטיבי עשוי להכיל משפטים סובייקטיביים (למשל, מאמר חדשותי המצטט דעות של אנשים). בו פאנג, חוקרת מרכזית בענף ניתוח הסנטימנט, הראתה כי הסרת משפטים אובייקטיביים ממסמך בטרם סיווג הקוטביות שלו עזרה לשפר את הביצועים.

המונח 'אובייקטיבי' מתייחס לאירוע הנושא מידע עובדתי.[4] למשל, המשפט 'כדי להיבחר לנשיא ארצות הברית, מועמד חייב להיות בן שלושים וחמש לפחות'. המונח 'סובייקטיבי' מתאר אירוע באמצעות דעות אישיות ושיפוטיות, למשל המשפט 'אנחנו האמריקאים צריכים לבחור נשיא שהוא בוגר ומסוגל לקבל החלטות נבונות'.

זיהוי תכונה/היבט

משימה זו מתייחסת לזיהוי דעות או רגשות המובעים ביחס לתכונות או היבטים מסוימים של ישות כלשהי, למשל מסך של טלפון סלולרי, שירות של מסעדה או איכות צילום של מצלמה.[5] מאפיינים שונים של אותה ישות יכולים ליצור תגובות רגשיות שונות, למשל למלון יכול להיות מיקום נוח, אבל אוכל בינוני.[6] בעיה זו כוללת מספר בעיות משנה, למשל, זיהוי ישויות רלוונטיות, חילוץ התכונות/ההיבטים של אותן ישויות, וקביעה אם דעה המובעת על כל תכונה/היבט היא חיובית, שלילית או נייטרלית.[7]

דירוג אינטנסיביות

זיהוי עוצמת הרגשות המובעים בטקסט נתון. עוצמה זו היא לעיתים בעלת חשיבות מכרעת בהבנת התחושה המדויקת הנובעת מהטקסט (למשל, 'טוב' לעומת 'מדהים').

שיטות ותכונות

הגישות הקיימות לניתוח סנטימנט מתחלקות לשלוש קטגוריות עיקריות: טכניקות מבוססות ידע, שיטות סטטיסטיות וגישות היברידיות.[8] טכניקות מבוססות ידע מסווגות טקסט לפי קטגוריות השפעה בהתבסס על נוכחותן של מילות השפעה חד משמעיות כמו שמח, עצוב, מפחד או משועמם.[9] שיטות סטטיסטיות כוללות אלמנטים מתחום למידת המכונה, כמו LSA (ניתוח סמנטי סמוי - צורה של עיבוד שפה טבעית המבוססת על הרעיון שמילים המשמשות בהקשרים דומים נוטים להיות בעלי משמעויות דומות), מכונת וקטורים תומכים, "Bag-of-words", למידה עמוקה ועוד. השיטות לוקחות בחשבון, מעבר למילים עצמן, את ההקשר בו הן נאמרות או נכתבות, את סביבתן, ואת משמעותן. גישות היברידיות משתמשות הן בשיטות למידת מכונה והן באלמנטים מענף ייצוג ידע כגון אונטולוגיות ורשתות סמנטיות, על מנת לזהות סמנטיקה המתבטאת בצורה עדינה. זאת, למשל, באמצעות ניתוח מושגים שאינם מעבירים מידע רלוונטי במפורש, אך מקושרים באופן מרומז למושגים אחרים שעושים זאת.[10]

קישורים חיצוניים

ויקישיתוף מדיה וקבצים בנושא ניתוח סנטימנט בוויקישיתוף

הערות שוליים

  1. ^ Hamborg, Felix; Donnay, Karsten (2021). "NewsMTSC: A Dataset for (Multi-)Target-dependent Sentiment Classification in Political News Articles". "Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume"
  2. ^ Vong Anh Ho, Duong Huynh-Cong Nguyen, Danh Hoang Nguyen, Linh Thi-Van Pham, Duc-Vu Nguyen, Kiet Van Nguyen, Ngan Luu-Thuy Nguyen. "Emotion Recognition for Vietnamese Social Media Text". In Proceedings of the 2019 International Conference of the Pacific Association for Computational Linguistics (PACLING 2019), Hanoi, Vietnam (2019).
  3. ^ Pang, Bo; Lee, Lillian (2008). "4.1.2 Subjectivity Detection and Opinion Identification". Opinion Mining and Sentiment Analysis. Now Publishers Inc.
  4. ^ Wiebe, Janyce; Riloff, Ellen (2005). Gelbukh, Alexander (ed.). "Creating Subjective and Objective Sentence Classifiers from Unannotated Texts". Computational Linguistics and Intelligent Text Processing. Lecture Notes in Computer Science (באנגלית). Berlin, Heidelberg: Springer. 3406: 486–497. doi:10.1007/978-3-540-30586-6_53. ISBN 978-3-540-30586-6.
  5. ^ Hu, Minqing; Liu, Bing (2004). "Mining and Summarizing Customer Reviews". Proceedings of KDD 2004.
  6. ^ Cataldi, Mario; Ballatore, Andrea; Tiddi, Ilaria; Aufaure, Marie-Aude (2013-06-22). "Good location, terrible food: detecting feature sentiment in user-generated reviews". Social Network Analysis and Mining. 3 (4): 1149–1163. CiteSeerX 10.1.1.396.9313. doi:10.1007/s13278-013-0119-7. ISSN 1869-5450.
  7. ^ Liu, Bing; Hu, Minqing; Cheng, Junsheng (2005). "Opinion Observer: Analyzing and Comparing Opinions on the Web". Proceedings of WWW 2005.
  8. ^ Cambria, E; Schuller, B; Xia, Y; Havasi, C (2013). "New avenues in opinion mining and sentiment analysis". IEEE Intelligent Systems. 28 (2): 15–21. CiteSeerX 10.1.1.688.1384. doi:10.1109/MIS.2013.30.
  9. ^ Ortony, Andrew; Clore, G; Collins, A (1988). The Cognitive Structure of Emotions (PDF). Cambridge Univ. Press. אורכב מ-המקור (PDF) ב-2015-11-23.
  10. ^ Cambria, E; Hussain, A (2015). Sentic Computing: A Common-Sense-Based Framework for Concept-Level Sentiment Analysis. Springer. ISBN 9783319236544.
Logo hamichlol 3.png
הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0