ניתוח גורמים

מתוך המכלול, האנציקלופדיה היהודית
קפיצה לניווט קפיצה לחיפוש

ניתוח גורמיםאנגלית: Factor analysis) היא שיטה סטטיסטית המשמשת כטכניקה לצמצום מספר המשתנים שנבחנו במחקר על ידי חיפוש מגמות משותפות בקרבם. המגמות המשותפות ייוצגו על ידי משתנים חדשים הנקראים גורמים, שהם למעשה משתנים חבויים. הגורמים הם משתנים לינאריים המבוססים על מתאם (קורלציה) בין משתני המחקר המשוקללים המיוחסים לאותו גורם. כל משתנה יכול להיות מיוחס לגורם אחד בלבד, ומקובל לייחס בין 3-5 משתנים לגורם.

מטרת השיטה היא להקטין את כמות המשתנים במחקר (ללא איבוד מידע מהותי) ועל ידי כך לפשט מודלים מורכבים. בשיטה זו ניתן להשתמש גם במקרים בהם הקשרים בין המשתנים הנצפים למטרות המחקר ולערכים אותם מחפשים אינם ידועים או אינם ניתנים להישאל ישירות. השיטה משמשת גם לאישוש או הפרכת השערות טרם סיום המחקר.

לדוגמה: לעיתים מחפשים משתנים אשר אינם ניתנים למדידה ישירה, הן בשל היעדר משתנים ברי מדידה או בשל חוסר יכולת לקבל תשובות אמתיות. דוגמה לכך יכולה להיות מדידת גורם הצורך בהישגיות, אשר אותו ניתן לראות כשילוב של התמדה, חריצות ופרפקציוניזם. בראיה זו, יוגדר מראש גורם (משתנה חבוי) בשם צורך בהישגיות, המייצג צירוף של שלושה משתנים ברי המדידה. נשער כי שקלול שלושת המשתנים יהיה, לדוגמה: התמדה - 25%, חריצות – 30%, ופרפקציוניזם –45% . קביעת השקלול היחסי של כל משתנה בגורם נקרא טעינות (Loadings).

תהליך השימוש בשיטה

  • זיהוי הגורמים מתוך המשתנים שנאספו – איתור המבנה האופייני בתוך מערך גדול של משתנים (עבור ניתוח גורמים מגשש – ראה במושגים עיקריים).
  • פתוח הנחות/השערות לגבי מספר הגורמים והמשתנים המרכיבים כל אחד מהם (עבור ניתוח גורמים מאשש – ראה במושגים עיקריים).
  • בחינת החשיבות היחסית של המשתנים המקוריים בגורם הרלוונטי ושקלולם בהתאם.

מושגים עיקריים

  • משתנים חבויים (Latent Variables): משתנים אשר לא נמדדו ישירות במחקר, כלומר אינם נצפים ישירות במדידות אך ניתנים להבנה, זיהוי ואפיון על בסיס הנתונים הישירים שנאספו. לעיתים מתגלים רק לאחר בצוע קורלציות ולעיתים ידועים מראש אך לא נמדדים באופן ישיר. בפועל הגורמים הם משתנים חבויים.
  • ערך עצמי (Eigenvalue): מודד איזה חלק של האינפורמציה הכוללת מרוכז בגורם נתון (שהוא הוקטור העצמי השייך לערך זה). ככל שערכו נמוך יותר, כך הגורם תורם פחות להבנת השונות בין המשתנים. ערך עצמי גדול מראה שהגורם מרכז מידע רב, בעוד שערך קטן מופיע בגורמים השוליים שתרומתם להסבר השונות נמוכה. הערך העצמי הממוצע, של כל הגורמים יחד, הוא 1.
  • ניתוח גורמים מגשש (EFA – Exploratory Factor Analysis): מאתר מבנה לגילוי הקשרים הסמויים בין משתנים שנמדדו, בתוך מערך משתנים גדול. למעשה זהו תהליך של ניסוי וטעייה, כאשר כל גורם מייצג מספר משתנים. היחס המקובל הוא 3-5 משתנים לגורם וכל משתנה יופיע בגורם אחד בלבד.
  • ניתוח גורמים מאשש (CFA - Confirmatory Factor Analysis): בוחן ומאשר השערות בתאוריה המקדימה לגבי התאמת הגורמים והטעינות שנחזו.
  • התאמת המודל (GOF - goodness of fit): מתאר את מידת התאמת המודל הנבחן למערכת המדידות (נתונים). על ידי ציון חוסר ההתאמה בין התצפיות לערכי המודל שנבחן.
  • טעינות (לעיתים ניתן לראות בספרות כ"טעינויות") (Loadings): מקדמי שקלול המשתנים בהשפעה על הגורמים, כלומר הקורלציה של כל אחד מהמשתנים עם גורם אחד בלבד.

יתרונות השיטה

  • בעידן ה-Big Data של איסוף כמויות אדירות של נתונים, העיבוד מורכב והצגת המסקנות בעייתית בשל כמות הנתונים ואופן הצגתם באופן ברור ופשוט תוך מיצוי העיקר. ניתוח גורמים מהווה שיטה לניתוח איכותי של בסיס נתונים גדול.
  • מאפשרת את צמצום כמות המשתנים ונטרול אלו שאינם בעלי ערך לנושאי המחקר העיקריים, באמצעות בדיקת התאמה (GOF) וקביעת טעינות (Loadings) מתאימות.
  • מאפשרת הצגת מידע נסתר אשר לא יכול להישאל ישירות.
  • מאפשרת הקטנת בעיות בשאלונים בשל זיהוי קורלציה בין משתנים ואיחודם לגורמים. מתאים בעיקר בבחינת מדדים כגון אמינות (שגיאות מקריות), הטיה (שגיאות שיטתיות) וקבילות תוכן (האם אנו מודדים בפועל מה שאנחנו חושבים שאנו מודדים).

חסרונות השיטה

  • מחייבת אינטראקציה עמוקה של החוקרים עם נושאי המחקר ובכלל זאת העלאת השערות תוך כדי ניתוח ראשוני של התוצאות.
  • ישנן כמה שיטות להחלטה לגבי כמות הגורמים אותם יש להביא בחשבון ואין הסכמה בין השיטות השונות.
  • מקובל לחפש את הגורמים המהותיים ביותר אך לעיתים, מידע רלוונטי רב קיים גם בגורמים שאינם הראשיים שלא תמיד מובאים בחשבון.

ראו גם

לקריאה נוספת

קישורים חיצוניים

ויקישיתוף מדיה וקבצים בנושא ניתוח גורמים בוויקישיתוף