מתאם פירסון

מתוך המכלול, האנציקלופדיה היהודית
גרסה מ־22:48, 5 ביולי 2017 מאת Davidnead (שיחה | תרומות) (גרסה אחת של הדף wikipedia:he:מתאם_פירסון יובאה)
קפיצה לניווט קפיצה לחיפוש

מתאם פירסון, או בשמו המלא מקדם המתאם של פירסון, על שם קרל פירסון, הוא מדד למתאם לינארי בין שתי קבוצות של מספרים. כאשר מדובר בעיבוד נתונים סטטיסטי, ההתייחסות היא בדרך כלל לקשר סימטרי בין שני משתנים. ערכי המדד נעים בין (1-) לבין (1+) והם מסומנים באות R או ב-:

  • במתאם של 1+ מתקיים קשר חיובי מלא בין שני המשתנים.
  • במתאם של 1- מתקיים קשר שלילי מלא בין שני המשתנים.
  • מתאם של 0 פירושו שבין שני המשתנים לא קיים קשר לינארי.

במקרים רבים יימצאו קשרים בערכי ביניים, לדוגמה: מתאם של 0.8+ פירושו שקיים קשר חיובי בעוצמה חזקה.

מקדם המתאם של פירסון מספק מידע בשני מישורים:

  1. עוצמת הקשר בין המשתנים: ככל שהערך קרוב יותר ל־1+ או ל־1- הוא חזק יותר.
  2. כיוון הקשר בין המשתנים: ערך חיובי פירושו קשר חיובי. ערך שלילי פירושו קשר שלילי (הפוך).

מבחינה מתמטית, הקורלציה בין שני משתנים מקריים X ו-Y עם תוחלות μX ו-μY וסטיות תקן σX ו-σY מוגדרת על פי הנוסחה הבאה:

כאשר E פירושה תוחלת ו-cov היא שונות משותפת. מאחר ש- ו-, ובאופן דומה גם ל-Y, אפשר לרשום את מקדם המתאם בצורה:

אם ידועים נתוני האוכלוסייה כולה, ניתן לחשב את מקדם המתאם של פירסון גם באופן הבא:

כאשר הוא ממוצע ערכי ו- ממוצע ערכי .

נוסחה זו משמשת גם לאמידת מקדם המתאם של פירסון באוכלוסייה כולה, כאשר ברשותנו רק מדגם מתוכה.