פרדוקס סימפסון

מתוך המכלול, האנציקלופדיה היהודית
גרסה מ־04:33, 2 בספטמבר 2019 מאת מוטיאל (שיחה | תרומות) (החלפת טקסט – "לעתים" ב־"לעיתים")
קפיצה לניווט קפיצה לחיפוש
המחשה של פרדוקס סימפסון: ניכרת מגמת עלייה בשתי הקבוצות (האדומה והכחולה) בנפרד אך כשמאחדים אותן המגמה מתהפכת (שחור מקווקו)

פרדוקס סימפסון (או אפקט יול-סימפסון) הוא פרדוקס בתחום הסטטיסטיקה בו תוצאה (קורלציה או מגמה מסוימת) הבאה לידי ביטוי בקבוצות נתונים, מתהפכת כאשר מאחדים את קבוצות הנתונים השונות. תוצאות כאלה מתקבלות לעיתים במחקרים של מדעי החברה ומחקרים רפואיים, בדרך כלל, על ידי ניתוח נמהר של הנתונים. הפרדוקס נעלם כשבוחנים לעומק את הקשרים הסיבתיים בין הנתונים.

אדוארד ה. סימפסון תיאר את התופעה בשנת 1951 יחד עם קרל פירסון ואודני יול. השם 'פרדוקס סימפסון' ניתן על ידי קולין ר. בליט בשנת 1972.

דוגמאות

אפליה על רקע מגדרי באוניברסיטת ברקלי

אחד המקרים המפורסמים של פרדוקס סימפסון קשור לחשש של אוניברסיטת קליפורניה בברקלי מתביעה נגדה, בטענה שהם מפלים נשים בקבלה לתואר שני. נתוני הקבלה לסתיו 1973 הראו כי לגבר סיכויים גבוהים יותר להתקבל מאישה. הפער היה כה גדול שלא ניתן היה להסבירו כצרוף מקרים סטטיסטי.

מועמדים התקבלו
גברים 8442 44%
נשים 4321 35%

אולם, כאשר נבחנו הנתונים מכל פקולטה בנפרד, לא נמצאה אף אחת שמפלה נשים. להפך, ברוב הפקולטות נמצאה דווקא אפליה קטנה נגד גברים.

תחום גברים נשים
מועמדים התקבלו % מועמדים התקבלו %
א 825 62% 108 82%
ב 560 63% 25 68%
ג 325 37% 593 34%
ד 417 33% 375 35%
ה 191 28% 393 24%
ו 272 6% 341 7%

התברר כי ההסבר לפרדוקס הוא שנשים נטו להגיש מועמדות לפקולטות תחרותיות בעלי אחוז קבלה נמוך וגברים העדיפו כאלה שמקבלים את רוב המועמדים המתאימים[1].

טיפול אבנים בכליות

במחקר רפואי שבוצע הושוו שיעורי ההצלחה של שני טיפולים אפשריים עבור אבנים בכליות.

הטבלה הבאה מציגה את שיעורי ההצלחה של שני סוגי הטיפול למול אבנים קטנות או גדולות בכליות. טיפול א' מתייחס לניתוחים פתוחים, בעוד טיפול ב' מתייחס לטיפול פחות חודרני הנעשה בעזרת חור קטן.

הטיפול המוצלח יותר בכל שורה מודגש.

טיפול א' טיפול ב'
אבנים קטנות קבוצה 1

93%

81/87

קבוצה 2

87%

234/270

אבנים גדולות קבוצה 3

73%

192/263

קבוצה 4

69%

55/80

שניהם 78%

273/350

83%

289/350

המסקנה הפרדוקסלית היא שבעוד בעבור כל סוג אבן בנפרד טיפול א' עדיף, כשמסתכלים על הסה"כ טיפול ב' עדיף.

זאת משום שלא התחשבנו ב"משתנה המתערב" - חומרת המקרה.

עבור מקרים "קלים" - אבנים קטנות, העדיפו הרופאים להעניק את טיפול ב', בעוד עבור מקרים "קשים" העניקו את טיפול א'. לכן הקבוצות 2 ו-3 גדולות משמעותית מקבוצות 1 ו-4. כמו כן, סיכויי ההצלחה במקרים קשים של אבנים גדולות הם נמוכים משיעורי ההצלחה עבור אבנים קטנות. כיוון שמספר המקרים הקשים שקיבל את טיפול ב' קטן משמעותית, הוא פחות משפיע על סה"כ אחוזי ההצלחה בלי להפריד למקרים.

משקל לידה נמוך

פרדוקס משקל הלידה הנמוך הוא תצפית פרדוקסלית הקשורה למשקל הלידה של תינוקות (ולתמותה של תינוקות של ילדים) לאימהות מעשנות.

בכל מדינה יש משקל סף אשר תינוקות הנולדים מתחת למשקל זה מסווגים כבעלי משקל לידה נמוך. באוכלוסייה מסוימת, שיעור תמותת התינוקות בקרב תינוקות בעלי משקל לידה נמוך גבוה בהרבה מאשר בקרב שאר התינוקות.

שיעור תמותת התינוקות בקרב תינוקות במשקל רגיל זהה בקירוב בין תינוקות של אימהות מעשנות לבין לא-מעשנות, ושיעור תמותת התינוקות בקרב תינוקות במשקל לידה נמוך הוא דווקא נמוך יותר עבור תינוקות של אימהות מעשנות מאשר עבור אימהות לא-מעשנות. עם זאת, בהסתכלות כוללת שיעור תמותת התינוקות של תינוקות של אימהות מעשנות גבוה מזה של אימהות לא-מעשנות. זאת משום שלאימהות מעשנות נולדים תינוקות בעלי משקל לידה נמוך בשיעור גבוה יותר, ולתינוקות בעלי משקל לידה נמוך שיעור תמותת תינוקות גבוה יותר.

הטבלה הבאה מדגימה את היחסים של תמותת התינוקות בין אימהות מעשנות לאימהות לא-מעשנות:

שיעור תמותת תינוקות
אימהות מעשנות אימהות לא-מעשנות
תינוקות במשקל לידה נמוך פחות יותר
תינוקות במשקל לידה רגיל שווה שווה
כלל התינוקות יותר פחות

בייסבול

דוגמה מפורסמת לפרדוקס בוחנת את נתוני החבטות של שחקני בייסבול. ייתכן מצב בו שחקן אחד חובט בממוצע שנתי יותר משחקן שני במשך שנתיים ברצף אולם אם מאחדים בין השנים דווקא לשחקן השני יהיה ממוצע רב שנתי גבוה יותר. התופעה מתרחשת כאשר יש פער גדול בין כמות המשחקים בין השנים. דוגמה אמיתית לנתונים כאלה בוחנת את נתוני החבטות של דרק ג'יטר מול דייוויד ג'סטיס בשנים 1995/6:

1995 1996 משולב
דרק ג'יטר 12/48 0.25 183/582 0.314 195/630 0.31
דייוויד ג'סטיס 104/411 0.253 45/140 0.321 149/551 0.27

דוגמה עם כדורים

נניח כי יש בידינו ארבעה כובעים (שני שחורים ושני אפורים), 41 כדורים (23 אדומים ו-18 לבנים) ושני שולחנות (A  ו- B). הכדורים מסודרים בכובעים באופן הבאה:

  • בכובע השחור המונח על שולחן A  נמצאים 5 כדורים אדומים ו-6 לבנים.
  • בכובע האפור המונח על שולחן A  נמצאים 3 כדורים אדומים ו-4 לבנים.
  • בכובע השחור המונח על שולחן B  נמצאים 6 כדורים אדומים ו-3 לבנים.
  • בכובע האפור המונח על שולחן B  נמצאים 9 כדורים אדומים ו-5 לבנים.

נניח ונרצה להוציא כדור אדום.

ההסתברות להוצאת כדור אדום מהכובעים הנמצאים על שולחן A:

  • ההסתברות להוצאת כדור אדום מתוך הכובע השחור היא 0.4545 = 5/11 = 35/77.
  • ההסתברות להוצאת כדור אדום מן הכובע האפור היא 0.4285 = 3/7 =33/77.

קיבלנו שההסתברות לכדור אדום גבוהה יותר בכובע השחור.

כעת נחשב את ההסתברות להוצאת כדור אדום מהכובעים הנמצאים על שולחן B:

  • ההסתברות להוצאת כדור אדום מתוך הכובע השחור היא 0.6666 = 6/9 = 28/42.
  • ההסתברות להוצאת כדור אדום מתוך הכובע האפור היא 0.6428 = 9/14 = 27/42.

כלומר קיבלנו שגם כאן הסיכויים לכדור אדום גבוהים יותר בכובע השחור.

ועכשיו נבדוק מה קורה אם נחבר את הכדורים בשני הכובעים השחורים זה עם זה ואת הכדורים בכובעים האפורים אחד עם השני:

  • ההסתברות לקבלת כדור אדום מתוך הכובע השחור היא 0.55 = 11/20 = 231/420.
  • ההסתברות לקבלת כדור אדום מתוך הכובע האפור היא 0.5714 = 12/21 = 240/420.

קיבלנו כי ההסתברות לקבלת כדור אדום גבוהה יותר בכובע האפור מאשר בכובע השחור.

לקריאה נוספת

קישורים חיצוניים

  • יוסי לוי, The Simpson, באתר "נסיכת המדעים" (בעברית)
  • How statistics can be misleading - Mark Liddell - סרטון אנימציה של 4 דקות המסביר את פרדוקס סימפסון.

הערות שוליים