פרדוקס סימפסון
פרדוקס סימפסון (או אפקט יול-סימפסון) הוא פרדוקס בתחום הסטטיסטיקה בו תוצאה (קורלציה או מגמה מסוימת) הבאה לידי ביטוי בקבוצות נתונים, מתהפכת כאשר מאחדים את קבוצות הנתונים השונות. תוצאות כאלה מתקבלות לעיתים במחקרים של מדעי החברה ומחקרים רפואיים, בדרך כלל, על ידי ניתוח נמהר של הנתונים. הפרדוקס נעלם כשבוחנים לעומק את הקשרים הסיבתיים בין הנתונים.
אדוארד ה. סימפסון תיאר את התופעה בשנת 1951 יחד עם קרל פירסון ואודני יול. השם 'פרדוקס סימפסון' ניתן על ידי קולין ר. בליט בשנת 1972.
דוגמאות
אפליה על רקע מגדרי באוניברסיטת ברקלי
אחד המקרים המפורסמים של פרדוקס סימפסון קשור לחשש של אוניברסיטת קליפורניה בברקלי מתביעה נגדה, בטענה שהם מפלים נשים בקבלה לתואר שני. נתוני הקבלה לסתיו 1973 הראו כי לגבר סיכויים גבוהים יותר להתקבל מאישה. הפער היה כה גדול שלא ניתן היה להסבירו כצרוף מקרים סטטיסטי.
מועמדים | התקבלו | |
---|---|---|
גברים | 8442 | 44% |
נשים | 4321 | 35% |
אולם, כאשר נבחנו הנתונים מכל פקולטה בנפרד, לא נמצאה אף אחת שמפלה נשים. להפך, ברוב הפקולטות נמצאה דווקא אפליה קטנה נגד גברים.
תחום | גברים | נשים | ||
---|---|---|---|---|
מועמדים | התקבלו % | מועמדים | התקבלו % | |
א | 825 | 62% | 108 | 82% |
ב | 560 | 63% | 25 | 68% |
ג | 325 | 37% | 593 | 34% |
ד | 417 | 33% | 375 | 35% |
ה | 191 | 28% | 393 | 24% |
ו | 272 | 6% | 341 | 7% |
התברר כי ההסבר לפרדוקס הוא שנשים נטו להגיש מועמדות לפקולטות תחרותיות בעלי אחוז קבלה נמוך וגברים העדיפו כאלה שמקבלים את רוב המועמדים המתאימים[1].
טיפול אבנים בכליות
במחקר רפואי שבוצע הושוו שיעורי ההצלחה של שני טיפולים אפשריים עבור אבנים בכליות.
הטבלה הבאה מציגה את שיעורי ההצלחה של שני סוגי הטיפול למול אבנים קטנות או גדולות בכליות. טיפול א' מתייחס לניתוחים פתוחים, בעוד טיפול ב' מתייחס לטיפול פחות חודרני הנעשה בעזרת חור קטן.
הטיפול המוצלח יותר בכל שורה מודגש.
טיפול א' | טיפול ב' | |
---|---|---|
אבנים קטנות | קבוצה 1
93% 81/87 |
קבוצה 2
87% 234/270 |
אבנים גדולות | קבוצה 3
73% 192/263 |
קבוצה 4
69% 55/80 |
שניהם | 78%
273/350 |
83%
289/350 |
המסקנה הפרדוקסלית היא שבעוד בעבור כל סוג אבן בנפרד טיפול א' עדיף, כשמסתכלים על הסה"כ טיפול ב' עדיף.
זאת משום שלא התחשבנו ב"משתנה המתערב" - חומרת המקרה.
עבור מקרים "קלים" - אבנים קטנות, העדיפו הרופאים להעניק את טיפול ב', בעוד עבור מקרים "קשים" העניקו את טיפול א'. לכן הקבוצות 2 ו-3 גדולות משמעותית מקבוצות 1 ו-4. כמו כן, סיכויי ההצלחה במקרים קשים של אבנים גדולות הם נמוכים משיעורי ההצלחה עבור אבנים קטנות. כיוון שמספר המקרים הקשים שקיבל את טיפול ב' קטן משמעותית, הוא פחות משפיע על סה"כ אחוזי ההצלחה בלי להפריד למקרים.
משקל לידה נמוך
פרדוקס משקל הלידה הנמוך הוא תצפית פרדוקסלית הקשורה למשקל הלידה של תינוקות (ולתמותה של תינוקות של ילדים) לאימהות מעשנות.
בכל מדינה יש משקל סף אשר תינוקות הנולדים מתחת למשקל זה מסווגים כבעלי משקל לידה נמוך. באוכלוסייה מסוימת, שיעור תמותת התינוקות בקרב תינוקות בעלי משקל לידה נמוך גבוה בהרבה מאשר בקרב שאר התינוקות.
שיעור תמותת התינוקות בקרב תינוקות במשקל רגיל זהה בקירוב בין תינוקות של אימהות מעשנות לבין לא-מעשנות, ושיעור תמותת התינוקות בקרב תינוקות במשקל לידה נמוך הוא דווקא נמוך יותר עבור תינוקות של אימהות מעשנות מאשר עבור אימהות לא-מעשנות. עם זאת, בהסתכלות כוללת שיעור תמותת התינוקות של תינוקות של אימהות מעשנות גבוה מזה של אימהות לא-מעשנות. זאת משום שלאימהות מעשנות נולדים תינוקות בעלי משקל לידה נמוך בשיעור גבוה יותר, ולתינוקות בעלי משקל לידה נמוך שיעור תמותת תינוקות גבוה יותר.
הטבלה הבאה מדגימה את היחסים של תמותת התינוקות בין אימהות מעשנות לאימהות לא-מעשנות:
אימהות מעשנות | אימהות לא-מעשנות | |
---|---|---|
תינוקות במשקל לידה נמוך | פחות | יותר |
תינוקות במשקל לידה רגיל | שווה | שווה |
כלל התינוקות | יותר | פחות |
בייסבול
דוגמה מפורסמת לפרדוקס בוחנת את נתוני החבטות של שחקני בייסבול. ייתכן מצב בו שחקן אחד חובט בממוצע שנתי יותר משחקן שני במשך שנתיים ברצף אולם אם מאחדים בין השנים דווקא לשחקן השני יהיה ממוצע רב שנתי גבוה יותר. התופעה מתרחשת כאשר יש פער גדול בין כמות המשחקים בין השנים. דוגמה אמיתית לנתונים כאלה בוחנת את נתוני החבטות של דרק ג'יטר מול דייוויד ג'סטיס בשנים 1995/6:
1995 | 1996 | משולב | ||||
---|---|---|---|---|---|---|
דרק ג'יטר | 12/48 | 0.25 | 183/582 | 0.314 | 195/630 | 0.31 |
דייוויד ג'סטיס | 104/411 | 0.253 | 45/140 | 0.321 | 149/551 | 0.27 |
דוגמה עם כדורים
נניח כי יש בידינו ארבעה כובעים (שני שחורים ושני אפורים), 41 כדורים (23 אדומים ו-18 לבנים) ושני שולחנות (A ו- B). הכדורים מסודרים בכובעים באופן הבאה:
- בכובע השחור המונח על שולחן A נמצאים 5 כדורים אדומים ו-6 לבנים.
- בכובע האפור המונח על שולחן A נמצאים 3 כדורים אדומים ו-4 לבנים.
- בכובע השחור המונח על שולחן B נמצאים 6 כדורים אדומים ו-3 לבנים.
- בכובע האפור המונח על שולחן B נמצאים 9 כדורים אדומים ו-5 לבנים.
נניח ונרצה להוציא כדור אדום.
ההסתברות להוצאת כדור אדום מהכובעים הנמצאים על שולחן A:
- ההסתברות להוצאת כדור אדום מתוך הכובע השחור היא 0.4545 = 5/11 = 35/77.
- ההסתברות להוצאת כדור אדום מן הכובע האפור היא 0.4285 = 3/7 =33/77.
קיבלנו שההסתברות לכדור אדום גבוהה יותר בכובע השחור.
כעת נחשב את ההסתברות להוצאת כדור אדום מהכובעים הנמצאים על שולחן B:
- ההסתברות להוצאת כדור אדום מתוך הכובע השחור היא 0.6666 = 6/9 = 28/42.
- ההסתברות להוצאת כדור אדום מתוך הכובע האפור היא 0.6428 = 9/14 = 27/42.
כלומר קיבלנו שגם כאן הסיכויים לכדור אדום גבוהים יותר בכובע השחור.
ועכשיו נבדוק מה קורה אם נחבר את הכדורים בשני הכובעים השחורים זה עם זה ואת הכדורים בכובעים האפורים אחד עם השני:
- ההסתברות לקבלת כדור אדום מתוך הכובע השחור היא 0.55 = 11/20 = 231/420.
- ההסתברות לקבלת כדור אדום מתוך הכובע האפור היא 0.5714 = 12/21 = 240/420.
קיבלנו כי ההסתברות לקבלת כדור אדום גבוהה יותר בכובע האפור מאשר בכובע השחור.
לקריאה נוספת
- מריוס כהן, "פרדוקס סימפסון", גליליאו 107, יולי 2007 הפוך על הפוך.
קישורים חיצוניים
- יוסי לוי, The Simpson, באתר "נסיכת המדעים" (בעברית)
- How statistics can be misleading - Mark Liddell - סרטון אנימציה של 4 דקות המסביר את פרדוקס סימפסון.