פרדוקס יום ההולדת

מתוך המכלול, האנציקלופדיה היהודית
קפיצה לניווט קפיצה לחיפוש
ההסתברות לכך ששני אנשים בקבוצה נולדו באותו יום בשנה, כפונקציה של גודל הקבוצה

פרדוקס יום ההולדת הוא שמה של תוצאה בתורת ההסתברות לפיה בקבוצה של 23 אנשים או יותר, שנבחרו באקראי, הסיכוי לכך שלפחות שניים מהם נולדו באותו יום בשנה עולה על 50%. תוצאה זו אינה פרדוקס במובן המקובל של המילה, שכן אין בה סתירה לוגית, אך היא סותרת את האינטואיציה של מרבית האנשים, הסבורים כי ההסתברות תהיה קטנה בהרבה מחצי משום שמספר הימים שבהם אפשר להיוולד (365) גדול בהרבה מ-23.

תוצאה זו היא מקרה פרטי של עובדה כללית יותר, שיש לה חשיבות רבה ביישומים של תורת ההסתברות, ובפרט בהתקפת יום הולדת בקריפטוגרפיה: אם בוחרים ערכים בעלי סיכוי שווה מבין אפשרויות, אז החזרות הראשונות תופענה כבר כאשר מספר הערכים הוא מסדר גודל של .

פרדוקס יום ההולדת תואר לראשונה במאמר על ידי הסטטיסטיקאי ריצ'רד פון מיזס ב-1939, אם כי סביר להניח שגרסאות קודמות של הבעיה היו ידועות ונחקרו על ידי מתמטיקאים אחרים. הפרדוקס היה נושא למחקר ודיונים רבים בתחומי ההסתברות והסטטיסטיקה, ויש לו יישומים רבים במדעי המחשב, בקריפטוגרפיה ובתחומים נוספים.

תיאור התופעה

פרדוקס יום ההולדת עוסק בסדרה של מספרים המוגרלים בצורה אקראית מתוך טווח מסוים – במקרה של ימי הולדת, הטווח הוא המספרים השלמים מ-1 ועד 365. לשם הפשטות, אפשר להתעלם מקיומן של שנים מעוברות (כלומר, שיום הולדתו של אדם עשוי לחול ב-29 בפברואר). בניתוח התופעה נניח גם שההסתברות להיוולד שווה בכל הימים בשנה,[א] אך אי הדיוק רק מגדיל את הסיכוי ששני אנשים ייוולדו באותו יום. לבסוף, מניחים שתאריכי הלידה של האנשים שנבחרו בלתי תלויים זה בזה – הפרדוקס מאבד את עוקצו אם בין הנבחרים זוג תאומים.

כדי להבטיח שני אנשים שנולדו באותו יום, יש לבחור לפחות 367 אנשים – זהו עקרון שובך היונים. אולם, הדרישה הסטטיסטית להימנע מימי הולדת משותפים הולכת ומכבידה. בבחירה של 23 הסיכוי שכל ימי ההולדת שונים יורד ל-49.3%, בבחירה של 41 אנשים הסיכוי שכל ימי ההולדת שונים הוא 9.7%, וסיכוי זה יורד אל מתחת לאחוז אחד כאשר בוחרים 57 אנשים.

ניתוח מפורט

את תופעת יום ההולדת, או החֲזרה בבחירה מתוך מרחב גדול בעל התפלגות אחידה, אפשר לנתח משלוש זוויות שונות, המביאות, בקירוב, לאותה מסקנה. נניח שזורקים כדורים באקראי ל- תאים, שההסתברות ליפול לכל אחד מהם שווה.

מספר ההתנגשויות

אפשר להתייחס לכל זוג כדורים כאל ניסוי עצמאי. הסיכוי שזוג הכדורים ייפלו לאותו תא הוא בדיוק , ולכן, כשעוברים על פני כל הזוגות, התוחלת של מספר הזוגות שיפלו לאותו תא שווה ל- . כל עוד מספר הכדורים הוא קטן, התוחלת קטנה מ-1 ולכן אפשר להניח שלא תהיה אף התנגשות אחת. התוחלת של מספר ההתנגשויות עולה ל-1 כאשר .

ההסתברות לאי-חזרה

את התנאי לחוסר חזרה אפשר להבין כך: הכדור הראשון אינו מוגבל. הכדור השני יכול ליפול לאחד מבין תאים, כדי לא לפגוע בראשון; הסיכוי לכך בזריקה אקראית הוא . הכדור השלישי צריך ליפול לאחד מבין התאים שנותרו לאחר פסילת שני התאים הראשונים, והסיכוי לכך הוא ; וכן הלאה. לאחר שנזרקו כדורים שנכנסו כולם לתאים שונים, הסיכוי לכך שגם הכדור הבא ייפול לתא משלו הוא .

אם כך, ההסתברות לכך ש- הכדורים הראשונים יפלו לתאים שונים, ללא התנגשות, שווה למכפלה . כדי להעריך מספר זה, אפשר להיעזר בחסם (הנובע מפיתוח פונקציית האקספוננט לטור טיילור, ותקף לכל ). לפי חסם זה, , ובקירוב, . הסיכוי לאי-חזרה יורד לחצי, אם-כן, כאשר . ככל שהיחס גדול יותר כך הסיכוי לאי-חזרה קטן יותר, ובסימון אסימפטוטי: עבור ההסתברות לאי חזרה היא . מצד שני, לא קשה להראות שאם אז ההסתברות היא .

זמן ההמתנה להתנגשות הראשונה

נסמן ב- את המשתנה המקרי הסופר כמה כדורים נזרקו, באקראי, עד להתנגשות הראשונה. זהו משתנה העשוי לקבל כל ערך שלם מ- ועד . ידוע שהתוחלת של משתנה כזה שווה לסכום ההסתברויות , שאותו אפשר להעריך בעזרת אינטגרל מתאים. התוצאה מחישוב מדויק היא שכאשר גדול, תוחלת זמן ההמתנה עד להתנגשות הראשונה היא .

קישורים חיצוניים

ויקישיתוף מדיה וקבצים בנושא פרדוקס יום ההולדת בוויקישיתוף

ביאורים

  1. ^ למעשה, ההסתברות להיוולד אינה שווה בכל הימים בשנה. סיבה אחת למשל, היא שקיימות תקופות, כמו חופשות וחגים, שבהן קיים פנאי רב יותר, וסיכוי גדול יותר להרות. בהתאם קיימות תקופות שבהן הסיכוי להיוולד גדול יותר.
Logo hamichlol 3.png
הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0