לדלג לתוכן

משפט לה קם

מתוך המכלול, האנציקלופדיה היהודית

בתורת ההסתברות, משפט לה קם (Le Cam's theorem) עוסק בקירוב של סכום משתנים מקריים בלתי תלויים בעלי התפלגות ברנולי באמצעות התפלגות פואסון. תחת תנאים מסוימים, המשפט לא רק מציין שיש קירוב בין שתי ההתפלגויות, אלא גם מספק חסם מפורש ל"מרחק" בין התפלגויות אלו. חישוב החסם, שהוא חישוב פשוט, מראה כי המרחק בין ההתפלגויות הללו שואף לאפס כאשר מספר המשתנים גדל, במיוחד כאשר ההסתברויות להצלחה של המשתנים קטנות. בכך, משפט לה קם מעניק כלי כמותי המאפשר להעריך מתי ניתן להחליף חישובים מסובכים המבוססים על סכום משתנים מקריים ברנוליים, בחישוב פשוט בהרבה על ידי התפלגות פואסון המתאימה.[1][2][3]

המשפט נקרא על שמו של לוסיאן לה קם (אנ'), אשר פרסם את התוצאה בשנת 1960.

ניסוח המשפט

תהי סדרת משתנים מקריים X1,...Xn בלתי תלויים המקיימים את התנאים הבאים:

אז .k=0|Pr(Sn=k)λnkeλnk!|<2(i=1npi2)

במילים אחרות, הסכום Sn מקורב בהתפלגותו להתפלגות פואסון, ואי-השוויון לעיל מספק חסם לשגיאת הקירוב במונחי מרחק השונות הכוללת (אנ'). מרחק השונות הכוללת מבטא את הכמות המרבית של מסה הסתברותית שיש להעביר מהתפלגות אחת לאחרת כדי להפוך אותן לזהות. ערך זה נע בין 0 ל-1, כאשר 0 מציין זהות מוחלטת בין ההתפלגויות ו-1 מציין שהן אינן חופפות כלל. למעשה, מרחק זה מספק מדד כמותי להערכת איכות הקירוב של התפלגות אחת לאחרת.

כאשר λn גדול, ניתן לקבל חסם טוב יותר: k=0|Pr(Sn=k)λnkeλnk!|<2(11λn)(i=1npi2), כאשר מייצג את אופרטור המינימום[4].

ההבדל ממשפט הגבול המרכזי

משפט לה קם ומשפט הגבול המרכזי (CLT) עוסקים שניהם בקירוב של התפלגויות, אך יש ביניהם הבדלים מהותיים.

משפט הגבול המרכזי קובע כי סכום של משתנים מקריים בלתי תלויים וזהים בסוג התפלגותם (אך לאו דווקא בעלי אותם תוחלת ושונות), מתכנס בהתפלגות להתפלגות הנורמלית הסטנדרטית, כאשר מספר המשתנים המקריים שואף לאינסוף. משפט הגבול המרכזי מתאים במיוחד למקרים שבהם לכל משתנה יש השפעה זניחה על הסכום הכולל.

משפט לה קם, לעומת זאת, מתמקד בקירוב של סכום של משתנים מקריים ברנוליים בלתי תלויים באמצעות התפלגות פואסון. המשפט מספק חסם מדויק על שגיאת הקירוב במדד של מרחק השונות הכולל, ואינו מדבר על התכנסות של התפלגות אחת לאחרת. הקירוב של לה קם רלוונטי למצבים בהם כל משתנה ברנולי מייצג אירוע יחסית נדיר, אך מספר האירועים האפשריים גדול.

ההבדל ממשפט הגבול של פואסון

משפט הגבול של פואסון, הידוע גם בשם ״חוק האירועים הנדירים״, קובע שהתפלגות פואסון מתארת את מספר הפעמים שאירוע נדיר מתרחש בתהליך המורכב ממספר רב של ניסיונות בלתי תלויים, כאשר ההסתברות להצלחה בכל ניסוי בודד היא קטנה. למעשה, עבור סדרת משתנים מקריים X1,...Xn בלתי תלויים המקיימים את התנאים הבאים:

  • X1,...Xn מפולגים ברנולי עם P(Xi=1)=pi עבור i=1,...,n
  • pn[0,1] היא סדרת מספרים ממשיים המקיימת npnλ כאשר n שואף לאינסוף
  • Sn=X1++Xn

מתקיים ש Sn שואף בהתפלגות למשתנה מקרי פואסון עם פרמטר λ. בעוד שמשפט הגבול של פואסון מדבר על התכנסות בהתפלגות, משפט לה קם מוצא חסם לשגיאת הקירוב. כלומר, אם מעבר לידיעה של התכנסות בהתפלגות אנו מעוניינים בחסם לשגיאת הקירוב, הרי שמשפט לה קם מספק לנו אותו.

במשפט לה קם, על ידי הצבת pi=λnn נקבל את התנאים של משפט הגבול של פואסון. כלומר, משפט הגבול של פואסון הוא מקרה פרטי של משפט לה קם.

דוגמאות ליישום המשפט

הערכת מספר הפגמים ביצור באמצעות משפט לה קם (הסתברויות זהות)

דוגמה לשימוש במשפט לה קם היא בהערכת מספר טעויות או פגמים בייצור. נניח את המודל הבא: ישנו תהליך ייצור שבו כל פריט שמיוצר יכול להיות פגום בהסתברות קטנה. נניח שמיוצרים n פריטים.

  • כל פריט הוא משתנה מקרי המסומן ב Xi כאשר i=1,...,n
  • כל פריט יכול להיות פגום בהסתברות 1n. כלומר, לכל פריט מתקיים P(Xi=1)=1n זו ההסתברות להצלחה (״הצלחה״=פגם ביצור)
  • Sn=iXi מסמן את מספר הפגמים הכולל ב-n פריטים בתהליך יצור מסוים.

מעוניינים להעריך את ההתפלגות של Sn כאשר n גדול מאוד. על פי משפט לה קם, במקרה הזה, כאשר מספר הפריטים n גדל מאוד, ההתפלגות של מספר הפגמים Sn מתקרבת להתפלגות פואסון עם פרמטר λ=1. כלומר, מספר הפגמים מתוך n פריטים, כאשר n גדול מאוד, יתפלג בקירוב לפי פואסון עם פרמטר λ=1, והמרחק בין ההתפלגות האמיתית לפואסון יהיה קטן מאוד (בהתאם למרחק השונות הכוללת). באמצעות הקירוב הזה, ניתן להעריך את הסיכוי למספר מסוים של פגמים בתהליך, ולתכנן מראש את הצעדים הנדרשים כדי לשפר את איכות המוצרים.

הערכת מספר קריאות החירום בפסטיבל (הסתברויות שונות)

נניח שבמהלך אירוע גדול כמו פסטיבל עירוני ניתן לדווח על בעיה (כמו עומס, אובדן חפצים, עימותים קטנים וכו') באמצעות אפליקציה ייעודית. לכל אחד מ־100 האזורים בפסטיבל (מתחם הופעות, דוכני מזון, שירותים, כניסות וכו') מוצב עובד שמתצפת ומחליט האם לשלוח דיווח על בעיה באזורו.

מכיוון שרוב הזמן העניינים מתנהלים כשורה, ההסתברות שכל אחד מהעובדים ידווח על תקלה כלשהי ביום נתון היא קטנה – אך היא שונה מאזור לאזור: במתחם ההופעות הסיכוי גבוה יותר (נגיד 5%), ואילו באזורים פחות עמוסים כמו מתחמי מנוחה ההסתברות נמוכה מאוד (נגיד 0.1%).

באמצעות קוד מחשב פשוט הוגרלו 100 הסתברויות שונות בתחום (0.001,0.05). חישוב סכום ההסתברויות נתן λ=2.56, וחסם לה קם המחושב עבורן הוא 0.16. ערך אגף שמאל של אי־השוויון (מרחק השונות הכוללת בין ההתפלגות הבינומית לפואסון) נמצא כ־0.006. כלומר, משפט לה קם מתקיים בדוגמה זו, ואף מעבר לכך – ההפרש בין ההתפלגויות זניח. הדבר ממחיש שבמקום לחשב באמצעות קוד את ההסתברות לקבל k קריאות ביום, ניתן להשתמש בקירוב האנליטי הפשוט של התפלגות פואסון (כלומר בפונקציית ההסתברות של מ"מ פואסון עבור λ=2.56), ולקבל תוצאה קרובה מאוד לערך המדויק שהיה מתקבל מההתפלגות הבינומית.

הצגה גרפית של המשפט

מרחק השונות הכוללת וערך החסם כפונקציה של n.
מרחק השונות הכוללת וחסם לה קם כפונקציה של n, בסקאלה לוגריתמית.

בגרפים המצורפים ניתן להבחין בשני מאפיינים בולטים ככל שמספר המשתנים המקריים גדל: ראשית, מרחק השונות הכוללת שואף לאפס. שנית, החסם על מרחק זה נעשה הדוק יותר. המגמה הראשונה אינה מפתיעה — ככל שמספר המשתנים המקריים גדל, ההתפלגויות מתקרבות זו לזו, כמצופה ממשפט הגבול של פואסון. גם המגמה השנייה צפויה: מבחינה מתמטית, ככל ש־n גדל, ערך החסם (2n) קטן, כך שהפער המקסימלי המובטח בין ההתפלגויות מצטמצם. מבחינה רעיונית, משפט לה קם יעיל במיוחד כאשר ערכו של p קטן; מאחר ש־p קטן ככל ש־n גדל, מתקבל חסם משופר וקירוב טוב יותר בין התפלגות הסכום והתפלגות פואסון. בהתאם לאופיין של טענות הסתברותיות, ככל שמספר המשתנים המקריים גדל — כך חוזקה של הטענה מתעצם.

ראו גם

קישורים חיצוניים

הערות שוליים

  1. Le Cam, L. (1960). "An Approximation Theorem for the Poisson Binomial Distribution". Pacific Journal of Mathematics. 10 (4): 1181–1197. doi:10.2140/pjm.1960.10.1181. MR 0142174. Zbl 0118.33601. נבדק ב-2009-05-13.
  2. Le Cam, L. (1963). "On the Distribution of Sums of Independent Random Variables". In Jerzy Neyman; Lucien le Cam (eds.). Bernoulli, Bayes, Laplace: Proceedings of an International Research Seminar. New York: Springer-Verlag. pp. 179–202. MR 0199871.
  3. Steele, J. M. (1994). "Le Cam's Inequality and Poisson Approximations". The American Mathematical Monthly. 101 (1): 48–54. doi:10.2307/2325124. JSTOR 2325124.
  4. den Hollander, Frank. Probability Theory: the Coupling Method.

משפט לה קם42139077Q3154003