פונקציית נראות

מתוך המכלול, האנציקלופדיה היהודית
(הופנה מהדף נראות (סטטיסטיקה))
קפיצה לניווט קפיצה לחיפוש

בסטטיסטיקה, פונקציית הנראות (או באופן פשוט הנראות) היא פונקציה של הפרמטרים של מודל סטטיסטי('אנ) אשר תלויה בנתונים. הנראות של קבוצת ערכי פרמטרים, ɵ, בהינתן קבוצת תצפיות X, שווה להסתברות המשותפת של אותן תצפיות בהינתן ערכי קבוצת הפרמטרים. כלומר, .

פונקציות נראות משחקות תפקיד מפתח בהסקה סטטיסטית, במיוחד בשיטות שמבצעות אמידה של פרמטר מתוך קבוצה של סטטיסטים. בהקשרים לא פורמליים, משתמשים לרוב במילה "נראות" בתור מילה נרדפת ל"הסתברות". אבל בשימוש סטטיסטי, ישנה הבחנה על פי התפקידים של התצפיות או של הפרמטרים שאותם אומדים. המילה הסתברות באה לידי ביטוי כאשר מתארים פונקציה של התצפיות בהינתן פרמטר שנקבע מראש. לדוגמה, אם מטילים מטבע הוגן 10 פעמים, מה ההסתברות שיצא עץ בכל ההטלות? לעומת זאת, במילה נראות משתמשים כאשר מתארים פונקציה של פרמטר נתון בהינתן אוסף תצפיות. לדוגמה, אם הטלנו מטבע 10 פעמים ויצא לנו בכל ההטלות עץ, מהי הנראות (או הסבירות) שהמטבע הוא הוגן?

הגדרה

פונקציית הנראות מוגדרת באופן שונה עבור מרחב הסתברות בדיד ועבור מרחב הסתברות רציף.

מרחב הסתברות בדיד

יהי משתנה מקרי במרחב הסתברות בדיד עם פונקציית הסתברות המותנה בפרמטר אותו אנו רוצים לאמוד . אז הפונקציה:


היא פונקציה של , ונקראת פונקציית הנראות של בהינתן אוסף נתונים שמתקבל על ידי המשתנה המקרי X. לפעמים, ההסתברות של הערך x שמקבל X עבור הפרמטר נכתבת ; לעיתים קרובות נרשום לומר שערך זה הוא אינו הסתברות מותנית, כיוון ש- הוא פרמטר ולא משתנה מקרי.

מרחב הסתברות רציף

יהי משתנה מקרי במרחב הסתברות רציף עם פונקציית צפיפות המותנה בפרמטר אותו אנו רוצים לאמוד . אז הפונקציה:


היא פונקציה של , ונקראת פונקציית הנראות של בהינתן אוסף נתונים שמתקבל על ידי המשתנה המקרי X. לפעמים, פונקציית הצפיפות של ערך x מתוך X מסומנת על ידי אבל לא אמורה להיחשב כפונקציית צפיפות מותנית.

לוג נראות

עבור יישומים רבים, הלוגריתם הטבעי של פונקציית הנראות הנקרא "לוג–נראות", יותר נוחה לעבודה. פונקציית הלוגריתם היא פונקציה מונוטונית עולה, ולכן הלוגריתם של פונקציה מקבל ערך מקסימלי באותן נקודות כשל הפונקציה עצמה, ולכן הלוג-נראות יכולה לשמש (ואף קלה יותר לשימוש) במקום נראות באמידת נראות מקסימלית ובטכניקות דומות. מציאת מקסימום של פונקציה לרוב כרוך בלקיחת הנגזרת של פונקציה ופתרון עבור מקסום הפרמטר, במקרים רבים זה קל יותר כשהפונקציה שממקסמים היא לוג-נראות מאשר פונקציית הנראות המקורית.

לדוגמה, פונקציות נראות מסוימות הן עבור הפרמטרים המסבירים אוסף של תצפיות בלתי תלויות הסתברותית. במקרה זה, פונקציית הנראות מסתכמת למכפלה של פונקציות נראות אינדיבידואליות. לוגריתם של המכפלה הזאת הוא סכום של לוגריתמים של הפונקציות הנפרדות, והנגזרת של סכום היא במקרים רבים קלה יותר לחישוב מנגזרת של מכפלה. בנוסף, למספר התפלגויות נפוצות יש פונקציית נראות המכילה מכפלה של גורמים המכילים אקספוננטים. לוגריתם של פונקציה כזו, הוא סכום של מכפלות, ושוב קל יותר לגזירה מאשר הפונקציה המקורית.

בפילוגנטיקה, יחס הלוג-נראות לעיתים נקרא "תומך" ופונקציית לוג-נראות נקראת "פונקציית התומך". לעומת זאת, לאור פוטנציאל הבלבול הגבוה עם המשמעות המתמטית של תמיכה, טרמינולוגיה זו לרוב לא בשימוש בתחום זה.

היסטוריה

הנראות מנסה לכמת את הסתברותו של "משהו" בהינתן התצפיות של אותו "משהו" ללא מידע נוסף על ההתפלגות ממנה נדגם (או על הפרמטר שלה). כקונספט פורמלי, הנראות הופיעה בתורת המשפט, במסחר ובסכולסטיקה זמן רב לפני שהונחו היסודות המתמטיים שלה. באנגלית, למושג "נראות" יש אמנם קשר ל"הסתברות", אם כי היחס אליה, בגלל אותם שימושים מוקדמים, הוא כ"נחותה" יותר. מבחני השערות לפי נראות היו נפוצים במשך מאות שנים, ודוגמאות לכך ניתן למצוא עוד במאה ה-17.

בבריטניה, המושג הפך לפופולרי בעזרתו של רונלד פישר, בעקבות ספרו "על היסודות המתמטיים של התאוריה הסטטיסטית" מ-1922.[1] בספר זה הוצגה לעולם גם שיטת הנראות המקסימלית, ובכך קיבע פישר את מעמדה של השיטה עד היום.

הערות שוליים

  1. ^ Fisher, Ronald Aylmer (1922). "018: On the Mathematical Foundations of Theoretical Statistics". Philosophical Transactions of the Royal Society, A. 222: 309–368.