התפלגות רב-נורמלית

מתוך המכלול, האנציקלופדיה היהודית
קפיצה לניווט קפיצה לחיפוש
התפלגות רב-נורמלית
פונקציית צפיפות ההסתברות
קובץ:MultivariateNormal.png
מאפיינים
פרמטרים μRk פרמטר מרכז
ΣRk × k מטריצת שונות משותפת מטריצה חיובית
תומך xRk
פונקציית צפיפות הסתברות
(pdf)
1(2π)n|Σ|e(12(𝐱μ)TΣ1(𝐱μ))
תוחלת μ
ערך שכיח μ
שונות  Σ
אנטרופיה k2log(2πe)+12log|Σ|
פונקציה יוצרת מומנטים
(mgf)
exp(μT𝐭+12𝐭TΣ𝐭)
פונקציה אופיינית exp(iμT𝐭12𝐭TΣ𝐭)

בתורת ההסתברות, התפלגות רב-נורמלית, או התפלגות גאוסיאנית רב-ממדיתאנגלית: Multivariate normal distribution) היא הכללה של התפלגות נורמלית למשתנים מקריים רב-ממדיים. היא מוגדרת בתור וקטור משתנים מקריים, שכל צירוף ליניארי שלו מתפלג נורמלית. ישנה גם הגדרה (כללית יותר) בשפה של פונקציות אופייניות (הקובעת את המשתנה).

להתפלגות רב-נורמלית מספר שימושים, כגון הוכחת טענות על התפלגות הממוצע וסטיית התקן של משתנים מקריים שווי התפלגות נורמלית; טענות אלו שימושיות במיוחד בסטטיסטיקה. ניתן גם לנסח את משפט הגבול המרכזי בגרסה רב-ממדית בעזרת התפלגות רב-נורמלית.

הגדרה

יהי X=(X1,,Xn) וקטור משתנים מקריים ממשיים. נאמר ש-X מתפלג רב-נורמלית (או גאוסיאנית) אם לכל a1,,an המשתנה המקרי (החד־ממדי) a¯,X¯=a1X1++anXn מתפלג נורמלית, כלומר קיימים μ,σ (תלויים ב-ai) כך ש-a¯,X¯N(μ,σ2).

אם X משתנה רב-נורמלי, מסמנים XN(μ¯,Σ). μ¯ הוא וקטור התוחלות, כלומר

μ=E[𝐗]=(E[X1],E[X2],,E[Xk])T

ו-Σ היא מטריצת השונות משותפת

Σi,j=E[(Xiμi)(Xjμj)]=Cov[Xi,Xj]

כאשר 1i,jk.

תכונות

הפונקציה האופיינית

ניתן לאפיין את המשתנים המקריים הגאוסיאניים בעזרת הפונקציה האופיינית שלהם: וקטור משתנים מקריים הוא גאוסיאני אם ורק אם הוא בעל פונקציה אופיינית:

φ𝐗(𝐮)=exp(i𝐮Tμ12𝐮TΣ𝐮). כאשר מטריצה השונות Σ היא חיובית.

בפרט, נובע שהמשתנים המקריים בלתי מתואמים אם ורק אם הם בלתי תלויים (מה שאינו נכון באופן כללי).

לכסון

לכל משתנה מקרי רב-נורמלי X קיימים משתנה מקרי Y ומטריצה אורתוגונלית A כך ש-X=μ¯+YA, כאשר YiN(0,λi) ו-λi הם הערכים עצמיים של Σ (מטריצת השונויות המשותפות).

בכיוון ההפוך, לכל משתנה מקרי רב-נורמלי X ולכל מטריצה אורתוגונלית A, המשתנה המקרי AX גם הוא רב נורמלי: YN(Aμ,Σ).

כדי להוכיח משפט זה, יש להפעיל לכסון אורתוגונלי על Σ (בפרט, המטריצה A נבחרת להיות המטריצה המלכסנת).

פונקציית צפיפות

כאשר מטריצת השונות Σ איננה מטריצה סינגולרית - כלומר כל ערכיה העצמיים λi שונים מאפס, למשתנה הרב-נורמלי יש פונקציית צפיפות, הנתונה על ידי הנוסחא:

fX(x¯)=1(2π)n|Σ|e12(x¯μ¯)TΣ1(x¯μ¯)

כאשר |Σ|=det(Σ) מסמן את הדטרמיננטה של Σ.

התפלגויות שוליות

למציאת ההתפלגות השולית של משתנים מקריים המתפלגים רב-נורמלית, מספיק להשמיט את המשתנים הלא-רלוונטיים (המשתנים שיש לבצע עליהם אינטגרציה) מווקטור התוחלת μ וממטריצת השונות Σ. ההוכחה לכך נובעת מההגדרה של ההתפלגות הרב-נורמלית ומאלגברה ליניארית.[1]

דוגמה

יהי 𝐗=[X1,X2,X3] ווקטור מקרי רב-נורמלי עם ווקטור תוחלת μ=[μ1,μ2,μ3] ומטריצת שונות Σ. ההתפלגות השולית של 𝐗=[X1,X3] היא התפלגות רב-נורמלית עם וקטור תוחלת μ=[μ1,μ3] ומטריצת שונות Σ=[Σ11Σ13Σ31Σ33].

התפלגות רב-נורמלית סינגולרית

בדרך כלל מניחים כי מטריצת השונויות Σ איננה מטריצה סינגולרית. כאמור, במקרה זה למשתנה הרב-נורמלי יש פונקציית צפיפות.

עם זאת, כאשר מורידים את ההנחה האחרונה (כלומר, יש ערכים עצמיים אפס), מתקבל משתנה מקרי רב-נורמלי סינגולרי. ההגדרה בעזרת הפונקציה האופיינית היא כללית יותר (כלומר, תקפה גם במקרה הסינגולרי). במקרה זה אין פונקציית צפיפות (ביחס למידת לבג) - ערכיה של פונקציית הצפיפות ייקבעו על ידי פחות מ-n משתנים, ואינטגרל של פונקציה כזו הוא אפס ולא 1, כנדרש מפונקציית צפיפות.

בכל זאת, ניתן להגדיר מידות אחרות (על תת-מרחב rank(Σ)-ממדי של n) ואז מוגדרת פונקציית צפיפות עבור משתנה מקרי ביחס למידה החדשה.

יישומים

אם X1,X2, משתנים מקריים בלתי תלויים המתפלגים N(0,1), נסמן X¯n=X1++Xnn ו-Sn=1n1i=1n(XiX¯n)2. אז מתקיים:

X¯n/Snntn1, כלומר מתפלג סטודנט עם n1 דרגות חופש.

קישורים חיצוניים

הערות שוליים

הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0

התפלגות רב-נורמלית39995592Q1149000