התפלגות רב-נורמלית

מתוך המכלול, האנציקלופדיה היהודית
קפיצה לניווט קפיצה לחיפוש

בתורת ההסתברות, התפלגות רב-נורמלית, או התפלגות גאוסיאנית רב-ממדית, (באנגלית: Multivariate normal distribution) היא הכללה של התפלגות נורמלית למשתנים מקריים רב-ממדיים. היא מוגדרת בתור וקטור משתנים מקריים, שכל צירוף לינארי שלו מתפלג נורמלית. ישנה גם הגדרה (כללית יותר) בשפה של פונקציות אופייניות (הקובעת את המשתנה).

להתפלגות רב-נורמלית מספר שימושים, כגון הוכחת טענות על התפלגות הממוצע וסטיית התקן של משתנים מקריים שווי התפלגות נורמלית; טענות אלו שימושיות במיוחד בסטטיסטיקה. ניתן גם לנסח את משפט הגבול המרכזי בגרסה רב-ממדית בעזרת התפלגות רב-נורמלית.

הגדרה

יהי X=(X1,,Xn) וקטור משתנים מקריים ממשיים. נאמר ש-X מתפלג רב-נורמלית (או גאוסיאנית) אם לכל a1,,an המשתנה המקרי (החד ממדי) a¯,X¯=a1X1++anXn מתפלג נורמלית, כלומר קיימים μ,σ (תלויים ב-ai) כך ש-a¯,X¯N(μ,σ2).

אם X משתנה רב-נורמלי, מסמנים XN(μ¯,V) כאשר μ¯ הוא וקטור התוחלות, ו-V היא מטריצת השונויות המשותפות - Vi,j=Cov(Xi,Xj)

תכונות

הפונקציה האופיינית

ניתן לאפיין את המשתנים המקריים הגאוסיאניים על בעזרת הפונקציה האופיינית שלהם: וקטור משתנים מקריים הוא גאוסיאני אם ורק אם הוא בעל פונקציה אופיינית:

φX(a¯)=eiμ¯,a¯12a¯Va¯t

מטריצה השונויות V היא חיובית.

בפרט, נובע שהמשתנים המקריים בלתי מתואמים אם ורק אם הם בלתי תלויים (מה שלא נכון באופן כללי).

לכסון

לכל משתנה מקרי רב-נורמלי X קיימים משתנה מקרי Y ומטריצה אורתוגונלית A כך ש-X=μ¯+YA, כאשר YiN(0,λi) ו-λi הם הערכים עצמיים של V (מטריצת השונויות המשותפות).

בכיוון ההפוך, לכל משתנה מקרי רב-נורמלי X ולכל מטריצה אורתוגונלית A, המשתנה המקרי AX גם הוא רב נורמלי: YN(Aμ,V).

כדי להוכיח משפט זה, יש להפעיל לכסון אורתוגונלי על V (בפרט, המטריצה A נבחרת להיות המטריצה המלכסנת).

פונקציית צפיפות

כאשר מטריצת השונויות V איננה מטריצה סינגולרית - כלומר כל ערכיה העצמיים λi שונים מאפס, למשתנה הרב-נורמלי יש פונקציית צפיפות, הנתונה על ידי הנוסחא:

fX(x¯)=1(2π)n|V|e12(x¯μ¯)V1(x¯μ¯)t

התפלגות רב-נורמלית סינגולרית

בדרך כלל מניחים כי מטריצת השונויות V איננה מטריצה סינגולרית. כאמור, במקרה זה למשתנה הרב-נורמלי יש פונקציית צפיפות.

עם זאת, כאשר מורידים את ההנחה האחרונה (כלומר, יש ערכים עצמיים אפס), מתקבל משתנה מקרי רב-נורמלי סינגולרי. ההגדרה בעזרת הפונקציה האופיינית היא כללית יותר (כלומר, תקפה גם במקרה הסינגולרי). במקרה זה אין פונקציית צפיפות (ביחס למידת לבג) - ערכיה כל פונקציית צפיפות ייקבעו על ידי פחות מ-n משתנים, ואינטגרל של פונקציה כזו הוא אפס ולא 1, כנדרש מפונקציית צפיפות.

בכל זאת, ניתן להגדיר מידות אחרות (על תת-מרחב rank(V)-ממדי של n) ואז מוגדרת פונקציית צפיפות עבור משתנה מקרי ביחס למידה החדשה.

יישומים

בעזרת התפלגות רב-נורמלית, ניתן להוכיח תוצאות חשובות בסטטיסטיקה.

למשל, אם X1,X2, משתנים מקריים בלתי תלויים המתפלגים N(0,1), נסמן X¯n=X1++Xnn ו-Sn=1n1i=1n(XiX¯n2). אז מתקיים X¯n/Snntn1, כלומר מתפלג סטודנט עם n1 דרגות.