לדלג לתוכן

התפלגות וישארט

מתוך המכלול, האנציקלופדיה היהודית
התפלגות וישארט
מאפיינים
פרמטרים n,p,H
תומך מטריצות סימטריות וחיוביות למחצה עם דרגת חופש n>p-1
תוחלת nH
שונות Var(Wij)=n(Hij2+HiiHjj)

בתורת תורת ההסתברות וסטטיסטיקה, התפלגות וישארט היא הכללה של התפלגות גמא למספר ממדים.

ההתפלגות נקראת על שמו של המתטיקאי ג'ון וישארט (John Wishart), שהשתמש בה לראשונה ב־1928

זוהיא משפחה של התפלגויות המוגדרת על מטריצות אקראיות, סימטריות וחיוביות למחצה עם שימושים רבים בהסקה בייסיאנית. וסטטיסטיקה במשתנים מרובים.[1]

התפלגות וישארט התגלתה במחקר אנתרופומטרי, אשר מטריצות שונות משותפת בממדים גבוהים, בעלת חשיבות משמעותית.

רקע

התפלגות וישארט היא התפלגות הסתברות בסיסית בסטטיסטיקה רב-ממדית. זוהי הכללה רב-ממדית של התפלגות כי-בריבוע, והיא מופיעה באופן טבעי כהתפלגות של מטריצות שונות משותפות (covariance matrices) של דגימות מהתפלגות נורמלית רב-ממדית. ההתפלגות הוצגה לראשונה בשנת 1928 על ידי המתמטיקאי הבריטי ג'ון וישארט במסגרת מחקריו על מטריצות רב ממידיותת והכללת התפלגות כי.

להתפלגות וישארט תפקיד תאורטי מרכזי בתורת המטריצות המקריות, הסקה בייסיאניתת וניתוח סטטיסטי מרובה משתנים. בנוסף התפלגות וישארט היא בעלת שימושים פרקטיים רבים בתחומי של למידת מכונה וכן במכניקת הקוונטים.

הגדרה

יהיו X1....Xn משתנים p×1 בעלי התפלגות רב-נורמלית בת"ל עם תוחלת 0 ומטריצת שונויות H כאשר pn נגדיר:

W=i=1nXiXiT

ונאמר כי ל W התפלגות וישארט עם פרטרים p,n,H כאשר n ייקרא דרגות חופש ב- W

פונקציית צפיפות ההתפלגות:

f(W)=12np/2Γp(n2)|H|n/2|W|(np1)/2exp[12tr(H1W)], כאשר |*| אופרטור הדטרמיננטה וכמו כן Γp היא פונקציית גמא הרב ממדית כאשר המטריצה W, סימטרית וחיובית למחצה, וכמו כן פונקציית גמא הרב-ממדית מכלילה את פונקציית גמא החד-ממדית ובעלת אינטגרל מנורמל ל-1.[2]

מההגדרה השנייה נובע כי לכל מטריצה חיובית למחצה W דרגת חופש np ניתן ליצור התפלגות וישארט, וזאת ללא שימוש במשתנים רב נורמליים, וניתן להכליל ולבחור n שאינו שלם, ובתנאי שnp (ובתנאי שאינה קטנה מדרגת המטריצה).

תומך

התפלגות וישארט נתמכת ומוגדרת על כל המטריצות W בגודל p×p סימטריות וחיובית למחצה. ניתן לכתוב W=XXT כאשר X בגודל p×n עבור n דרגת החופש. כאשר np המטריצה W הפיכות כמעט תמיד, וכאשר דרגת החופש n<p המטריצה W כמעט תמיד סינגולרית (קרי אינה הפיכה) ובמקרה זה נאמר כי המטריצה "מתפלגת וישארט סינגולרית".

תכונות

תוחלת:

𝔼[W]=nH

𝔼[W]=𝔼[i=1nXiXiT]=i=1n𝔼[XiXiT]=i=1n(Var[Xi]+𝔼[Xi]𝔼[Xi]T)=i=1nVar[Xi](Since 𝔼[Xi]=0)=i=1n H=nH

התפלגות שולית:

עבור מטריצה W מסדר p×p, תת-המטריצה W מסדר kp המורכבת מבלוק של k השורות והעמודות הראשונות של W, יוצרת מטריצה בעלת התפלגות וישארט, תכונה חשובה זאת עוזרת לנתח התנהות וקירוב בממדים גבוהים.

שונות משותפת:

Cov(Wij,Wkl)=n(HikHjl+HilHjk):

הוכחה חלקית:

Wij=r=1nxrixrj ולכן Cov(Wij,Wkl)=Cov(r=1nxrixrj,s=1nxskxsl), ואם כך עבור rs,נקבל 0. על ידי שימוש בנוסחת איזרלה (לחישוב מומנטים של התפלגות רב נורמלית) מקבלים את הנוסחה (משתמשים בכך שהמשתנים בעלי תוחלת 0)

מסקנה: שונות:

Var(Wij)=n(Hij2+HiiHjj)

פונקציה אופיינית (כפונקציה של p×p):

𝔼[exp(itr(𝐖V))]=|I2iV𝐇|n/2, כאשר המטריצה V מסדר p×p

אנטרופיה: האנטרופיה של משתנה W : H[𝐖]=ln(B(𝐇,n))np12E[ln|𝐖|]+np2

ערכים עצמיים

ערכים עצמיים של מטריצה בעלת התפלגות וישארט מהווים חלק מרכזי בהבנת ההתהנגות של מטריצת שונויות נדגמת (אנ'), במיוחד בממדים גבוהים ובמקרה בו מספר המשתנים עולה על מספר הדגימות (np), דבר אשר מתרחש בתחומים רבים כמו פיננסים, ניתוח גנטי ולמידת מכונה.

עבור מטריצה X מסדר m×n עם כניסות בת"ל ושווי התפלגות עם תוחלת 0 ושנות σ2 נגדיר את מטריצת השונויות הנדגמת בתור: Yn=1nXXT, אזי אם m/na, קבוע חיובית אזי ההתפלגות הספקטרלית האמפירית מתכנסת כמעט תמיד להתפלגות מרצ'נקו-פסטור, אשר נתמכת על הקטע ברדיוס a סביב 0.

שימושים

שוק ההון ומסחר:

נניח כי לחברה 500 מניות (p=500), בשנה עם n ימי מסחר. נכניס נתונים אלו למטריצת המסחר X מסדר n×p, כאשר אנו מניחים אי תלות בין הכניסות והתפלגות נורמלית (כלומר אנו מניחים התפלגות נורמלית רב - ממדית), כאשר כל שורה מייצגת יום מסחר בשנת המסחר וכל עמודה מייצגת את אחד מנכסי החברה (מנייה). היות שההתפלגות עצמה אינה יודעה, התוחלת μ, השונות σ, ומטריצת השונות המשותפת Σ אינן ידועות.

נשתמש במטריצת השונויות הנדגמת (קירוב מדיד של מטריצת השונויות האמיתית) Y, אשר תחת ההנחות שלנו (התפלגות רב נורמלית) מתפלגת התפלגות וישארט Wp(n,S), אם כך הערכים העצמיים של המטריצה Y משקפים כמה שונות קיימת ברכיבים העיקריים של החזר הערך מהנכסים.

במקרה זה הערכים העצמיים אינם דטרמינסטיים אלא מתפלגים אקראית (לפי התפלגות מנצנסקו-פסטור) ותלויים בערכים האמיתיים (p,n,Σ), מחוק המספרים הגדולים כאשר n>>p, הקירוב טוב דיו לשימוש פרקטי, לעומת זאת במקרה בו np, המדידות רועשות למדי ויש להשתמש בכלים הסתברותיים של ניתוח רב-ממדי.

חוק MP מתאר את התפלגות הערכים העצמיים כאשר היחס בין כמות המשתנים למספר הדגימות מתכנס לקבוע, בתהליך הפיננסי שתואר, משתמשים בעובדה זאת כדי לסנן מידע מרעשים, באופן ספציפי הערכיים העצמיים הקרובים או שייכים לתומך המתקבל מחוק MP ייחשבו כרעשים ואלו שמחוצה לו ייחשבו בעלי חשיבות והשפעה סטטיסטית.[3][4]

הסקה בייסיאנית:

התפלגות וישארט והתפלגות וישארט הפוכה, חשובים בהסקה בייסיאנית עקב קשריהן להתפלגות הרב נורמלית (אותה אנו מניחים שיש לדגימות), שכן לאחר הוספת המידע (הסקה בייסאנית), ההתפלגות נשארת וישארט/וישארט הפוכה בהתאמה ועל כן מקלה על חישובים חדשים, וכן ניתן להשתמש בידע ותכונות ידועות מוקדמות של התפלגויות אלו.

פורמלית: עבור מטריצה Wp(n,H), עם התפלגות וישארט/וישארט הפוכה ומידע מ-k דגימות D ומטריצת שוניות נדגמת S, אזי 𝐖𝒟Wp(H+kS,n+k)[5]

קשרים להתפלגויות נוספות

התפלגות וישארט מהווה הכללה של מספר משתנים מקריים למספר ממדים גבוה, ובעלת קשר הדוק למשתנים מקריים חשובים נוספים כמו:

1.התפלגות כי בריבוע (כאשר p=1), כמו כן העקבה של מטריצה המתפלגת וישארט היא סכום של משתנים מקריים בעלי התפלגות כי בריבוע.

2. התפלגות נורמלית מטריציונית (אנ') (בעזרת כפלה וסכום ניתן לייצר את תפלגות וישארט)

3. תפלגות וישארט ההפוכה (ההתפלגות ההופכית כמעט תמיד כאשר אנו לוקחים את המטריצה ההופכית)

התפלגות וישארט הפוכה: מטריצה R מסדר p×p, עם דרגת חופש n ומטריצה K, אם R𝟏𝒲p(n,K𝟏) תיקרא בעלת התפלגות וישארט הפוכה

4.התפלגות מרצ'נקו-פסטור (כמתארת תכונות ספקטרליות ואת הערכים העצמיים אם קיימים בממדים גדולים)

משפטים מרכזיים

תהי A מסדר r×p אזי AWAt בעלת התלפגות וישארט עם פרמטרים r,n,AHAt

מסקנה: ניתן לייצר כל מטריצה עם התפלגות ויישהארט בעזרת הפרמטרים p,n,I ומטריצות מסדר p×p (שכן לכל מטריצה חיובית קיים שורש חיובי)

טענה: יהיו Wi עם פרמטרים ni,H.p בת"ל, אזי i=1kWi=W עם פרמטרים i=1kni=n,H,p (מיידי מההגדרה של התפלגות ויישראט כסכום של משתנים רב-נורמליים ובלתי תלויים)[6]

טענה: יהיו Vifor 1id בת"ל כאשר Vi בעלי התפלגות כי בריבוע עם ni+1 דרגות חופש, נניח בנוסף כי Nij בת"ל ובעלי התפלגות נורמלית סטנדרטית ובלתי תלויים במשתני הכי בריבוע.: bii=Vi+r=1i1Nri2,1id וכמו כן: bij=NijVi+r=1i1NriNrj,i<jd

אזי: המשתנה B={bij} מתפלג וישארט W(Id,d,n)

מסקנה: הדטרמיינטה של מטריצת בעלת תפלגות וישארט: |W||H|i=0d1Vi

הוכחה:

B=TT עבור Tij=Nji,1j<id, Tii=Vi,Tij=0,i<jd

ABA בעלת התפלגות וישארט עם AA=H, ומהטענה האחרונה מקבלים כי B מתפלג וישארט W(Id,d,n) בנוסף ממהטענה על הצמדות של מטריצות וישארט, ABA מתפלגת וישארט עם מטריצה H בפרמטר, ומחוקי דטרמיננטה:

|W|=|ABA|=|B||AA|=|B||H|

מההגדרה: |B|=i=0d1Vi.[2]

ראו גם

קישורים חיצוניים

הערות שוליים

  1. Stanley Sawyer, Wishart Distributionsand Inverse-Wishart Sampling, StuDocu, ‏April 30, 2007
  2. ^ 2.0 2.1 Andriëtte Bekker, Janet van Niekerk, Mohammad Arashi, Wishart distributions: Advances in theory with Bayesian application, Journal of Multivariate Analysis 155, 2017-03-01, עמ' 272–283 doi: 10.1016/j.jmva.2016.12.002
  3. Bouchaud, J. P.; Potters, M. (2009-10-07), Financial Applications of Random Matrix Theory: a short review, doi:10.48550/arXiv.0910.1205, נבדק ב-2025-05-08
  4. Laurent Laloux, Pierre Cizeau, Jean-Philippe Bouchaud, Marc Potters, Noise Dressing of Financial Correlation Matrices, Physical Review Letters 83, 1999-08-16, עמ' 1467–1470 doi: 10.1103/PhysRevLett.83.1467
  5. Zhiyong Zhang, [https://isdsa.org/_media/jbds/v1n2/v1n2p2.pdf? A Note on Wishart and Inverse Wishart Priors for Covariance Matrix], Journal of Behavioral Data Science, 2021, עמ' 3
  6. Karly Stack, [A Derivation of the Wishart and Singular Wishart Distributions A Derivation of the Wishart and Singular Wishart Distributions], 2006, עמ' 25


התפלגות וישארט41826305Q1930697