אי-שוויון גיבס

מתוך המכלול, האנציקלופדיה היהודית
קפיצה לניווט קפיצה לחיפוש
ג'וזיה וילארד גיבס

בתורת האינפורמציה, אי-שוויון גיבס הוא טענה על האנטרופיה של התפלגות הסתברות בדידה. חסמים נוספים על האנטרופיה של התפלגויות הסתברות נובעים מאי-שוויון גיבס, כולל אי-שוויון פאנו. אי-השוויון הוצג לראשונה על ידי ג'יי ווילארד גיבס במאה ה-19.

אי-שוויון גיבס

תהיינה P={p1,,pn} ו Q={q1,,qn} התפלגויות הסתברות בדידות. אזי

i=1npilogpii=1npilogqi

השוויון בין האגפים מתקיים אם ורק אם pi=qi לכל i=1,n.[1] במילים אחרות, האנטרופיה של התפלגות P קטנה או שווה לאנטרופיה הצולבת(אנ') שלו עם כל התפלגות אחרת Q.

ההפרש בין שני הגדלים הוא דיברגנץ קולבק-לייבלר (אנטרופיה היחסית), כך שניתן לכתוב את אי השוויון גם כ[2]

DKL(PQ)i=1npilogpiqi0.

הוכחה

למען פשטות הסימון, נשתמש בהוכחת הטענה בלוגריתם הטבעי, המסומן על ידי ln.

נסמן ב I את קבוצת כל ערכי i שעבורם pi אינו אפס. מכיוון ש lnxx1 עבור כל x > 0, עם שוויון אם ורק אם x=1, מקבלים

iIpilnqipiiIpi(qipi1)<=iIqi+iIpi=iIqi+10

אי השוויון האחרון נובעת מכך ש pi ו- qi הם ערכים של התפלגות הסתברות, כך שסכום כל הערכים pi שאינם אפס הוא 1. עם זאת, ייתכן שחלק מה qi שאינם אפס הושמטו מאחר שבחירת האינדקסים I נקבעת על סמך הדרישה ש pi אינו אפס. לכן, סכום ה- qi עשוי להיות קטן מ-1.

עד כה, בהינתן קבוצת האינדקסים I, יש לנו:

iIpilnqipi0 ,

או לחלופין

iIpilnqiiIpilnpi .

ניתן להרחיב את שני הסכומים לכל i=1,,n. כלומר כולל pi=0, כאשר זוכרים כי הביטוי plnp שואף ל-0 בגבול ש p שואף ל-0, ו (lnq) שואף ל כאשר q שואף ל-0. לסיכום מתקבל

i=1npilnqii=1npilnpi

השוויון מתקבל כאשר מתקיימים שני התנאים:

  • לכל iI qipi=1 כך שמתקבל השוויון lnqipi=qipi1 ,
  • iIqi=1 כלומר qi=0 אם iI. במילים אחרות, qi=0 אם pi=0.

שני תנאים אלה יתקיימו אם ורק אם pi=qi עֲבוּר i=1,,n, כלומר ההתפלגויות Pו Q זהות.

הוכחה חלופית

ניתן להוכיח את התוצאה באמצעות אי-שוויון ינסן:

מכיוון שהלוגריתם הוא פונקציה קעורה

ipilogqipilogipiqipi=logiqi=0

כאשר אי-השוויון הראשון נובע מאי-השוויון של ינסן. השוויון האחרון נובע מכך ש Q היא התפלגות הסתברות, ולכן qi=1 .

יתר על כן, מכיוון שהלוגריתם הוא פונקציה קמורה, אז, בהתאם לתנאי השוויון של אי-שוויון ינסן, השוויון מתקבל רק כאשר מתקיימים שני התנאים:

  • q1p1=q2p2==qnpn
  • iqi=1 .

נסמן בσ את היחס בתנאי הראשון לעיל. נתקבל

1=iqi=iσpi=σ

כלומר pi=qi לכל i=1,n. במילים אחרות, השוויון באי-שוויון ינסן מתקבל אם ורק אם ההתפלגויות Pו Q זהות.

הערות שוליים

  1. Pierre Bremaud (6 בדצמבר 2012). An Introduction to Probabilistic Modeling. Springer Science & Business Media. ISBN 978-1-4612-1046-7. {{cite book}}: (עזרה)
  2. David J. C. MacKay (25 בספטמבר 2003). Information Theory, Inference and Learning Algorithms. Cambridge University Press. ISBN 978-0-521-64298-9. {{cite book}}: (עזרה)
הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0

אי-שוויון גיבס40194776Q1425564