הסקה סטטיסטית

מתוך המכלול, האנציקלופדיה היהודית
קפיצה לניווט קפיצה לחיפוש

הסקה סטטיסטית או סטטיסטיקה היסקית הוא תהליך שבו מסיקים מסקנות על התכונות של התפלגות כלשהי, על בסיס ניתוח של מידע אמפירי. הניתוח של המידע מאפשר להסיק מסקנות לגבי התכונות של האוכלוסייה (אנ'): בפרט ניתן להשתמש בניתוח בשביל לבצע בדיקת השערות ובשביל למצוא אומדנים לפרמטרים של האוכלוסייה[א].

בעוד הסטטיסטיקה התיאורית עוסקת בתכונות של המדגם עצמו, ולכן אינה מניחה שבהכרח האוכלוסייה גדולה מהמדגם, ההנחה במסגרת הניתוח של הסטטיסטיקה ההיסקית היא שהאוכלוסייה גדולה יותר (בדרך כלל הרבה יותר) מכמות הפרטים שלגביהם בפועל נאסף המידע; כלומר ההנחה היא שהמידע שנאסף נדגם מתוך אוכלוסייה גדולה יותר.

הסבר כללי

הסקה סטטיסטית מאפשר לטעון טענות לגבי האוכלוסייה כולה, על אף שצפינו רק בחלק מתוך אוכלוסייה זו אותו דגמנו (באופן אקראי).

תהליך ההסקה הסטטיסטית מתחיל בבחירת מודל סטטיסטי של התהליך שבאמצעותו נוצר המידע[ב], שנותן לנו להניח מהי צורת ההתפלגות של המידע[ג], ולאחר מכן הסקת מסקנות מהמידע שנאסף תחת ההנחות של המודל.

מספר סטטיסטיקאים ידועים התבטאו בנושא ואמרו שבדרך כלל הבעיה הקשה ביותר בהסקה סטטיסטית היא התרגום של בעיות במציאות למודל סטטיסטי מתאים.

דוגמאות לשימוש בהסקה סטטיסטית

  • אמידה נקודתית - מתן ההערכה/האומדן הטוב ביותר עבור פרמטר מסוים.[א]
  • אמידה של טווח - מציאת טווח מסוים שהסיכוי שהפרמטר האמיתי נמצא בתוכו הוא גבוה. אם הטווח הוא קטע רציף, הוא נקרא רווח בר-סמך, ומידת הוודאות לגבי הימצאותו של הפרמטר בטווח זה נקרא "רמת מובהקות".[ד]
  • בדיקת השערות - ניסוח השערה ובדיקה אם ניתן לדחות אותה ברמה מסוימת של וודאות.[ה]
  • סיווג של המידע לקבוצות וניתוח אשכולות.

ביאורים

  1. ^ 1.0 1.1 למשל, אם האוכלוסייה היא: "עצי האורן בשטח מדינת ישראל", והפרמטר הוא: "גובה", אז ניתן לאמוד את תוחלת הגובה שלהם או את סטיית התקן שלה.
  2. ^ למשל, בהטלת קובייה התהליך בו נוצר המידע הוא הטלת הקוביה כך שיש הסתברות מסוימת לכל פאה, כשסך ההסתברויות של 6 הפאות הוא 100%. אם הקוביה היא הוגנת, ההסתברויות של כל הפאות שוות זו לזו.
  3. ^ למשל: התפלגות נורמלית, התפלגות אחידה, התפלגות פואסונית וכו'.
  4. ^ למשל, אם האוכלוסייה היא: "עצי האורן בשטח מדינת ישראל", והפרמטר הוא: "גובה", אז ניתן לאמוד את תוחלת הגובה בתוך קטע, נניח: בין 12 מטרים ל-16 מטרים, עם רמת וודאות של %‏X.
  5. ^ למשל, אם האוכלוסייה היא: "עצי האורן בשטח מדינת ישראל", והפרמטר הוא: "גובה", ניתן לנסח השערה שתוחלת הגובה גבוהה מ-100 מטרים, ולבדוק האם ניתן להסיק מהמדגם של עצים אותם מדדנו שברמת ודאות של 95% ההשערה הזו שגויה.
Allianz AG.png ערך זה הוא קצרמר בנושא סטטיסטיקה. אתם מוזמנים לתרום למכלול ולהרחיב אותו.