משתנה עזר

מתוך המכלול, האנציקלופדיה היהודית
קפיצה לניווט קפיצה לחיפוש

בסטטיסטיקה ובעיקר באקונומטריקה, המתודה של משתנה עזר נועדה לאפשר מדידת סיבתיות כאשר ניסוי מבוקר אינו אפשרי ויש חשש של אנדוגניות של אחד המשתנים.

דוגמה

נחשוב על מודל לינארי המנסה לאמוד את השפעת העישון על הבריאות, ובפרט על תוחלת החיים:

כך ש-y הוא מספר השנים שחי הפרט, x הוא כמות הסיגריות שהפרט מעשן בחודש ו-הפענוח נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \varepsilon} הוא השגיאה. מכיוון שלעישון יש קורלציה עם התנהגויות לא בריאות אחרות. נקבל כתוצאה אפקט חזק מהאפקט האמיתי.

לכן עלינו לעשות ניסוי מבוקר בו נורה לאנשים לעשן מספר מסוים של סיגריות וכך נוכל לבודד את האפקט. מחקר כזה אינו אתי ויקר מאד. כך שעלינו למצוא פתרון אחר.

כדי לבודד את האפקט זה עלינו למצוא משתנה שלישי, z, שמתואם עם y רק דרך x. אם גובה המסים על הטבק מתואם שלילית עם כמות העישון ואם החוקר משתכנע שגובה המסים לא משפיע על אורך החיים בדרך אחרת, אז גובה המסים על הטבק הוא משתנה תקף.

שיטת האמידה

ניתן לחשוב על משתנה עזר כרגרסיה דו שלבית. בשלב הראשון נאמוד את המודל:

הפענוח נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle x_i =\gamma + \delta z_i + e_i, }

הביטוי

הפענוח נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \widehat{x}_i}

הוא אותו חלק בx שאינו מתואם עם הטעות, שכן הוא פונקציה לינארית של z שאינו מתואם עם הטעות