מבחן M בריבוע

מבחן M בריבוע (מבחן $M^{2}$ ) הוא וריאציה של מבחן כי בריבוע המתאימה להערכת עצמת הקשר בין שני משתנים איכותיים הנמדדים בסולם מדידה סודר. בניגוד למבחן חי בריבוע, מבחן זה לוקח בחשבון את העובדה שקיים סדר בין ערכי המשתנים. מבחן קוקראן-ארמיטאז' הוא מקרה פרטי של מבחן זה.

הגדרה

מוטיבציה

כשמשתנה נמדד בסולם סודר וערכיו מקודדים במספרים, אין משמעות לערכים המספריים האלה. לדוגמה, משתנה המתאר את המצב הסוציואקונומי של משפחה יכול לקבל את הערכים המילוליים "נמוך", "בינוני" או "גבוה", וניתן לקודד את הערכים המילוליים על ידי הערכים 1, 2, 3 או 4, 18, 21. על פי הגדרת סולם הסדר, כל שלושת הקידודים האלה שקולים.

עם זאת, ייתכן וניתן לקודד מחדש את הערכים של משתנה הסדר בערכים כמותיים. לדוגמה, המשתנה עשירוני שכר מקבל את הערכים 1 עד 10, וזהו משתנה סדר. אבל אפשר להחליף כל דרגה בסולם זה בשכר החציוני של העשירון, ובכך "לשדרג" אותו למשתנה כמותי. שדרוג זה יאפשר הפעלת שיטות סטטיסטיות המתאימות למשתנים כמותיים.

הגדרה פורמלית

יהיו יהיו $X$ ו- $Y$ שני משתנים מקריים איכותיים הנמדדים בסולם סדר. נניח ללא הגבלת הכלליות כי המשתנה $X$ מקבל את הערכים $1, 2, ..., I$ וכי המשתנה $Y$ מקבל את הערכים $1, 2, ..., J$ .

נתבונן במדגם בגודל $n$ מתוך אוכלוסייה כלשהי, ונסמן ב- $n_{i j}$ את מספר הפרטים במדגם עבורם $X = i$ ו- $Y = j$ . נאמר כי $n_{i j}$ היא השכיחות של התצפיות במדגם עבורן $X = i$ ו- $Y = j$ . הטבלה שבה יש $I$ שורות ו- $J$ עמודות, ובהצטלבות השורה ה- $i$ והעמודה ה- $j$ נמצא המספר $n_{i j}$ נקראת לוח השכיחות של המשתנים $X$ ו- $Y$ . לוח השכיחות הוא למעשה הנתונים שיש לנתח.

כן נסמן ב- $n_{i .}$ את מספר הפרטים במדגם עבורם $X = i$ , וב- $n_{. j}$ נסמן את מספר הפרטים במדגם עבורם $Y = j$ . באופו דומה נסמן ב- $p_{i .} = \frac{n_{i .}}{n}$ את פרופורציית הפרטים במדגם עבורם $X = i$ , וב- $p_{. j} = \frac{n_{. j}}{n}$ נסמן את פרופורציית הפרטים במדגם עבורם $Y = j$ . פרופרציית הפרטים במדגם עבורם $X = i$ ו- $Y = j$ היא $p_{i j} = \frac{n_{i} j}{n}$ .

יהיו $u_{1} \leq u_{2} \leq ... \leq u_{I}$ מספרים כלשהם. ערכים אלה נקראים ה-"ציונים" (scores) של ערכי המשתנה $X$ . באופן דומה, יהיו $v_{1} \leq v_{2} \leq ... \leq v_{J}$ הציונים של ערגי המשתנה $Y$ .

נגדיר: $\bar{u} = \sum_{i = 1}^{I} u_{i} p_{i .}$ ו- $\bar{v} = \sum_{i = 1}^{J} u_{j} p_{. j}$ .

באופן אנלוגי להגדרת מקדם המתאם של פירסון נגדיר

$r = \frac{\sum_{i j} (u_{i} - \bar{u}) (v_{j} - \bar{v}) p_{i j}}{\sqrt{[\sum_{i} (u_{i} - \bar{u}) p_{i .}] [\sum_{i} (v_{i} - \bar{v}) p_{. j}]}}$

ויהי $M^{2} = (n - 1) r^{2}$

$r$ הוא למעשה אמדן למקדם המתאם ההסתברותי $ρ$ בין שני משתנים מקריים כמותיים בדידים המקבלים את הערכים $u_{1}, u_{2}, ..., u_{I}$ ו- $v_{1}, v_{2}, ..., v_{J}$ .

תחת השערת האפס $H_{0} : ρ = 0$ ההתפלגות האסימפטוטית של $M^{2}$ היא התפלגות $χ^{2}$ עם דרגת חופש אחת. ידיעת ההתפלגות זו מאפשרת חישוב של ערך-p. נדחה את השערת האפס אם ערך זה קטן מרמת המובהקות $α$ שקבענו מראש.

הסבר אינטואיטיבי

כאשר מחליפים את ערכי סולם הסדר בציונים, המשתנה משודרג למשתנה כמותי. למשל, על פי סקר ההכנסות של הלשכה המרכזית לסטטיסטיקה לשנת ^[1]2011, השכר בעשירון השני באותה שנה נע בין 2248 שקלים ל-3633 שקלים. לכן ניתן להחליף את הערך האיכותי "עשירון שני" בערך כמותי, למשל ב-2940.5 - הממוצע של שני הקצוות. מספר השכירים בעשירון היה בערך 258900, ולכן יש לנו כעת 258900 תצפיות בהן הערך הכמותי של משתנה ההכנסה הוא 2940.5. לאחר שמבצעים את התהליך הזה לכל התצפיות עבור שני המשתנים, ניתן לחשב את מקדם המתאם בין הציונים שלהם.

קביעת ציוני המשתנים

ברור לחלוטין כי קביעת ערכי הציונים תשפיע על ערכו של $M^{2}$ . אגרסטי מדגיש כי יש לבחור את המיונים כך שישקפו את ההבדלים בין הערכים של המשתנים^[2]. במקרה שהערכים של המשתנים מציינים טווח (למשל גיל 18 עד 25) ,אגרסטי ממליץ לקבוע את הציון באמצע הטווח (21.5 בדוגמה זו). אגרסטי טוען גם כי בדרך כלל בחירות שונות של ציונים יובילו בסופו של דבר לתוצאות דומות, אלא אם הנתונים מאד לא מאוזנים, במובן שההתפלגות של הנתונים בקטגוריות רחוקה מהתפלגות אחידה. גראוברד וקורן^[3] ממחישים את הבעייתיות שנובעת מקביעה שרירותית של ערכי הציונים. הם ממליצים "לקבוע ערכים סבירים כאשר הדבר אפשרי", ולתת ערכים שההפרשים ביניהם שווים כאשר הדבר לא אפשרי. כאפשרות נוספת, הם ממליצים לקבוע את הציון כדרגה הממוצעת של כל התצפיות בקטגוריה (כאשר הדרגה מוגדרת באופן דומה להגדרה במקדם המתאם של ספירמן או במבחן וילקוקסון). גילולה והברמן הציעו גישה המבוססת על ניתוח קנוני של לוח השכיחות^[4] . ליאו גודמן, במאמר הסוקר את השיטות העיקריות לניתוח משתנים סודרים^[5], מציג את מודל RC, שהפרמטרים שלו יכולים לשמש כציונים עבור ערכי המשתנים.

דוגמה

הדוגמה הבאה מבוססת על הדוגמה שהובאה במאמר של גראוברד וקורן שהוזכר קודם.

במחקר תצפיתי פרוספקטיבי, נלקח מדגם של כ-32000 נשים בשלבים המוקדמים של הריון. כל אישה ענתה על שאלון שתיאר את הרגלי שתיית האלכוהול שלה בשלושת החודשים הראשונים של ההריון, ועל סמך שאלונים אלה חושב ממוצע מנות האלכוהול ליום ("drinks") של כל אישה. נתונים אלה קובצו לקטגוריות שיצרו משתנה איכותי בסולם סדר. בסיום ההריון ולאחר הלידה, נרשם האם התינוק שנולד סובל ממום מולד.

הנתונים מוצגים בטבלה הבאה:


	צריכת אלכוהול יומית
מום בלידה	לא שתתה	פחות ממנה אחת	בין מנה אחת לשתיים	שלוש מנות או יותר	סך הכל
לא	17066	14464	788	163	32481
כן	48	38	5	2	93
סך הכל	17114	14502	793	165	32574

נבחן 3 אפשרויות למתן ציונים למשתנה צריכת האלכוהול היומית:

ציון ליניארי: הציונים יהיו המספרים 1 עד 4. זוהי גישה נאיבית, המניחה כי ההבדלים בין כל הערכים של משתנה זה שווים, וכך ה-"שדרוג" הוא למשתנה הנמדד בסולם רווח.
אמצע הטווח: לכל ערך לש המשתנה נבחר את הממצע בין הגבול התחתון של הערך והגבול העליון שלו. הציון של "לא שתתה" יהיה לכן 0, הציון של "פחות ממנה אחת" יהיה 0.5, שהוא הממוצע של 0 ו-1. באופן דומה הציון של "בין מנה אחת לשתיים יהיה 1.5. לקטגוריה העליונה "שלוש מנות או יותר" אין גבול עליון, ולכן ניאלץ לקבוע עבורנ ציון שרירותי, למשל 5. שימו לב כי כאן המרווחים בין ציוני הערכים אינם שווים
דרגה ממוצעת: נדרג את ערכי המשתנה בדומה לדירוג שנעשה במבחן ספירמן, ונקבע את הדרגה הממוצעת כציון לערך האיכותי. לדוגמה, הדרגות של התצפיות בערך "לא שתתה" הן 1 עד 17114, ולכן הדרגה הממוצעת היא הממוצע של 1 ו-17114, כלומר 8557.5. באופן דומה, הדרגות של הערך "פחות ממנה אחת" הן 17115 עד 31616, ולכן הדרגה הממוצעת של ערך זה היא הממוצע של ו-31616, כלומר 24365.5.

מאחר שהמשתנה "מום בלידה" מקבל רק שני ערכים אפשריים, כל בחירה של זוג ציונים, שרירותית ככל שתהיה, תביא לאותה תוצאה. בדוגמה זו הציון העבור "לא" הוא 0 ועבור "כן" - 1.

בטבלה הבאה מוצגות שלוש מערכות הציונים שנבחרו, יחד עם הערך המחושב של סטטיסטי $M^{2}$ וערך ה-p :


שיטת הציון	צריכת אלכוהול יומית				$M^{2}$	$p - v a l u e$
	לא שתתה	פחות ממנה אחת	בין מנה אחת לשתיים	שלוש מנות או יותר
ציון ליניארי	1	2	3	4	1.45	0.2283
אמצע הטווח	0	0.5	1.5	5	5.14	0.0234
דרגה ממוצעת	8557.5	24365.5	32013	32492	0.35	0.5537

דוגמה זו ממחישה את הרגישות של המבחן לבחירת ציוני הדרגות. הציונים הליניאריים של שתי הקטגוריות העליונות בסולם (בין מנה אחת לשתיים ושלוש או יותר) קרובים יחסית, וגם ציוני הדרגה הממוצעת. הם מבטאים הנחה מוסתרת כי אין הבדל משמעותי בין צריכה של עד 2 מנות וצריכה גבוהה יותר. ייתכן מאד כי הנחה זו אינה סבירה, כיוון ששלוש מנות או יותר יכולות להיות 3 מנות, 54 מנות, ואף יותר מכך.

בהנחה כי בחרנו מראש רמת מובהקות $α = 0.05$ (ובהתעלמות מבעיית ההשוואות המרובות), נדחה את ההשערה כי לא קיימת מגמת עליה בשיעור המומים המולדים בתינוקות ביחס לאמצע הטווח של קטגוריות צריכת האלכוהול, אך לא נוכל לדחות את ההשערות האחרות.

ראו גם

לקריאה נוספת

Agresti, Alan (2007). An introduction to categorical data analysis, 2nd Edition. John Wiley & Sons. ISBN 978-0-471-22618-5.

Agresti, Alan (2002). Categorical data analysis, 2nd Edition. John Wiley & Sons. ISBN 0-471-36093-7.

קישורים חיצוניים

Chi-Square With Ordinal Data, David C. Howell, University of Vermont

הערות שוליים

↑ הלשכה המרכזית לסטטיסטיקה, לוח 27.- עשירונים של שכירים, לפי הכנסה חודשית ברוטו, מין, מספר שנות לימוד ומשלח יד, באתר הלשכה המרכזית לסטטיסטיקה
↑ Agresti, Alan, 2.5.1, An Introduction to Categorical Data Analysis, 2nd edition, Hoboken, New Jersey: JohnWiley & Sons, Inc., 2007, עמ' 41, מסת"ב 978-0-471-22618-5
↑ Graubard, B. I., & Korn, E. L., Choice of column scores for testing independence in ordered 2 x K contingency tables, Biometrics, 2 43, 1987, עמ' 471-476 doi: 10.2307/2531828
↑ Gilula, Z., & Haberman, S. J., Canonical analysis of contingency tables by maximum likelihood, Journal of the American Statistical Association, 395 81, 1986, עמ' 780-788
↑ Goodman, Leo A., The analysis of cross-classified data having ordered and/or unordered categories: association models, correlation models, and asymmetry models for contingency tables with or without missing entries, Annals Of Statistics, 1 13, 1985, עמ' 10-69

הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0

שגיאות פרמטריות בתבנית:מיון ויקיפדיה
שימוש בפרמטרים מיושנים [ דרגה ] מבחן M בריבוע24846890

[1] הלשכה המרכזית לסטטיסטיקה, לוח 27.- עשירונים של שכירים, לפי הכנסה חודשית ברוטו, מין, מספר שנות לימוד ומשלח יד, באתר הלשכה המרכזית לסטטיסטיקה

[2] Agresti, Alan, 2.5.1, An Introduction to Categorical Data Analysis, 2nd edition, Hoboken, New Jersey: JohnWiley & Sons, Inc., 2007, עמ' 41, מסת"ב 978-0-471-22618-5

[3] Graubard, B. I., & Korn, E. L., Choice of column scores for testing independence in ordered 2 x K contingency tables, Biometrics, 2 43, 1987, עמ' 471-476 doi: 10.2307/2531828

[4] Gilula, Z., & Haberman, S. J., Canonical analysis of contingency tables by maximum likelihood, Journal of the American Statistical Association, 395 81, 1986, עמ' 780-788

[5] Goodman, Leo A., The analysis of cross-classified data having ordered and/or unordered categories: association models, correlation models, and asymmetry models for contingency tables with or without missing entries, Annals Of Statistics, 1 13, 1985, עמ' 10-69

[1]

[2]

[3]

[4]

[5]