טבלת שכיחות

מתוך המכלול, האנציקלופדיה היהודית
קפיצה לניווט קפיצה לחיפוש

טבלת שכיחויות היא טבלה שמציגה את השכיחויות של התוצאות השונות במדגם[1].

כל רשומה בטבלה מכילה את השכיחות או המנייה של הופעתם של ערכים בתוך קבוצה או מרווח מסוימים. בדרך זו הטבלה מסכמת את ההתפלגות של הערכים במדגם.

טבלת שכיחויות של משתנה יחיד

טבלת שכיחויות של משתנה יחיד מאפשרת להציג מידע בצורה מאורגנת

דוגמה של טבלת שכיחויות עבור משתנה יחיד. טבלה זו מציגה את השכיחות של כל תגובה לשאלות של סקר.

דרוג מידת ההסכמה מספר
1 מסכים במידה רבה 20
2 מסכים 30
3 לא בטוח 20
4 לא מסכים 15
5 מתנגד 15

דרך נוספת להציג את הנתונים בטבלה היא ארגון הערכים של המשתנה לתת קבוצות כך שכל אחת מהן תתייחס לטווח של ערכים. למשל, ניתן להציג את הגובה של תלמידים בכיתה בדרך זו

טווח גובה מספר התלמידים מספר מצטבר
עד 150 ס"מ 25 25
151 - 160 ס"מ 35 60
161 - 170 ס"מ 20 80
171 - 180 ס"מ 20 100

טבלת השכיחויות מציגה את הסיכום של מידע המקובץ למחלקות שונות יחד עם מספר המקרים בכל מחלקה. זוהי דרך להציג מידע לא מאורגן כמו תוצאות של בחירות, הכנסה של אנשים מאזור מסוים, מכירות של מוצר בחודש נתון ועוד.

דרך נוספת להצגת הערכים הכלולים בכל מחלקה היא שימוש בסימנים המתמטיים המייצגים קטע פתוח וסגור. למשל:

  1. (נקרא "קטע פתוח")
  2. (נקרא "קטע סגור")

בנייה של טבלת שכיחויות

בנייה של טבלת שכיחויות
חלק מתהליך הבנייה של טבלת שכיחויות כולל הגדרת גודל הקבוצות שאליהן יחולקו הנתונים

שלבים לבנייה של טבלת שכיחויות

  1. החלטה על מספר המחלקות - כמות קטנה או גדולה מידי לא יחשפו את הצורה הבסיסית של בסיס הנתונים ויקשו על פירוש המידע. ניתן לקבוע את המספר המרבי של המחלקות על ידי הנוסחה הבאה: או כאשר n הוא מספר התצפיות הכולל במדגם.
  2. חישוב הטווח של הנתונים - הטווח מחושב על ידי ההפרש בין הערך המקסימלי למינימלי (Range = Max – Min). הטווח ישמש לקביעת גודל המחלקות.
  3. קביעת גודל המחלקות על ידי הנוסחה - .

באופן כללי הגודל של המחלקות צריך להיות אחיד, כאשר מכלול המחלקות צריך לתת ביטוי לכל הטווח. בעוד שישנה העדפה למחלקות אחידות בגודלן, ישנם מקרים בהם יהיה צורך למחלקות בעלות גודל שונה. למשל כדי להימנע מתאים ריקים או כמעט ריקים.

  1. קביעת גבולות המחלקות ובחירת נקודת התחלה מתאימה של המחלקה הראשונה שהיא שרירותית, הוא עשויה להיות קטנה או שווה לערך המינימלי. בדרך כלל היא תתחיל לפני הערך המינימלי באופן כזה שנקודת האמצע (הממוצע של הגבולות הנמוכים והגבוהים של המחלקה הראשונה) ממוקמת כראוי.
  2. סימון של קו אנכי (|) עבור כל תצפית במקום המתאים בטבלה.
  3. מציאת התדירויות הנדרשות.

תצוגה גרפית של טבלת שכיחויות

חלק מהגרפים שבהם ניתן לעשות שימוש באמצעות טבלת השכיחויות הם:

  • דיאגרמת עוגה - גרף המראה את היחס בין החלקים לבין השלם ובינם לבין עצמם, כלומר את התפלגות השלם לחלקים היחסיים.
  • גרף עמודות - צורת הצגה גרפית של נתונים מספריים.
  • היסטוגרמה - נתונים בהיסטוגרמה מוצגים כמלבנים המייצגים מחלקות שונות (הקרויות גם קטגוריות), שאין ביניהן חפיפה, באוכלוסיית הנתונים לפי שכיחותן היחסית.

טבלת שכיחויות משותפת

חישוב הסכומים בטבלת שכיחויות משותפת
טבלת שכיחויות משותפת של מקצוע ומגדר
טבלת שכיחויות משותפת של מקצוע ומגדר עם אחוזים

טבלת שכיחות משותפת לשני משתנים מוצגת כטבלת אפשרויות (Contingency table) דו כיוונית  

טבלת אפשרויות דו כיוונית
ריקוד ספורט טלוויזיה סה"כ
גברים 2 10 8 20
נשים 16 6 8 30
סה"כ 18 16 16 50

טור הסכום ושורת הסכום מייצגים את התדירויות השוליות (marginal frequencies or marginal distribution) בעוד שגוף הטבלה מציג את התדירויות המשולבות[2].

יישומים

ניהול ועיבוד של מידע בטבלת שכיחויות פשוט יותר מהעבודה עם מידע גולמי. ישנם אלגוריתמים פשוטים לחישוב של ממוצע, חציון וסטיית תקן מטבלאות אלו.

בדיקת השערות מתבססת על הבדלים ונקודות דמיון בין טבלאות שכיחויות. הערכה זו מתבססת על מדידה של נטייה מרכזית או ממוצע ומדידה של שונות כמו סטיית תקן.

טבלת השכיחויות נחשבת למצודדת כאשר קיים הפרש בין החציון ולבין הממוצע שלה.

הגבנוניות של הטבלה מתייחסת למידת הריכוז של הנתונים סביב הממוצע, או על פי השיא של התצוגה הגרפית שלה.

קישורים חיצוניים

הערות שוליים

  1. ^ Australian Bureau of Statistics
  2. ^ Stat Trek, Statistics and Probability Glossary, s.v. Joint frequency
Logo hamichlol 3.png
הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0