סטטיסטיקה 2 קיבוץ נתונים בטבלה

סטטיסטיקה

דף 2: קיבוץ נתונים בטבלה

❓ למה צריך לקבץ נתונים?

נתונים גולמיים (Raw Data):

72, 85, 91, 78, 85, 63, 72, 85, 91, 78, 85, 72, 91, 85, 78, 63, 85, 72, 78, 91, 85, 85, 72, 78, 91...

קשה לראות את התמונה הכללית! 😵

טבלת שכיחויות מארגנת את הנתונים בצורה ברורה וקלה לניתוח.

📊 טבלת שכיחויות - משתנה בדיד

דוגמה: מספר האחים של 30 תלמידים בכיתה

0, 1, 2, 1, 3, 2, 1, 1, 2, 0, 1, 2, 3, 1, 2, 1, 0, 2, 1, 2, 4, 1, 2, 1, 3, 2, 1, 1, 2, 1

טבלת השכיחויות:

מספר אחים (x) שכיחות (f)
0 3
1 12
2 10
3 4
4 1
סה"כ n = 30

💡 שימו לב:

  • סכום השכיחויות = n (מספר הנתונים)
  • כל ערך מופיע בנפרד בשורה משלו
  • מתאים למשתנה בדיד עם מספר קטן של ערכים

📊 טבלת שכיחויות מקובצת - משתנה רציף

כאשר יש הרבה ערכים שונים (משתנה רציף), מקבצים את הנתונים לקבוצות/מחלקות.

דוגמה: ציוני 40 תלמידים במבחן

52, 67, 73, 81, 95, 63, 78, 84, 71, 89, 58, 76, 82, 91, 65, 74, 88, 69, 77, 93, 55, 72, 86, 61, 79, 83, 96, 68, 75, 87, 59, 71, 85, 92, 66, 78, 84, 70, 80, 94

טבלת שכיחויות מקובצת:

קבוצת ציונים גבולות אמצע קבוצה (xᵢ) שכיחות (fᵢ)
50-59 49.5-59.5 54.5 4
60-69 59.5-69.5 64.5 8
70-79 69.5-79.5 74.5 12
80-89 79.5-89.5 84.5 10
90-100 89.5-100.5 95 6
סה"כ n = 40

📚 מושגים בטבלה מקובצת

מושג הסבר דוגמה (קבוצה 70-79)
קבוצה/מחלקה טווח ערכים שמקובצים יחד 70-79
גבול תחתון הערך הקטן ביותר בקבוצה 70
גבול עליון הערך הגדול ביותר בקבוצה 79
גבולות אמיתיים הגבולות "האמיתיים" (±0.5) 69.5 - 79.5
רוחב קבוצה ההפרש בין הגבולות האמיתיים 79.5 - 69.5 = 10
אמצע קבוצה ממוצע הגבולות (מייצג את הקבוצה) (70+79)/2 = 74.5

💡 נוסחאות:

אמצע קבוצה:

\(x_i = \frac{\text{גבול תחתון} + \text{גבול עליון}}{2}\)

רוחב קבוצה:

\(h = \text{גבול עליון אמיתי} - \text{גבול תחתון אמיתי}\)

📐 כללים לבניית טבלה מקובצת

  1. מספר קבוצות: בדרך כלל 5-15 קבוצות

    כלל אצבע: \(\sqrt{n}\) קבוצות

  2. רוחב אחיד: כל הקבוצות באותו רוחב (למעט אולי האחרונה)
  3. ללא חפיפה: כל נתון שייך לקבוצה אחת בלבד
  4. ללא פערים: הקבוצות רצופות, ללא "חורים"
  5. כיסוי מלא: כל הנתונים נכנסים לאחת הקבוצות

✏️ דוגמה לחישוב רוחב קבוצה:

נתונים: ציונים מ-45 עד 98, רוצים 6 קבוצות

טווח = 98 - 45 = 53

רוחב = 53 ÷ 6 ≈ 8.8 → נעגל ל-10

הקבוצות: 45-54, 55-64, 65-74, 75-84, 85-94, 95-104

⚖️ מתי משתמשים בכל טבלה?

  טבלה רגילה (בדיד) טבלה מקובצת
סוג משתנה בדיד עם מעט ערכים רציף / בדיד עם הרבה ערכים
דוגמאות מספר ילדים, ציון 1-5 גובה, משקל, ציונים 0-100
מה רושמים כל ערך בנפרד קבוצות של ערכים
דיוק מלא מאבדים קצת מידע

💡 טיפים למבחן

אמצע קבוצה: (תחתון + עליון) ÷ 2

גבולות אמיתיים: ±0.5

בדיקה: סכום f = n

📝 סיכום דף 2

טבלת שכיחויות מארגנת נתונים גולמיים

בדיד = ערכים בודדים | רציף = קבוצות

אמצע קבוצה מייצג את כל הנתונים בקבוצה