סטטיסטיקה הסבר: קיבוץ נתונים בטבלה
הסבר מלא, דוגמאות פתורות ותרגול.
📖 סטטיסטיקה הסבר: קיבוץ נתונים בטבלה
סטטיסטיקה
דף 2: קיבוץ נתונים בטבלה
❓ למה צריך לקבץ נתונים?
נתונים גולמיים (Raw Data):
72, 85, 91, 78, 85, 63, 72, 85, 91, 78, 85, 72, 91, 85, 78, 63, 85, 72, 78, 91, 85, 85, 72, 78, 91...
קשה לראות את התמונה הכללית! 😵
טבלת שכיחויות מארגנת את הנתונים בצורה ברורה וקלה לניתוח.
📊 טבלת שכיחויות - משתנה בדיד
דוגמה: מספר האחים של 30 תלמידים בכיתה
0, 1, 2, 1, 3, 2, 1, 1, 2, 0, 1, 2, 3, 1, 2, 1, 0, 2, 1, 2, 4, 1, 2, 1, 3, 2, 1, 1, 2, 1
טבלת השכיחויות:
| מספר אחים (x) | שכיחות (f) |
|---|---|
| 0 | 3 |
| 1 | 12 |
| 2 | 10 |
| 3 | 4 |
| 4 | 1 |
| סה"כ | n = 30 |
💡 שימו לב:
- סכום השכיחויות = n (מספר הנתונים)
- כל ערך מופיע בנפרד בשורה משלו
- מתאים למשתנה בדיד עם מספר קטן של ערכים
📊 טבלת שכיחויות מקובצת - משתנה רציף
כאשר יש הרבה ערכים שונים (משתנה רציף), מקבצים את הנתונים לקבוצות/מחלקות.
דוגמה: ציוני 40 תלמידים במבחן
52, 67, 73, 81, 95, 63, 78, 84, 71, 89, 58, 76, 82, 91, 65, 74, 88, 69, 77, 93, 55, 72, 86, 61, 79, 83, 96, 68, 75, 87, 59, 71, 85, 92, 66, 78, 84, 70, 80, 94
טבלת שכיחויות מקובצת:
| קבוצת ציונים | גבולות | אמצע קבוצה (xᵢ) | שכיחות (fᵢ) |
|---|---|---|---|
| 50-59 | 49.5-59.5 | 54.5 | 4 |
| 60-69 | 59.5-69.5 | 64.5 | 8 |
| 70-79 | 69.5-79.5 | 74.5 | 12 |
| 80-89 | 79.5-89.5 | 84.5 | 10 |
| 90-100 | 89.5-100.5 | 95 | 6 |
| סה"כ | n = 40 | ||
📚 מושגים בטבלה מקובצת
| מושג | הסבר | דוגמה (קבוצה 70-79) |
|---|---|---|
| קבוצה/מחלקה | טווח ערכים שמקובצים יחד | 70-79 |
| גבול תחתון | הערך הקטן ביותר בקבוצה | 70 |
| גבול עליון | הערך הגדול ביותר בקבוצה | 79 |
| גבולות אמיתיים | הגבולות "האמיתיים" (±0.5) | 69.5 - 79.5 |
| רוחב קבוצה | ההפרש בין הגבולות האמיתיים | 79.5 - 69.5 = 10 |
| אמצע קבוצה | ממוצע הגבולות (מייצג את הקבוצה) | (70+79)/2 = 74.5 |
💡 נוסחאות:
אמצע קבוצה:
\(x_i = \frac{\text{גבול תחתון} + \text{גבול עליון}}{2}\)
רוחב קבוצה:
\(h = \text{גבול עליון אמיתי} - \text{גבול תחתון אמיתי}\)
📐 כללים לבניית טבלה מקובצת
- מספר קבוצות: בדרך כלל 5-15 קבוצות
כלל אצבע: \(\sqrt{n}\) קבוצות
- רוחב אחיד: כל הקבוצות באותו רוחב (למעט אולי האחרונה)
- ללא חפיפה: כל נתון שייך לקבוצה אחת בלבד
- ללא פערים: הקבוצות רצופות, ללא "חורים"
- כיסוי מלא: כל הנתונים נכנסים לאחת הקבוצות
✏️ דוגמה לחישוב רוחב קבוצה:
נתונים: ציונים מ-45 עד 98, רוצים 6 קבוצות
טווח = 98 - 45 = 53
רוחב = 53 ÷ 6 ≈ 8.8 → נעגל ל-10
הקבוצות: 45-54, 55-64, 65-74, 75-84, 85-94, 95-104
⚖️ מתי משתמשים בכל טבלה?
| טבלה רגילה (בדיד) | טבלה מקובצת | |
|---|---|---|
| סוג משתנה | בדיד עם מעט ערכים | רציף / בדיד עם הרבה ערכים |
| דוגמאות | מספר ילדים, ציון 1-5 | גובה, משקל, ציונים 0-100 |
| מה רושמים | כל ערך בנפרד | קבוצות של ערכים |
| דיוק | מלא | מאבדים קצת מידע |
💡 טיפים למבחן
אמצע קבוצה: (תחתון + עליון) ÷ 2
גבולות אמיתיים: ±0.5
בדיקה: סכום f = n
📝 סיכום דף 2
טבלת שכיחויות מארגנת נתונים גולמיים
בדיד = ערכים בודדים | רציף = קבוצות
אמצע קבוצה מייצג את כל הנתונים בקבוצה
דוגמאות פתורות
מהי טבלת שכיחויות?
הצג פתרון
טבלת שכיחויות היא הצעד הראשון שבו רשימת מספרים ארוכה הופכת לתמונה ברורה ומובנת. במקום לראות עשרות ערכים מפוזרים, אנחנו רואים לכל ערך כמה פעמים הוא הופיע. זה מאפשר לנו לזהות בקלות ערכים נפוצים, ערכים נדירים, ואיפה רוב הנתונים “יושבים”. לפני כל גרף, ממוצע או ניתוח יותר מתקדם, טבלת השכיחויות עוזרת לנו להבין את המבנה הבסיסי של הנתונים.
מהי "שכיחות" של ערך בנתונים?
הצג פתרון
"שכיחות" היא פשוט ספירה: כמה פעמים אותו ערך מופיע בנתונים. למרות שזה נשמע בסיסי, זה אחד הרעיונות המרכזיים בסטטיסטיקה: במקום להסתכל על כל תוצאה בנפרד, אנחנו שואלים – מה קורה הרבה ומה קורה מעט. כך אפשר להבין דפוסים: האם יש ערך "שולט", האם הנתונים מפוזרים, והאם יש ערכים חריגים.
מדוע מקבצים נתונים בטבלת שכיחויות במקום להשאיר רשימה ארוכה?
הצג פתרון
כאשר יש רשימה ארוכה של נתונים, כמעט בלתי אפשרי "להבין בעין" מה קורה שם. קיבוץ הנתונים בטבלת שכיחויות הופך את הרשימה המבולגנת למבנה מסודר: כל ערך וצמוד אליו מספר ההופעות שלו. כך אפשר לראות במהירות:
- באיזה ערכים יש ריכוז גדול של נתונים,
- אילו ערכים מופיעים מעט מאוד,
- ואיך נראית ההתפלגות הכללית של הקבוצה.
תרגול עכשיו
צרו שאלה חדשה אקראית ובדקו את עצמכם.