סטטיסטיקה: מדדי מרכז ופיזור - מדדי פיזור
📏 מדדי פיזור (Dispersion Measures)
מדדי פיזור מתארים עד כמה הנתונים מפוזרים סביב המרכז. ככל שהפיזור גדול יותר, הנתונים יותר מגוונים.
📐 1. טווח (Range)
טווח = ערך מקסימלי − ערך מינימלי
R = x_max − x_min
R = x_max − x_min
דוגמה: נתונים: 12, 15, 18, 22, 25, 30
R = 30 − 12 = 18
R = 30 − 12 = 18
⚠️ חיסרון: הטווח מושפע רק משני ערכים קיצוניים ולא מהתפלגות שאר הנתונים.
📊 2. שונות (Variance) - s²
השונות מודדת את ממוצע ריבועי הסטיות מהממוצע.
היא מראה כמה הנתונים "מרוחקים" בממוצע מהמרכז.
היא מראה כמה הנתונים "מרוחקים" בממוצע מהמרכז.
שונות מדגם:
s² = Σ(xᵢ − x̄)² / (n−1) = [Σxᵢ² − (Σxᵢ)²/n] / (n−1)
s² = Σ(xᵢ − x̄)² / (n−1) = [Σxᵢ² − (Σxᵢ)²/n] / (n−1)
שלבי החישוב:
שלב 1: חשבו את הממוצע x̄
שלב 2: חשבו את הסטייה של כל ערך מהממוצע: (xᵢ − x̄)
שלב 3: העלו כל סטייה בריבוע: (xᵢ − x̄)²
שלב 4: סכמו את כל הריבועים: Σ(xᵢ − x̄)²
שלב 5: חלקו ב-(n−1): s² = Σ(xᵢ − x̄)² / (n−1)
דוגמה מלאה: נתונים: 2, 4, 6, 8, 10
x̄ = (2+4+6+8+10)/5 = 30/5 = 6
s² = 40 / (5−1) = 40/4 = 10
| xᵢ | x̄ | xᵢ − x̄ | (xᵢ − x̄)² |
|---|---|---|---|
| 2 | 6 | −4 | 16 |
| 4 | 6 | −2 | 4 |
| 6 | 6 | 0 | 0 |
| 8 | 6 | +2 | 4 |
| 10 | 6 | +4 | 16 |
| סכום | 40 | ||
s² = 40 / (5−1) = 40/4 = 10
📉 3. סטיית תקן (Standard Deviation) - s
סטיית תקן = √שונות
s = √s² = √[Σ(xᵢ − x̄)² / (n−1)]
s = √s² = √[Σ(xᵢ − x̄)² / (n−1)]
בהמשך לדוגמה הקודמת:
s = √10 = 3.16
s = √10 = 3.16
למה סטיית תקן?
• השונות נמדדת ביחידות בריבוע (למשל: מטר²)
• סטיית התקן נמדדת באותן יחידות כמו הנתונים - קל יותר לפרש!
• השונות נמדדת ביחידות בריבוע (למשל: מטר²)
• סטיית התקן נמדדת באותן יחידות כמו הנתונים - קל יותר לפרש!
🔄 נוסחת הקיצור לשונות
s² = [Σxᵢ² − (Σxᵢ)²/n] / (n−1)
או: s² = [Σxᵢ² − n·x̄²] / (n−1)
או: s² = [Σxᵢ² − n·x̄²] / (n−1)
דוגמה עם נוסחת קיצור: נתונים: 2, 4, 6, 8, 10
Σxᵢ = 2+4+6+8+10 = 30
Σxᵢ² = 4+16+36+64+100 = 220
n = 5
s² = [220 − (30)²/5] / (5−1) = [220 − 180] / 4 = 40/4 = 10 ✓
Σxᵢ = 2+4+6+8+10 = 30
Σxᵢ² = 4+16+36+64+100 = 220
n = 5
s² = [220 − (30)²/5] / (5−1) = [220 − 180] / 4 = 40/4 = 10 ✓
📊 4. מקדם שונות (CV)
מקדם השונות מאפשר להשוות פיזור בין קבוצות עם יחידות שונות או ממוצעים שונים.
CV = (s / x̄) × 100%
דוגמה: השוואת פיזור משקל בין תינוקות למבוגרים:
תינוקות: x̄ = 4 ק"ג, s = 0.8 ק"ג → CV = 0.8/4 × 100 = 20%
מבוגרים: x̄ = 70 ק"ג, s = 10 ק"ג → CV = 10/70 × 100 = 14.3%
מסקנה: הפיזור היחסי גדול יותר אצל תינוקות!
תינוקות: x̄ = 4 ק"ג, s = 0.8 ק"ג → CV = 0.8/4 × 100 = 20%
מבוגרים: x̄ = 70 ק"ג, s = 10 ק"ג → CV = 10/70 × 100 = 14.3%
מסקנה: הפיזור היחסי גדול יותר אצל תינוקות!
📈 5. טרנספורמציה לינארית
כאשר מבצעים טרנספורמציה לינארית y = a + bx:
⚠️ חשוב לזכור:
• הוספת קבוע (a) לא משנה את מדדי הפיזור
• כפל בקבוע (b) כן משנה - סט"ת נכפלת ב-|b|, שונות נכפלת ב-b²
• הוספת קבוע (a) לא משנה את מדדי הפיזור
• כפל בקבוע (b) כן משנה - סט"ת נכפלת ב-|b|, שונות נכפלת ב-b²
📋 סיכום נוסחאות
| מדד | נוסחה | יחידות |
|---|---|---|
| טווח | R = x_max − x_min | כמו הנתונים |
| שונות מדגם | s² = Σ(xᵢ−x̄)² / (n−1) | יחידות² |
| סטיית תקן | s = √s² | כמו הנתונים |
| מקדם שונות | CV = s/x̄ × 100% | אחוזים (ללא יחידות) |
💡 טיפ לבחינה:
• אם מבקשים שונות - התשובה תהיה מספר גדול יחסית (ביחידות²)
• אם מבקשים סטיית תקן - התשובה תהיה שורש השונות
• תמיד בדקו: האם n או n−1 במכנה? (מדגם = n−1, אוכלוסייה = N)
• אם מבקשים שונות - התשובה תהיה מספר גדול יחסית (ביחידות²)
• אם מבקשים סטיית תקן - התשובה תהיה שורש השונות
• תמיד בדקו: האם n או n−1 במכנה? (מדגם = n−1, אוכלוסייה = N)
OpenBook © 2025 © רוית הלפנבאום