סטטיסטיקה מדדי פיזור
סטטיסטיקה
דף 7: מדדי פיזור
📊 מהם מדדי פיזור?
מדדי פיזור מתארים עד כמה הנתונים מפוזרים או מרוכזים סביב המרכז.
למה זה חשוב?
שתי הקבוצות עם אותו ממוצע, אבל שונות לגמרי!
1️⃣ טווח (Range)
טווח = הערך הגדול ביותר פחות הערך הקטן ביותר
\(R = x_{max} - x_{min}\)
✏️ דוגמה:
ציונים: 65, 72, 78, 85, 92
\(R = 92 - 65 = 27\)
הטווח: 27
💡 יתרונות וחסרונות:
|
✅ יתרונות
|
❌ חסרונות
|
📐 סטייה מהממוצע
סטייה = המרחק של כל נתון מהממוצע
\(d_i = x_i - \bar{x}\)
✏️ דוגמה: נתונים: 4, 6, 8, 10, 12 (ממוצע = 8)
| xᵢ | סטייה (xᵢ - x̄) |
|---|---|
| 4 | 4 - 8 = -4 |
| 6 | 6 - 8 = -2 |
| 8 | 8 - 8 = 0 |
| 10 | 10 - 8 = +2 |
| 12 | 12 - 8 = +4 |
| סכום | 0 |
⚠️ סכום הסטיות תמיד שווה 0!
לכן לא ניתן להשתמש בו כמדד פיזור...
2️⃣ שונות (Variance)
שונות = ממוצע של ריבועי הסטיות
(מרבעים כדי להיפטר מהסימנים השליליים)
📋 נוסחאות השונות:
| סוג נתונים | נוסחה |
|---|---|
| נתונים גולמיים | \(S^2 = \frac{\sum (x_i - \bar{x})^2}{n}\) |
| טבלת שכיחויות | \(S^2 = \frac{\sum f_i(x_i - \bar{x})^2}{n}\) |
| נוסחה מקוצרת | \(S^2 = \frac{\sum x_i^2}{n} - \bar{x}^2\) |
✏️ דוגמה: נתונים: 4, 6, 8, 10, 12 (ממוצע = 8)
| xᵢ | xᵢ - x̄ | (xᵢ - x̄)² |
|---|---|---|
| 4 | -4 | 16 |
| 6 | -2 | 4 |
| 8 | 0 | 0 |
| 10 | +2 | 4 |
| 12 | +4 | 16 |
| סכום | 40 | |
\(S^2 = \frac{40}{5} = 8\)
השונות: 8
3️⃣ סטיית תקן (Standard Deviation)
סטיית תקן = שורש השונות
(מחזירה את היחידות המקוריות)
\(S = \sqrt{S^2} = \sqrt{\frac{\sum (x_i - \bar{x})^2}{n}}\)
✏️ המשך הדוגמה:
\(S = \sqrt{8} = 2.83\)
סטיית התקן: 2.83
💡 מה אומרת סטיית תקן?
- סט"ת קטנה → הנתונים קרובים לממוצע (מרוכזים)
- סט"ת גדולה → הנתונים רחוקים מהממוצע (מפוזרים)
- סט"ת = 0 → כל הנתונים שווים!
✏️ דוגמה מלאה - מטבלת שכיחויות
מספר אחים של 20 תלמידים:
| x | f | x·f | x - x̄ | (x - x̄)² | f(x - x̄)² |
|---|---|---|---|---|---|
| 0 | 2 | 0 | -1.5 | 2.25 | 4.5 |
| 1 | 8 | 8 | -0.5 | 0.25 | 2 |
| 2 | 6 | 12 | 0.5 | 0.25 | 1.5 |
| 3 | 4 | 12 | 1.5 | 2.25 | 9 |
| סה"כ | 20 | 30 | 17 |
ממוצע: \(\bar{x} = \frac{30}{20} = 1.5\)
שונות: \(S^2 = \frac{17}{20} = 0.85\)
סטיית תקן: \(S = \sqrt{0.85} = 0.92\)
📋 תכונות השונות וסטיית התקן
| פעולה | השפעה על השונות | השפעה על סט"ת |
|---|---|---|
| הוספת k לכל נתון | לא משתנה | לא משתנה |
| כפל כל נתון ב-k | נכפלת ב-k² | נכפלת ב-|k| |
✏️ דוגמה:
נתונים מקוריים: ממוצע = 50, סט"ת = 10
- מוסיפים 20 לכל נתון → ממוצע = 70, סט"ת = 10 (לא השתנה)
- כופלים כל נתון ב-3 → ממוצע = 150, סט"ת = 30 (נכפל ב-3)
💡 טיפים למבחן
טווח: max - min
שונות: ממוצע ריבועי הסטיות
סט"ת: שורש השונות
הוספה: לא משנה סט"ת
📝 סיכום דף 7
טווח = max - min
\(S^2 = \frac{\sum(x-\bar{x})^2}{n}\) | \(S = \sqrt{S^2}\)