מדדי פיזור - טווח, שונות וסטיית תקן
📏 מדדי פיזור - כמה הנתונים "מפוזרים"?
שתי כיתות עם ממוצע 80 יכולות להיות שונות לחלוטין! באחת כולם סביב 80, בשנייה יש גם 50 וגם 100. מדדי הפיזור אומרים לנו כמה הנתונים "מרוחקים" מהממוצע.
📊 השוואה ויזואלית
כיתה א - ממוצע 80, סטת = 5
75 | 77 | 79 | 80 | 81 | 83 | 85
📍 צפופים סביב הממוצע
כיתה ב - ממוצע 80, סטת = 15
50 | 65 | 75 | 80 | 85 | 95 | 110
📍 מפוזרים הרחק מהממוצע
🔢 המדדים
| מדד | הגדרה | יתרון/חיסרון |
|---|---|---|
| טווח | מקסימום - מינימום | פשוט, אבל מושפע מקיצוניים |
| טווח בין-רבעוני | Q3 - Q1 | ✅ עמיד לקיצוניים |
| שונות | ממוצע סטיות בריבוע | ביחידות בריבוע |
| סטיית תקן | √שונות | ✅ באותן יחידות כמו הנתונים |
🧮 נוסחאות השונות וסטיית התקן
שונות (אוכלוסייה)
\(\sigma^2 = \frac{\sum(x_i - \mu)^2}{N}\)
שונות (מדגם)
\(S^2 = \frac{\sum(x_i - \bar{x})^2}{n-1}\)
💡 למה n-1 במדגם?
כי כשמחשבים שונות מדגם, ה-x̄ כבר "מתאים את עצמו" לנתונים, אז השונות יוצאת קטנה מדי. חלוקה ב-n-1 מתקנת את זה.
🎯 ציון תקן (Z-score)
\(Z = \frac{x - \bar{x}}{S}\)
אומר לנו כמה סטיות תקן הערך רחוק מהממוצע.
- Z = 0 → בדיוק בממוצע
- Z = 1 → סטייה אחת מעל הממוצע
- Z = -2 → שתי סטיות מתחת לממוצע