סטטיסטיקה: מדדי מרכז ופיזור - מדדי פיזור
הסבר מלא, דוגמאות פתורות ותרגול.
📖 סטטיסטיקה: מדדי מרכז ופיזור - מדדי פיזור
📏 מדדי פיזור (Dispersion Measures)
מדדי פיזור מתארים עד כמה הנתונים מפוזרים סביב המרכז. ככל שהפיזור גדול יותר, הנתונים יותר מגוונים.
📐 1. טווח (Range)
R = x_max − x_min
R = 30 − 12 = 18
📊 2. שונות (Variance) - s²
היא מראה כמה הנתונים "מרוחקים" בממוצע מהמרכז.
s² = Σ(xᵢ − x̄)² / (n−1) = [Σxᵢ² − (Σxᵢ)²/n] / (n−1)
שלבי החישוב:
| xᵢ | x̄ | xᵢ − x̄ | (xᵢ − x̄)² |
|---|---|---|---|
| 2 | 6 | −4 | 16 |
| 4 | 6 | −2 | 4 |
| 6 | 6 | 0 | 0 |
| 8 | 6 | +2 | 4 |
| 10 | 6 | +4 | 16 |
| סכום | 40 | ||
s² = 40 / (5−1) = 40/4 = 10
📉 3. סטיית תקן (Standard Deviation) - s
s = √s² = √[Σ(xᵢ − x̄)² / (n−1)]
s = √10 = 3.16
• השונות נמדדת ביחידות בריבוע (למשל: מטר²)
• סטיית התקן נמדדת באותן יחידות כמו הנתונים - קל יותר לפרש!
🔄 נוסחת הקיצור לשונות
או: s² = [Σxᵢ² − n·x̄²] / (n−1)
Σxᵢ = 2+4+6+8+10 = 30
Σxᵢ² = 4+16+36+64+100 = 220
n = 5
s² = [220 − (30)²/5] / (5−1) = [220 − 180] / 4 = 40/4 = 10 ✓
📊 4. מקדם שונות (CV)
תינוקות: x̄ = 4 ק"ג, s = 0.8 ק"ג → CV = 0.8/4 × 100 = 20%
מבוגרים: x̄ = 70 ק"ג, s = 10 ק"ג → CV = 10/70 × 100 = 14.3%
מסקנה: הפיזור היחסי גדול יותר אצל תינוקות!
📈 5. טרנספורמציה לינארית
• הוספת קבוע (a) לא משנה את מדדי הפיזור
• כפל בקבוע (b) כן משנה - סט"ת נכפלת ב-|b|, שונות נכפלת ב-b²
📋 סיכום נוסחאות
| מדד | נוסחה | יחידות |
|---|---|---|
| טווח | R = x_max − x_min | כמו הנתונים |
| שונות מדגם | s² = Σ(xᵢ−x̄)² / (n−1) | יחידות² |
| סטיית תקן | s = √s² | כמו הנתונים |
| מקדם שונות | CV = s/x̄ × 100% | אחוזים (ללא יחידות) |
• אם מבקשים שונות - התשובה תהיה מספר גדול יחסית (ביחידות²)
• אם מבקשים סטיית תקן - התשובה תהיה שורש השונות
• תמיד בדקו: האם n או n−1 במכנה? (מדגם = n−1, אוכלוסייה = N)
OpenBook © 2025 © רוית הלפנבאום
דוגמאות פתורות
מהו הרעיון המרכזי של "מדד מיקום מרכזי" בסטטיסטיקה?
הצג פתרון
מדדי מיקום מרכזי (ממוצע, חציון, שכיח) לא עוסקים בפיזור או בקיצוניות, אלא בשאלה: מהו הערך שמייצג את מרכז הנתונים או את הערך האופייני להם. הם עוזרים לנו לסכם קבוצת נתונים גדולה למספר אחד שמספר את "סיפור המרכז".
מהו ממוצע חשבוני (Arithmetic Mean) של סדרת נתונים?
הצג פתרון
הממוצע החשבוני מחושב על ידי סכימה של כל הערכים וחלוקה במספרם. זהו ערך "נקודת האיזון" – אם נחשוב על הנתונים כמשקולות על קו, הממוצע הוא המקום שבו הקו מאוזן. הוא מתחשב בכל הערכים ולכן רגיש לערכים חריגים.
מהו חציון (Median) של סדרת נתונים?
הצג פתרון
כדי למצוא חציון, קודם מסדרים את הנתונים מהקטן לגדול. לאחר מכן מחפשים את הערך שנמצא באמצע. החציון אינו מתחשב בגודל המדויק של כל הערכים אלא במיקומם, ולכן הוא פחות רגיש לערכים קיצוניים.
תרגול עכשיו
צרו שאלה חדשה אקראית ובדקו את עצמכם.