סטטיסטיקה: מדדי מרכז ופיזור - מדדי פיזור

📏 מדדי פיזור (Dispersion Measures)

מדדי פיזור מתארים עד כמה הנתונים מפוזרים סביב המרכז. ככל שהפיזור גדול יותר, הנתונים יותר מגוונים.

השוואת פיזור - שתי קבוצות עם אותו ממוצע קבוצה A - פיזור קטן נתונים: 68, 70, 72, 74, 76 s = 3.16 קבוצה B - פיזור גדול נתונים: 50, 60, 72, 84, 94 s = 17.89

📐 1. טווח (Range)

טווח = ערך מקסימלי − ערך מינימלי

R = x_max − x_min
דוגמה: נתונים: 12, 15, 18, 22, 25, 30
R = 30 − 12 = 18
⚠️ חיסרון: הטווח מושפע רק משני ערכים קיצוניים ולא מהתפלגות שאר הנתונים.

📊 2. שונות (Variance) - s²

השונות מודדת את ממוצע ריבועי הסטיות מהממוצע.
היא מראה כמה הנתונים "מרוחקים" בממוצע מהמרכז.
שונות מדגם:

s² = Σ(xᵢ − x̄)² / (n−1) = [Σxᵢ² − (Σxᵢ)²/n] / (n−1)

שלבי החישוב:

שלב 1: חשבו את הממוצע x̄
שלב 2: חשבו את הסטייה של כל ערך מהממוצע: (xᵢ − x̄)
שלב 3: העלו כל סטייה בריבוע: (xᵢ − x̄)²
שלב 4: סכמו את כל הריבועים: Σ(xᵢ − x̄)²
שלב 5: חלקו ב-(n−1): s² = Σ(xᵢ − x̄)² / (n−1)
דוגמה מלאה: נתונים: 2, 4, 6, 8, 10
xᵢ xᵢ − x̄ (xᵢ − x̄)²
2 6 −4 16
4 6 −2 4
6 6 0 0
8 6 +2 4
10 6 +4 16
סכום 40
x̄ = (2+4+6+8+10)/5 = 30/5 = 6
s² = 40 / (5−1) = 40/4 = 10

📉 3. סטיית תקן (Standard Deviation) - s

סטיית תקן = √שונות

s = √s² = √[Σ(xᵢ − x̄)² / (n−1)]
בהמשך לדוגמה הקודמת:
s = √10 = 3.16
למה סטיית תקן?
• השונות נמדדת ביחידות בריבוע (למשל: מטר²)
• סטיית התקן נמדדת באותן יחידות כמו הנתונים - קל יותר לפרש!

🔄 נוסחת הקיצור לשונות

s² = [Σxᵢ² − (Σxᵢ)²/n] / (n−1)

או: s² = [Σxᵢ² − n·x̄²] / (n−1)
דוגמה עם נוסחת קיצור: נתונים: 2, 4, 6, 8, 10

Σxᵢ = 2+4+6+8+10 = 30
Σxᵢ² = 4+16+36+64+100 = 220
n = 5

s² = [220 − (30)²/5] / (5−1) = [220 − 180] / 4 = 40/4 = 10

📊 4. מקדם שונות (CV)

מקדם השונות מאפשר להשוות פיזור בין קבוצות עם יחידות שונות או ממוצעים שונים.
CV = (s / x̄) × 100%
דוגמה: השוואת פיזור משקל בין תינוקות למבוגרים:

תינוקות: x̄ = 4 ק"ג, s = 0.8 ק"ג → CV = 0.8/4 × 100 = 20%
מבוגרים: x̄ = 70 ק"ג, s = 10 ק"ג → CV = 10/70 × 100 = 14.3%

מסקנה: הפיזור היחסי גדול יותר אצל תינוקות!

📈 5. טרנספורמציה לינארית

כאשר מבצעים טרנספורמציה לינארית y = a + bx:
מדדי מרכז ממוצע: ȳ = a + b·x̄ חציון: Me_y = a + b·Me_x (מושפעים מ-a ומ-b) מדדי פיזור סט"ת: s_y = |b|·s_x שונות: s²_y = b²·s²_x (מושפעים רק מ-|b|, לא מ-a)
⚠️ חשוב לזכור:
• הוספת קבוע (a) לא משנה את מדדי הפיזור
• כפל בקבוע (b) כן משנה - סט"ת נכפלת ב-|b|, שונות נכפלת ב-b²

📋 סיכום נוסחאות

מדד נוסחה יחידות
טווח R = x_max − x_min כמו הנתונים
שונות מדגם s² = Σ(xᵢ−x̄)² / (n−1) יחידות²
סטיית תקן s = √s² כמו הנתונים
מקדם שונות CV = s/x̄ × 100% אחוזים (ללא יחידות)
💡 טיפ לבחינה:
• אם מבקשים שונות - התשובה תהיה מספר גדול יחסית (ביחידות²)
• אם מבקשים סטיית תקן - התשובה תהיה שורש השונות
• תמיד בדקו: האם n או n−1 במכנה? (מדגם = n−1, אוכלוסייה = N)

 

OpenBook © 2025 © רוית הלפנבאום