סטטיסטיקה מדדי פיזור

סטטיסטיקה

דף 7: מדדי פיזור

📊 מהם מדדי פיזור?

מדדי פיזור מתארים עד כמה הנתונים מפוזרים או מרוכזים סביב המרכז.

למה זה חשוב?

קבוצה א' - מרוכזת ממוצע = 80 פיזור קטן קבוצה ב' - מפוזרת ממוצע = 80 פיזור גדול

שתי הקבוצות עם אותו ממוצע, אבל שונות לגמרי!

1️⃣ טווח (Range)

טווח = הערך הגדול ביותר פחות הערך הקטן ביותר

\(R = x_{max} - x_{min}\)

✏️ דוגמה:

ציונים: 65, 72, 78, 85, 92

\(R = 92 - 65 = 27\)

הטווח: 27

💡 יתרונות וחסרונות:

✅ יתרונות

  • פשוט לחישוב
  • קל להבנה

❌ חסרונות

  • רגיש לערכים קיצוניים
  • לא מתחשב בכל הנתונים

📐 סטייה מהממוצע

סטייה = המרחק של כל נתון מהממוצע

\(d_i = x_i - \bar{x}\)

✏️ דוגמה: נתונים: 4, 6, 8, 10, 12 (ממוצע = 8)

xᵢ סטייה (xᵢ - x̄)
4 4 - 8 = -4
6 6 - 8 = -2
8 8 - 8 = 0
10 10 - 8 = +2
12 12 - 8 = +4
סכום 0

⚠️ סכום הסטיות תמיד שווה 0!

לכן לא ניתן להשתמש בו כמדד פיזור...

2️⃣ שונות (Variance)

שונות = ממוצע של ריבועי הסטיות

(מרבעים כדי להיפטר מהסימנים השליליים)

📋 נוסחאות השונות:

סוג נתונים נוסחה
נתונים גולמיים \(S^2 = \frac{\sum (x_i - \bar{x})^2}{n}\)
טבלת שכיחויות \(S^2 = \frac{\sum f_i(x_i - \bar{x})^2}{n}\)
נוסחה מקוצרת \(S^2 = \frac{\sum x_i^2}{n} - \bar{x}^2\)

✏️ דוגמה: נתונים: 4, 6, 8, 10, 12 (ממוצע = 8)

xᵢ xᵢ - x̄ (xᵢ - x̄)²
4 -4 16
6 -2 4
8 0 0
10 +2 4
12 +4 16
סכום 40

\(S^2 = \frac{40}{5} = 8\)

השונות: 8

3️⃣ סטיית תקן (Standard Deviation)

סטיית תקן = שורש השונות

(מחזירה את היחידות המקוריות)

\(S = \sqrt{S^2} = \sqrt{\frac{\sum (x_i - \bar{x})^2}{n}}\)

✏️ המשך הדוגמה:

\(S = \sqrt{8} = 2.83\)

סטיית התקן: 2.83

💡 מה אומרת סטיית תקן?

  • סט"ת קטנה → הנתונים קרובים לממוצע (מרוכזים)
  • סט"ת גדולה → הנתונים רחוקים מהממוצע (מפוזרים)
  • סט"ת = 0 → כל הנתונים שווים!

✏️ דוגמה מלאה - מטבלת שכיחויות

מספר אחים של 20 תלמידים:

x f x·f x - x̄ (x - x̄)² f(x - x̄)²
0 2 0 -1.5 2.25 4.5
1 8 8 -0.5 0.25 2
2 6 12 0.5 0.25 1.5
3 4 12 1.5 2.25 9
סה"כ 20 30     17

ממוצע: \(\bar{x} = \frac{30}{20} = 1.5\)

שונות: \(S^2 = \frac{17}{20} = 0.85\)

סטיית תקן: \(S = \sqrt{0.85} = 0.92\)

📋 תכונות השונות וסטיית התקן

פעולה השפעה על השונות השפעה על סט"ת
הוספת k לכל נתון לא משתנה לא משתנה
כפל כל נתון ב-k נכפלת ב-k² נכפלת ב-|k|

✏️ דוגמה:

נתונים מקוריים: ממוצע = 50, סט"ת = 10

  • מוסיפים 20 לכל נתון → ממוצע = 70, סט"ת = 10 (לא השתנה)
  • כופלים כל נתון ב-3 → ממוצע = 150, סט"ת = 30 (נכפל ב-3)

💡 טיפים למבחן

טווח: max - min

שונות: ממוצע ריבועי הסטיות

סט"ת: שורש השונות

הוספה: לא משנה סט"ת

📝 סיכום דף 7

טווח = max - min

\(S^2 = \frac{\sum(x-\bar{x})^2}{n}\) | \(S = \sqrt{S^2}\)