סטטיסטיקה - אחוזונים רבעונים

סטטיסטיקה

דף 8: אחוזונים ורבעונים

📊 מהו אחוזון?

אחוזון k (מסומן \(P_k\)) הוא הערך שמתחתיו נמצאים k אחוז מהנתונים.

✏️ דוגמאות:

  • \(P_{25}\) = הערך שמתחתיו 25% מהנתונים
  • \(P_{50}\) = הערך שמתחתיו 50% מהנתונים = החציון!
  • \(P_{90}\) = הערך שמתחתיו 90% מהנתונים
0% P₂₅ 25% P₅₀ = חציון 50% P₇₅ 75% 100%

📊 רבעונים (Quartiles)

רבעונים מחלקים את הנתונים ל-4 חלקים שווים (25% כל אחד).

רבעון סימון שווה ל... משמעות
רבעון תחתון \(Q_1\) \(P_{25}\) 25% מתחת
רבעון אמצעי \(Q_2\) \(P_{50}\) = חציון 50% מתחת
רבעון עליון \(Q_3\) \(P_{75}\) 75% מתחת
25% 25% 25% 25% min Q₁ Q₂ Q₃ max

🔢 חישוב רבעונים - נתונים בדידים

שיטה:

  1. מסדרים את הנתונים מקטן לגדול
  2. מוצאים את מיקום הרבעון: \(\frac{k(n+1)}{4}\)
  3. אם המיקום שלם - זה הערך. אם לא - ממוצע משוקלל

✏️ דוגמה: 11 ציונים (מסודרים):

55, 60, 65, 70, 72, 75, 78, 82, 85, 90, 95

(n = 11)

Q₁ (רבעון תחתון):

מיקום = \(\frac{1 \times 12}{4} = 3\)

Q₁ = 65 (הערך במיקום 3)

Q₂ (חציון):

מיקום = \(\frac{2 \times 12}{4} = 6\)

Q₂ = 75 (הערך במיקום 6)

Q₃ (רבעון עליון):

מיקום = \(\frac{3 \times 12}{4} = 9\)

Q₃ = 85 (הערך במיקום 9)

✏️ דוגמה עם מיקום לא שלם: 10 נתונים

50, 55, 60, 65, 70, 75, 80, 85, 90, 95

Q₁:

מיקום = \(\frac{1 \times 11}{4} = 2.75\)

Q₁ בין מיקום 2 (55) למיקום 3 (60)

\(Q_1 = 55 + 0.75 \times (60-55) = 55 + 3.75 = 58.75\)

📊 חישוב רבעונים - נתונים מקובצים

נוסחת אינטרפולציה (דומה לחציון):

\(Q_k = L + \frac{\frac{kn}{4} - F_{prev}}{f_Q} \cdot h\)

✏️ דוגמה: ציוני 40 תלמידים

קבוצה f F
50-59 4 4
60-69 ← Q₁ 8 12
70-79 12 24
80-89 ← Q₃ 10 34
90-99 6 40

Q₁: מיקום = n/4 = 10

קבוצת Q₁: 60-69 (F = 12 מכיל את מיקום 10)

\(Q_1 = 59.5 + \frac{10 - 4}{8} \times 10 = 59.5 + 7.5 = 67\)

Q₃: מיקום = 3n/4 = 30

קבוצת Q₃: 80-89 (F = 34 מכיל את מיקום 30)

\(Q_3 = 79.5 + \frac{30 - 24}{10} \times 10 = 79.5 + 6 = 85.5\)

📏 טווח בין-רבעוני (IQR)

טווח בין-רבעוני = ההפרש בין הרבעון העליון לתחתון

\(IQR = Q_3 - Q_1\)

💡 למה זה שימושי?

  • מודד פיזור של 50% האמצעיים מהנתונים
  • לא רגיש לערכים קיצוניים (בניגוד לטווח)
  • משמש לזיהוי חריגים (outliers)

✏️ מהדוגמה הקודמת:

\(IQR = Q_3 - Q_1 = 85.5 - 67 = 18.5\)

תרשים קופסה (Box Plot):

min Q₁ Q₂ Q₃ max IQR

🔍 זיהוי חריגים (Outliers)

כלל ה-1.5 × IQR:

ערך נחשב חריג אם הוא:

  • קטן מ-\(Q_1 - 1.5 \times IQR\) (גבול תחתון)
  • גדול מ-\(Q_3 + 1.5 \times IQR\) (גבול עליון)

✏️ דוגמה:

Q₁ = 67, Q₃ = 85.5, IQR = 18.5

גבול תחתון = 67 - 1.5 × 18.5 = 67 - 27.75 = 39.25

גבול עליון = 85.5 + 1.5 × 18.5 = 85.5 + 27.75 = 113.25

כל ציון מתחת ל-39.25 או מעל 113.25 הוא חריג!

📊 עשירונים (Deciles)

עשירונים מחלקים את הנתונים ל-10 חלקים שווים (10% כל אחד).

סימון: \(D_1, D_2, ..., D_9\)

  • \(D_1 = P_{10}\) (10% מתחת)
  • \(D_5 = P_{50}\) = חציון
  • \(D_9 = P_{90}\) (90% מתחת)

💡 טיפים למבחן

Q₂ = חציון = P₅₀

IQR = Q₃ - Q₁

חריג: מחוץ ל-1.5×IQR

📝 סיכום דף 8

רבעונים מחלקים ל-4 חלקים: Q₁, Q₂, Q₃

IQR = Q₃ - Q₁ (עמיד לקיצוניים)