סטטיסטיקה - אחוזונים רבעונים
סטטיסטיקה
דף 8: אחוזונים ורבעונים
📊 מהו אחוזון?
אחוזון k (מסומן \(P_k\)) הוא הערך שמתחתיו נמצאים k אחוז מהנתונים.
✏️ דוגמאות:
- \(P_{25}\) = הערך שמתחתיו 25% מהנתונים
- \(P_{50}\) = הערך שמתחתיו 50% מהנתונים = החציון!
- \(P_{90}\) = הערך שמתחתיו 90% מהנתונים
📊 רבעונים (Quartiles)
רבעונים מחלקים את הנתונים ל-4 חלקים שווים (25% כל אחד).
| רבעון | סימון | שווה ל... | משמעות |
|---|---|---|---|
| רבעון תחתון | \(Q_1\) | \(P_{25}\) | 25% מתחת |
| רבעון אמצעי | \(Q_2\) | \(P_{50}\) = חציון | 50% מתחת |
| רבעון עליון | \(Q_3\) | \(P_{75}\) | 75% מתחת |
🔢 חישוב רבעונים - נתונים בדידים
שיטה:
- מסדרים את הנתונים מקטן לגדול
- מוצאים את מיקום הרבעון: \(\frac{k(n+1)}{4}\)
- אם המיקום שלם - זה הערך. אם לא - ממוצע משוקלל
✏️ דוגמה: 11 ציונים (מסודרים):
55, 60, 65, 70, 72, 75, 78, 82, 85, 90, 95
(n = 11)
Q₁ (רבעון תחתון):
מיקום = \(\frac{1 \times 12}{4} = 3\)
Q₁ = 65 (הערך במיקום 3)
Q₂ (חציון):
מיקום = \(\frac{2 \times 12}{4} = 6\)
Q₂ = 75 (הערך במיקום 6)
Q₃ (רבעון עליון):
מיקום = \(\frac{3 \times 12}{4} = 9\)
Q₃ = 85 (הערך במיקום 9)
✏️ דוגמה עם מיקום לא שלם: 10 נתונים
50, 55, 60, 65, 70, 75, 80, 85, 90, 95
Q₁:
מיקום = \(\frac{1 \times 11}{4} = 2.75\)
Q₁ בין מיקום 2 (55) למיקום 3 (60)
\(Q_1 = 55 + 0.75 \times (60-55) = 55 + 3.75 = 58.75\)
📊 חישוב רבעונים - נתונים מקובצים
נוסחת אינטרפולציה (דומה לחציון):
\(Q_k = L + \frac{\frac{kn}{4} - F_{prev}}{f_Q} \cdot h\)
✏️ דוגמה: ציוני 40 תלמידים
| קבוצה | f | F |
|---|---|---|
| 50-59 | 4 | 4 |
| 60-69 ← Q₁ | 8 | 12 |
| 70-79 | 12 | 24 |
| 80-89 ← Q₃ | 10 | 34 |
| 90-99 | 6 | 40 |
Q₁: מיקום = n/4 = 10
קבוצת Q₁: 60-69 (F = 12 מכיל את מיקום 10)
\(Q_1 = 59.5 + \frac{10 - 4}{8} \times 10 = 59.5 + 7.5 = 67\)
Q₃: מיקום = 3n/4 = 30
קבוצת Q₃: 80-89 (F = 34 מכיל את מיקום 30)
\(Q_3 = 79.5 + \frac{30 - 24}{10} \times 10 = 79.5 + 6 = 85.5\)
📏 טווח בין-רבעוני (IQR)
טווח בין-רבעוני = ההפרש בין הרבעון העליון לתחתון
\(IQR = Q_3 - Q_1\)
💡 למה זה שימושי?
- מודד פיזור של 50% האמצעיים מהנתונים
- לא רגיש לערכים קיצוניים (בניגוד לטווח)
- משמש לזיהוי חריגים (outliers)
✏️ מהדוגמה הקודמת:
\(IQR = Q_3 - Q_1 = 85.5 - 67 = 18.5\)
תרשים קופסה (Box Plot):
🔍 זיהוי חריגים (Outliers)
כלל ה-1.5 × IQR:
ערך נחשב חריג אם הוא:
- קטן מ-\(Q_1 - 1.5 \times IQR\) (גבול תחתון)
- גדול מ-\(Q_3 + 1.5 \times IQR\) (גבול עליון)
✏️ דוגמה:
Q₁ = 67, Q₃ = 85.5, IQR = 18.5
גבול תחתון = 67 - 1.5 × 18.5 = 67 - 27.75 = 39.25
גבול עליון = 85.5 + 1.5 × 18.5 = 85.5 + 27.75 = 113.25
כל ציון מתחת ל-39.25 או מעל 113.25 הוא חריג!
📊 עשירונים (Deciles)
עשירונים מחלקים את הנתונים ל-10 חלקים שווים (10% כל אחד).
סימון: \(D_1, D_2, ..., D_9\)
- \(D_1 = P_{10}\) (10% מתחת)
- \(D_5 = P_{50}\) = חציון
- \(D_9 = P_{90}\) (90% מתחת)
💡 טיפים למבחן
Q₂ = חציון = P₅₀
IQR = Q₃ - Q₁
חריג: מחוץ ל-1.5×IQR
📝 סיכום דף 8
רבעונים מחלקים ל-4 חלקים: Q₁, Q₂, Q₃
IQR = Q₃ - Q₁ (עמיד לקיצוניים)