מדדי קשר מקדם המתאם של פירסון ורגרסיה
📈 מקדם המתאם של פירסון ורגרסיה
מקדם המתאם של פירסון (r) מודד את עוצמת וכיוון הקשר הליניארי בין שני משתנים רווחיים/מנתיים.
תחום הערכים: −1 ≤ r ≤ +1
📐 שונות משותפת (Covariance)
sₓᵧ = Σ(xᵢ − x̄)(yᵢ − ȳ) / (n−1)
או בנוסחה המקוצרת:
sₓᵧ = [Σxᵢyᵢ − (Σxᵢ·Σyᵢ)/n] / (n−1)
או בנוסחה המקוצרת:
sₓᵧ = [Σxᵢyᵢ − (Σxᵢ·Σyᵢ)/n] / (n−1)
השונות המשותפת מודדת את הכיוון של הקשר:
- sₓᵧ > 0 → קשר חיובי
- sₓᵧ < 0 → קשר שלילי
- sₓᵧ = 0 → אין קשר ליניארי
r נוסחת פירסון
r = sₓᵧ / (sₓ · sᵧ)
כאשר sₓ ו-sᵧ הן סטיות התקן של X ו-Y
כאשר sₓ ו-sᵧ הן סטיות התקן של X ו-Y
📏 קו הניבויים (רגרסיה)
קו הניבויים (קו הרגרסיה) הוא הישר שמתאר בצורה הטובה ביותר את הקשר הליניארי בין X ל-Y.
משוואת הישר: ŷ = a + bx
שיפוע הישר: b = r · (sᵧ / sₓ)
חותך: a = ȳ − b·x̄
חותך: a = ȳ − b·x̄
📊 מקדם הקביעה (R²)
R² = r²
R² מייצג את אחוז השונות של Y המוסברת ע"י X
R² מייצג את אחוז השונות של Y המוסברת ע"י X
דוגמה: אם r = 0.8, אז R² = 0.64
פירוש: 64% מהשונות בציוני Y מוסברת ע"י הקשר עם X.
36% הנותרים מוסברים ע"י גורמים אחרים.
פירוש: 64% מהשונות בציוני Y מוסברת ע"י הקשר עם X.
36% הנותרים מוסברים ע"י גורמים אחרים.
🔢 שונות הניבויים ושונות הטעויות
שונות כוללת = שונות הניבויים + שונות הטעויות
sᵧ² = s²ŷ + s²ₑ
sᵧ² = s²ŷ + s²ₑ
| רכיב | נוסחה | משמעות |
|---|---|---|
| שונות הניבויים | s²ŷ = r² · sᵧ² | החלק המוסבר ע"י X |
| שונות הטעויות | s²ₑ = (1 − r²) · sᵧ² | החלק הלא מוסבר |
⚠️ נקודות חשובות
- קורלציה ≠ סיבתיות: קשר חזק לא מוכיח שX גורם ל-Y!
- r מודד רק קשר ליניארי: יכול להיות קשר לא ליניארי חזק עם r=0
- רגיש לערכים חריגים: Outliers יכולים לשנות r משמעותית
- התפלגות נורמלית: לבדיקת מובהקות צריך התפלגות נורמלית
📋 השוואת מדדי קשר
| מדד | סוג משתנים | סוג קשר | תחום |
|---|---|---|---|
| למדה (λ) | שמיים | כללי | 0 עד 1 |
| קרמר (V) | שמיים | כללי | 0 עד 1 |
| ספירמן (rₛ) | סידוריים | מונוטוני | -1 עד +1 |
| פירסון (r) | רווחיים/מנתיים | ליניארי | -1 עד +1 |
OpenBook © 2025 © רוית הלפנבאום