מדדי קשר מקדם המתאם של פירסון ורגרסיה

📈 מקדם המתאם של פירסון ורגרסיה

מקדם המתאם של פירסון (r) מודד את עוצמת וכיוון הקשר הליניארי בין שני משתנים רווחיים/מנתיים.

תחום הערכים: −1 ≤ r ≤ +1

קשר ליניארי חיובי r ≈ +1 קשר ליניארי שלילי r ≈ -1 אין קשר ליניארי r ≈ 0

📐 שונות משותפת (Covariance)

sₓᵧ = Σ(xᵢ − x̄)(yᵢ − ȳ) / (n−1)

או בנוסחה המקוצרת:
sₓᵧ = [Σxᵢyᵢ − (Σxᵢ·Σyᵢ)/n] / (n−1)

השונות המשותפת מודדת את הכיוון של הקשר:

  • sₓᵧ > 0 → קשר חיובי
  • sₓᵧ < 0 → קשר שלילי
  • sₓᵧ = 0 → אין קשר ליניארי

r נוסחת פירסון

r = sₓᵧ / (sₓ · sᵧ)

כאשר sₓ ו-sᵧ הן סטיות התקן של X ו-Y

📏 קו הניבויים (רגרסיה)

קו הניבויים (קו הרגרסיה) הוא הישר שמתאר בצורה הטובה ביותר את הקשר הליניארי בין X ל-Y.

משוואת הישר: ŷ = a + bx

שיפוע הישר: b = r · (sᵧ / sₓ)

חותך: a = ȳ − b·x̄
X Y ŷ = a + bx (קו הניבויים) שגיאה (e)

📊 מקדם הקביעה (R²)

R² = r²

R² מייצג את אחוז השונות של Y המוסברת ע"י X
דוגמה: אם r = 0.8, אז R² = 0.64
פירוש: 64% מהשונות בציוני Y מוסברת ע"י הקשר עם X.
36% הנותרים מוסברים ע"י גורמים אחרים.

🔢 שונות הניבויים ושונות הטעויות

שונות כוללת = שונות הניבויים + שונות הטעויות

sᵧ² = s²ŷ + s²ₑ
רכיב נוסחה משמעות
שונות הניבויים s²ŷ = r² · sᵧ² החלק המוסבר ע"י X
שונות הטעויות s²ₑ = (1 − r²) · sᵧ² החלק הלא מוסבר

⚠️ נקודות חשובות

  • קורלציה ≠ סיבתיות: קשר חזק לא מוכיח שX גורם ל-Y!
  • r מודד רק קשר ליניארי: יכול להיות קשר לא ליניארי חזק עם r=0
  • רגיש לערכים חריגים: Outliers יכולים לשנות r משמעותית
  • התפלגות נורמלית: לבדיקת מובהקות צריך התפלגות נורמלית

📋 השוואת מדדי קשר

מדד סוג משתנים סוג קשר תחום
למדה (λ) שמיים כללי 0 עד 1
קרמר (V) שמיים כללי 0 עד 1
ספירמן (rₛ) סידוריים מונוטוני -1 עד +1
פירסון (r) רווחיים/מנתיים ליניארי -1 עד +1

OpenBook © 2025 © רוית הלפנבאום