מדדי קשר למשתנים רווחיים - אטא ופירסון
הסבר מלא, דוגמאות פתורות ותרגול.
📖 מדדי קשר למשתנים רווחיים - אטא ופירסון
סטטיסטיקה
מדדי קשר למשתנים רווחיים - אטא ופירסון
📊 סוגי קשר בין משתנים רווחיים
כשעובדים עם משתנים רווחיים/מנתיים, יש שני סוגי קשר עיקריים:
🔄
קשר לא-קווי
מדד: אטא (η)
📈
קשר קווי
מדד: פירסון (r)
η מדד אטא (Eta) - קשר לא-קווי
אטא מודד את עוצמת הקשר ללא הנחה על צורתו.
מבוסס על יחס השונויות - כמה מהשונות ב-Y מוסברת על-ידי X
📐 הנוסחה:
\(\eta^2 = \frac{SS_{between}}{SS_{total}} = \frac{\sum n_j(\bar{Y}_j - \bar{Y})^2}{\sum(Y_i - \bar{Y})^2}\)
\(\eta = \sqrt{\eta^2}\)
💡 הסבר המרכיבים:
- \(SS_{total}\) = שונות כוללת של Y (סכום ריבועי סטיות מהממוצע הכולל)
- \(SS_{between}\) = שונות בין הקבוצות (הנובעת מ-X)
- \(\bar{Y}_j\) = ממוצע Y בקבוצה j
- \(\bar{Y}\) = ממוצע Y הכולל
- \(n_j\) = גודל קבוצה j
💡 תכונות:
- \(0 \leq \eta \leq 1\)
- \(\eta = 0\) → אין קשר כלל
- \(\eta = 1\) → קשר מושלם (לא בהכרח קווי!)
- \(\eta^2\) = אחוז השונות המוסברת
- לא סימטרי: \(\eta_{Y|X} \neq \eta_{X|Y}\)
✏️ דוגמה: השפעת סוג דשן (A, B, C) על יבול
| דשן A | דשן B | דשן C |
|---|---|---|
| 20, 22, 24 | 30, 32, 34 | 25, 27, 29 |
| \(\bar{Y}_A = 22\) | \(\bar{Y}_B = 32\) | \(\bar{Y}_C = 27\) |
ממוצע כולל: \(\bar{Y} = \frac{20+22+24+30+32+34+25+27+29}{9} = 27\)
SSbetween:
\(= 3(22-27)^2 + 3(32-27)^2 + 3(27-27)^2\)
\(= 3(25) + 3(25) + 3(0) = 75 + 75 + 0 = 150\)
SStotal:
\(= (20-27)^2 + (22-27)^2 + ... + (29-27)^2\)
\(= 49 + 25 + 9 + 9 + 25 + 49 + 4 + 0 + 4 = 174\)
\(\eta^2 = \frac{150}{174} = 0.862\)
\(\eta = \sqrt{0.862} = 0.928\)
פרשנות: קשר חזק מאוד. סוג הדשן מסביר 86.2% מהשונות ביבול.
r מדד פירסון (Pearson) - קשר קווי
מתאם פירסון מודד את עוצמת וכיוון הקשר הקווי בין שני משתנים.
המדד הנפוץ ביותר למדידת קשר!
📐 הנוסחאות:
נוסחה עם שונות משותפת (קוואריאנס):
\(r = \frac{Cov(X,Y)}{S_X \cdot S_Y} = \frac{\sum(X_i - \bar{X})(Y_i - \bar{Y})}{n \cdot S_X \cdot S_Y}\)
נוסחה ישירה:
\(r = \frac{n\sum X_iY_i - \sum X_i \sum Y_i}{\sqrt{[n\sum X_i^2 - (\sum X_i)^2][n\sum Y_i^2 - (\sum Y_i)^2]}}\)
💡 תכונות:
- \(-1 \leq r \leq 1\)
- \(r = 1\) → קשר קווי חיובי מושלם
- \(r = -1\) → קשר קווי שלילי מושלם
- \(r = 0\) → אין קשר קווי (יכול להיות קשר אחר!)
- סימטרי: \(r_{XY} = r_{YX}\)
- \(r^2\) = מקדם הקביעה (אחוז השונות המוסברת)
✏️ דוגמה מלאה - חישוב פירסון
נתונים: שעות לימוד (X) וציון במבחן (Y) של 6 סטודנטים
| i | X | Y | X² | Y² | XY |
|---|---|---|---|---|---|
| 1 | 2 | 50 | 4 | 2500 | 100 |
| 2 | 4 | 60 | 16 | 3600 | 240 |
| 3 | 5 | 65 | 25 | 4225 | 325 |
| 4 | 6 | 70 | 36 | 4900 | 420 |
| 5 | 8 | 80 | 64 | 6400 | 640 |
| 6 | 10 | 90 | 100 | 8100 | 900 |
| Σ | 35 | 415 | 245 | 29725 | 2625 |
n = 6
מונה:
\(n\sum XY - \sum X \sum Y = 6 \times 2625 - 35 \times 415 = 15750 - 14525 = 1225\)
מכנה:
\(n\sum X^2 - (\sum X)^2 = 6 \times 245 - 35^2 = 1470 - 1225 = 245\)
\(n\sum Y^2 - (\sum Y)^2 = 6 \times 29725 - 415^2 = 178350 - 172225 = 6125\)
\(\sqrt{245 \times 6125} = \sqrt{1500625} = 1225\)
\(r = \frac{1225}{1225} = 1.0\)
פרשנות: קשר קווי חיובי מושלם! (הנתונים נבחרו כך)
📊 פרשנות מתאם פירסון
| ערך |r| | עוצמת הקשר |
|---|---|
| 0 - 0.2 | זניח / אין קשר |
| 0.2 - 0.4 | חלש |
| 0.4 - 0.6 | בינוני |
| 0.6 - 0.8 | חזק |
| 0.8 - 1.0 | חזק מאוד |
איור: דוגמאות למתאמים שונים
r² מקדם הקביעה (Coefficient of Determination)
r² מבטא את אחוז השונות במשתנה אחד המוסבר על-ידי הקשר עם המשתנה השני.
✏️ דוגמה:
אם r = 0.8, אז r² = 0.64
פרשנות: 64% מהשונות ב-Y מוסברת על-ידי הקשר הקווי עם X.
36% מהשונות נובעת מגורמים אחרים.
⚖️ השוואה: אטא מול פירסון
| אטא (η) | פירסון (r) | |
|---|---|---|
| סוג קשר | כל קשר | קווי בלבד |
| טווח | [0, 1] | [-1, 1] |
| סימטרי? | לא | כן |
| מראה כיוון? | לא | כן (+ או -) |
| יחס ביניהם | \(\eta \geq |r|\) תמיד! | |
💡 מתי η > |r|?
כשהקשר לא קווי. ההפרש מעיד על רכיב לא-קווי בקשר.
💡 טיפים למבחן
קשר קווי: פירסון
קשר כללי: אטא
r² = אחוז מוסבר
תמיד: η ≥ |r|
📝 סיכום דף 11
אטא (η): קשר כללי, [0,1], לא סימטרי
פירסון (r): קשר קווי, [-1,1], סימטרי
r² = מקדם הקביעה = אחוז השונות המוסברת
דוגמאות פתורות
📘 מהו מתאם בין שני משתנים?
כאשר מדברים על מתאם בין שני משתנים כמותיים (למשל שעות לימוד וציון), למה מתכוונים?
הצג פתרון
מתאם מתאר עד כמה כאשר ערכים של משתנה אחד משתנים, גם הערכים של המשתנה השני נוטים להשתנות בצורה קווית. הוא אומר לנו:
- האם כשאחד עולה, השני נוטה לעלות (חיובי) או לרדת (שלילי).
- כמה חזקה ההתאמה הזו.
הוא לא אומר שום דבר ישירות על ממוצעים או על סיבתיות.
📏 מהו מקדם מתאם פירסון r?
הצג פתרון
r של פירסון הוא מדד קשר קווי:
- תמיד בין -1 ל+1.
- הסימן (+ או -) אומר את הכיוון.
- הערך המוחלט (המרחק מאפס) אומר את החוזק.
📚 טווח אפשרי של r:
איזה טווח ערכים אפשרי למקדם מתאם פירסון r?
הצג פתרון
תמיד מתקיים -1 ≤ r ≤ 1.
- r = 1 קשר קווי חיובי מושלם.
- r = -1 קשר קווי שלילי מושלם.
- r = 0 אין קשר קווי.
תרגול עכשיו
צרו שאלה חדשה אקראית ובדקו את עצמכם.