מדד ספירמן למשתנים סידוריים

סטטיסטיקה

מדד ספירמן למשתנים סידוריים

📊 מתי משתמשים בספירמן?

מתאם ספירמן (\(r_s\)) מודד קשר בין שני משתנים סידוריים (או משתנים שניתן לדרג).

💡 מתאים כאשר:

  • הנתונים הם דירוגים (מקום 1, 2, 3...)
  • משתנים סידוריים (נמוך/בינוני/גבוה)
  • הקשר מונוטוני אך לא בהכרח ליניארי
  • יש ערכים חריגים (ספירמן עמיד יותר מפירסון)

💡 הרעיון מאחורי ספירמן

ספירמן עובד על דירוגים, לא על הערכים המקוריים:

  1. ממירים כל משתנה לדירוגים (1, 2, 3, ...)
  2. מחשבים את ההפרש בין הדירוגים (\(d_i\))
  3. מדד הקשר מבוסס על הפרשי הדירוגים

איור: קשר מונוטוני (לא ליניארי)

X Y קשר מונוטוני עולה ספירמן יזהה!

📐 נוסחת ספירמן

כאשר אין דירוגים כפולים (קשרים):

\(r_s = 1 - \frac{6\sum d_i^2}{n(n^2-1)}\)

כאשר \(d_i = R_{X_i} - R_{Y_i}\) = ההפרש בין הדירוגים

💡 תכונות:

  • \(-1 \leq r_s \leq 1\)
  • \(r_s = 1\) → קשר מונוטוני עולה מושלם
  • \(r_s = -1\) → קשר מונוטוני יורד מושלם
  • \(r_s = 0\) → אין קשר מונוטוני

✏️ דוגמה מלאה

נתונים: 8 סטודנטים - שעות לימוד וציון במבחן

סטודנט שעות (X) ציון (Y) דירוג X דירוג Y d
A 2 55 1 1 0 0
B 4 62 2 2 0 0
C 5 70 3 4 -1 1
D 6 68 4 3 1 1
E 8 78 5 5 0 0
F 10 85 6 6 0 0
G 12 92 7 8 -1 1
H 15 88 8 7 1 1
סכום Σd² = 4

\(r_s = 1 - \frac{6 \times 4}{8(64-1)} = 1 - \frac{24}{8 \times 63} = 1 - \frac{24}{504} = 1 - 0.048 = 0.952\)

פרשנות: קשר חיובי חזק מאוד בין שעות לימוד לציון

🔗 טיפול בדירוגים כפולים (Ties)

כאשר יש ערכים זהים, נותנים להם את הדירוג הממוצע:

✏️ דוגמה:

נתונים: 15, 20, 20, 25, 30

15 → דירוג 1

20, 20 → תופסים מקומות 2 ו-3 → דירוג ממוצע: (2+3)/2 = 2.5

25 → דירוג 4

30 → דירוג 5

הדירוגים הסופיים: 1, 2.5, 2.5, 4, 5

✏️ דוגמה נוספת:

נתונים: 10, 20, 20, 20, 30

10 → דירוג 1

20, 20, 20 → תופסים מקומות 2, 3, 4 → דירוג ממוצע: (2+3+4)/3 = 3

30 → דירוג 5

הדירוגים הסופיים: 1, 3, 3, 3, 5

⚠️ שימו לב:

כשיש הרבה דירוגים כפולים, הנוסחה הפשוטה פחות מדויקת.

במקרה כזה, משתמשים בנוסחה מתוקנת או מחשבים מתאם פירסון על הדירוגים.

📊 פרשנות מתאם ספירמן

ערך |rs| עוצמת הקשר
0 - 0.2 זניח / אין קשר
0.2 - 0.4 חלש
0.4 - 0.6 בינוני
0.6 - 0.8 חזק
0.8 - 1.0 חזק מאוד

💡 הסימן חשוב:

  • rs > 0: קשר חיובי - כשאחד עולה, השני עולה
  • rs < 0: קשר שלילי - כשאחד עולה, השני יורד

⚖️ ספירמן מול פירסון

  ספירמן (rs) פירסון (r)
עובד על דירוגים ערכים מקוריים
מודד קשר מונוטוני (כללי) ליניארי בלבד
רגיש לחריגים פחות רגיש רגיש
סולם מדידה סידורי ומעלה רווחי/מנתי

💡 טיפים למבחן

דירוג 1 = הנמוך ביותר

זהים: דירוג ממוצע

נוסחה: \(1 - \frac{6\Sigma d^2}{n(n^2-1)}\)

📝 סיכום דף 10

\(r_s = 1 - \frac{6\sum d_i^2}{n(n^2-1)}\)

מודד קשר מונוטוני, עמיד לחריגים

טווח: [-1, 1]