התפלגות הדגימה ומשפט הגבול המרכזי

התפלגות הדגימה ומשפט הגבול המרכזי

מושגים בסיסיים - אוכלוסייה, מדגם, פרמטר וסטטיסטי

🎯 למה אנחנו צריכים את זה?

בעולם האמיתי, לעיתים רחוקות יש לנו גישה לכל האוכלוסייה. למשל:

  • אי אפשר לשאול את כל הבוחרים במדינה למי יצביעו
  • אי אפשר לבדוק את כל המוצרים במפעל (זה יהרוס אותם)
  • אי אפשר למדוד את כל הדגים באוקיינוס

הפתרון: לוקחים מדגם (תת-קבוצה) ומסיקים ממנו על האוכלוסייה כולה!

📊 תצפית (ערך)

הגדרה: תוצאת המדידה של המשתנה - הערכים שהמשתנה מקבל.

סימון: תצפית של המשתנה X מסומנת ב-\(X_i\) כאשר האינדקס i משמש לזיהוי התצפית.

✏️ דוגמה: \(X_i\) = מספר ילדים במשפחה ה-i

\(X_7 = 3\) → במשפחה מספר 7 יש 3 ילדים

🔢 מדדים מספריים עבור משתנים כמותיים

סימון משמעות
\(n\) מספר התצפיות (גודל המדגם)
\(X_1, X_2, ..., X_n\) n תצפיות לפי סדר הגעתן
\(\sum_{i=1}^{n} X_i\) סכום התצפיות
\(\sum_{i=1}^{n} X_i^2\) סכום ריבועי התצפיות

🌍 אוכלוסייה (Population)

הגדרה: אוסף של כל הפרטים שעונים על קריטריון מסוים.

✏️ דוגמאות:

  • כל תלמידי התיכון בארץ
  • נשים מעל גיל 35
  • משפחות שבהן לפחות 5 ילדים
  • כל המוצרים שיוצרו במפעל מסוים

💡 שימו לב: האוכלוסייה מוגדרת לפי השאלה שאנחנו רוצים לענות עליה!

🎲 מדגם (Sample)

הגדרה: תת-קבוצה (קבוצה חלקית) של האוכלוסייה שנבחרה, ועל-פי הנתונים שלה יבוצע מחקר סטטיסטי במטרה להסיק מסקנות על האוכלוסייה.

סימון: מדגם בגודל n של המשתנה X מסומן ע"י: \(X_1, X_2, X_3, ..., X_n\)

אוכלוסייה מדגם

💡 חשוב: אוכלוסייה ומדגם הם מושגים יחסיים - אותה קבוצה יכולה להיות אוכלוסייה או מדגם!

⚖️ פרמטר לעומת סטטיסטי - ההבדל המכריע!

פרמטר (Parameter)

הגדרה: תכונה של האוכלוסייה.

מאפיינים:

  • ערך קבוע ובדיד
  • לא תלוי במדגם
  • מאפיין את האוכלוסייה
  • בדרך כלל לא ידוע לנו

סימון: אותיות יווניות (θ, μ, σ, P)

סטטיסטי (Statistic)

הגדרה: תכונה של המדגם.

מאפיינים:

  • ערך משתנה ממדגם למדגם
  • תלוי במדגם שנבחר
  • משתנה מקרי (יש לו התפלגות)
  • ידוע לנו (מחושב מהמדגם)

סימון: אותיות לטיניות עם כובע \((\hat{\theta}, \bar{X}, S, \hat{P})\)

📋 טבלת השוואה: פרמטר מול סטטיסטי

המדד פרמטר (אוכלוסייה) סטטיסטי (מדגם)
ממוצע \(\mu = E(X)\)
(תוחלת)
\(\bar{X} = \frac{\sum X_i}{n}\)
(ממוצע מדגם)
שונות \(\sigma^2 = V(X_i)\)
(שונות של מ"מ)
\(S^2 = \frac{\sum(X_i - \bar{X})^2}{n-1}\)
(שונות מדגם)
סטיית תקן \(\sigma\) \(S\)
פרופורציה \(P\)
(פרופורציה באוכלוסייה)
\(\hat{P}\)
(פרופורציה במדגם)

💡 למה הסטטיסטי הוא משתנה מקרי?

הפרמטר הוא ערך קבוע - הוא מאפיין את כל האוכלוסייה ולא משתנה.

הסטטיסטי תלוי במדגם שנבחר. כל פעם שנדגום מדגם חדש, נקבל ערך אחר!

✏️ דוגמה:

נניח שממוצע הגובה באוכלוסייה הוא μ = 170 ס"מ (פרמטר קבוע).

אם נדגום 30 אנשים:

  • מדגם ראשון: \(\bar{X}_1 = 168.5\) ס"מ
  • מדגם שני: \(\bar{X}_2 = 171.2\) ס"מ
  • מדגם שלישי: \(\bar{X}_3 = 169.8\) ס"מ

הסטטיסטים משתנים ממדגם למדגם → יש להם התפלגות!

📈 התפלגות הדגימה (Sampling Distribution)

הגדרה: התפלגות של סטטיסטי מסוים על פני כל המדגמים האפשריים בגודל n.

💡 הסבר:

התפלגות הדגימה היא כלי שמאפשר ללמוד ממדדי המדגם (הסטטיסטים) על תכונות באוכלוסייה (הפרמטרים).

בתהליך ההסקה הסטטיסטית:

אנו מעוניינים ללמוד מתוך הסטטיסטים המחושבים במדגם על הפרמטרים של האוכלוסייה או של המשתנה המקרי.

📝 סיכום

אוכלוסייה = כל הפרטים | מדגם = תת-קבוצה

פרמטר = תכונת אוכלוסייה (קבוע, לא ידוע)

סטטיסטי = תכונת מדגם (משתנה מקרי, ידוע)

התפלגות דגימה = התפלגות הסטטיסטי על פני כל המדגמים