התפלגות הדגימה ומשפט הגבול המרכזי
התפלגות הדגימה ומשפט הגבול המרכזי
מושגים בסיסיים - אוכלוסייה, מדגם, פרמטר וסטטיסטי
🎯 למה אנחנו צריכים את זה?
בעולם האמיתי, לעיתים רחוקות יש לנו גישה לכל האוכלוסייה. למשל:
- אי אפשר לשאול את כל הבוחרים במדינה למי יצביעו
- אי אפשר לבדוק את כל המוצרים במפעל (זה יהרוס אותם)
- אי אפשר למדוד את כל הדגים באוקיינוס
הפתרון: לוקחים מדגם (תת-קבוצה) ומסיקים ממנו על האוכלוסייה כולה!
📊 תצפית (ערך)
הגדרה: תוצאת המדידה של המשתנה - הערכים שהמשתנה מקבל.
סימון: תצפית של המשתנה X מסומנת ב-\(X_i\) כאשר האינדקס i משמש לזיהוי התצפית.
✏️ דוגמה: \(X_i\) = מספר ילדים במשפחה ה-i
\(X_7 = 3\) → במשפחה מספר 7 יש 3 ילדים
🔢 מדדים מספריים עבור משתנים כמותיים
| סימון | משמעות |
|---|---|
| \(n\) | מספר התצפיות (גודל המדגם) |
| \(X_1, X_2, ..., X_n\) | n תצפיות לפי סדר הגעתן |
| \(\sum_{i=1}^{n} X_i\) | סכום התצפיות |
| \(\sum_{i=1}^{n} X_i^2\) | סכום ריבועי התצפיות |
🌍 אוכלוסייה (Population)
הגדרה: אוסף של כל הפרטים שעונים על קריטריון מסוים.
✏️ דוגמאות:
- כל תלמידי התיכון בארץ
- נשים מעל גיל 35
- משפחות שבהן לפחות 5 ילדים
- כל המוצרים שיוצרו במפעל מסוים
💡 שימו לב: האוכלוסייה מוגדרת לפי השאלה שאנחנו רוצים לענות עליה!
🎲 מדגם (Sample)
הגדרה: תת-קבוצה (קבוצה חלקית) של האוכלוסייה שנבחרה, ועל-פי הנתונים שלה יבוצע מחקר סטטיסטי במטרה להסיק מסקנות על האוכלוסייה.
סימון: מדגם בגודל n של המשתנה X מסומן ע"י: \(X_1, X_2, X_3, ..., X_n\)
💡 חשוב: אוכלוסייה ומדגם הם מושגים יחסיים - אותה קבוצה יכולה להיות אוכלוסייה או מדגם!
⚖️ פרמטר לעומת סטטיסטי - ההבדל המכריע!
פרמטר (Parameter)
הגדרה: תכונה של האוכלוסייה.
מאפיינים:
- ערך קבוע ובדיד
- לא תלוי במדגם
- מאפיין את האוכלוסייה
- בדרך כלל לא ידוע לנו
סימון: אותיות יווניות (θ, μ, σ, P)
סטטיסטי (Statistic)
הגדרה: תכונה של המדגם.
מאפיינים:
- ערך משתנה ממדגם למדגם
- תלוי במדגם שנבחר
- משתנה מקרי (יש לו התפלגות)
- ידוע לנו (מחושב מהמדגם)
סימון: אותיות לטיניות עם כובע \((\hat{\theta}, \bar{X}, S, \hat{P})\)
📋 טבלת השוואה: פרמטר מול סטטיסטי
| המדד | פרמטר (אוכלוסייה) | סטטיסטי (מדגם) |
|---|---|---|
| ממוצע | \(\mu = E(X)\) (תוחלת) |
\(\bar{X} = \frac{\sum X_i}{n}\) (ממוצע מדגם) |
| שונות | \(\sigma^2 = V(X_i)\) (שונות של מ"מ) |
\(S^2 = \frac{\sum(X_i - \bar{X})^2}{n-1}\) (שונות מדגם) |
| סטיית תקן | \(\sigma\) | \(S\) |
| פרופורציה | \(P\) (פרופורציה באוכלוסייה) |
\(\hat{P}\) (פרופורציה במדגם) |
💡 למה הסטטיסטי הוא משתנה מקרי?
הפרמטר הוא ערך קבוע - הוא מאפיין את כל האוכלוסייה ולא משתנה.
הסטטיסטי תלוי במדגם שנבחר. כל פעם שנדגום מדגם חדש, נקבל ערך אחר!
✏️ דוגמה:
נניח שממוצע הגובה באוכלוסייה הוא μ = 170 ס"מ (פרמטר קבוע).
אם נדגום 30 אנשים:
- מדגם ראשון: \(\bar{X}_1 = 168.5\) ס"מ
- מדגם שני: \(\bar{X}_2 = 171.2\) ס"מ
- מדגם שלישי: \(\bar{X}_3 = 169.8\) ס"מ
הסטטיסטים משתנים ממדגם למדגם → יש להם התפלגות!
📈 התפלגות הדגימה (Sampling Distribution)
הגדרה: התפלגות של סטטיסטי מסוים על פני כל המדגמים האפשריים בגודל n.
💡 הסבר:
התפלגות הדגימה היא כלי שמאפשר ללמוד ממדדי המדגם (הסטטיסטים) על תכונות באוכלוסייה (הפרמטרים).
בתהליך ההסקה הסטטיסטית:
אנו מעוניינים ללמוד מתוך הסטטיסטים המחושבים במדגם על הפרמטרים של האוכלוסייה או של המשתנה המקרי.
📝 סיכום
אוכלוסייה = כל הפרטים | מדגם = תת-קבוצה
פרמטר = תכונת אוכלוסייה (קבוע, לא ידוע)
סטטיסטי = תכונת מדגם (משתנה מקרי, ידוע)
התפלגות דגימה = התפלגות הסטטיסטי על פני כל המדגמים