התפלגות ממוצע המדגם ומשפט הגבול המרכזי
הסבר מלא, דוגמאות פתורות ותרגול.
📖 התפלגות ממוצע המדגם ומשפט הגבול המרכזי
התפלגות הדגימה ומשפט הגבול המרכזי
התפלגות ממוצע המדגם ומשפט הגבול המרכזי (CLT)
🎯 רקע: ממוצע המדגם כמשתנה מקרי
מכיוון שממדגם למדגם אנו יכולים לקבל ממוצע מדגם שונה, אזי ממוצע המדגם הוא משתנה מקרי ויש לו התפלגות.
השאלה המרכזית: מהי ההתפלגות של ממוצע המדגם \(\bar{X}\)?
התשובה תלויה בשני דברים:
- האם האוכלוסייה המקורית מתפלגת נורמלית?
- מהו גודל המדגם n?
📊 פרמטרים של האוכלוסייה
גדלים המתארים התפלגות או אוכלוסייה נקראים פרמטרים:
\(\mu\)
ממוצע האוכלוסייה
(נקרא גם תוחלת)
\(\sigma^2\)
שונות האוכלוסייה
\(\sigma\)
סטיית תקן האוכלוסייה
\(\sigma = \sqrt{\sigma^2}\)
⭐ תכונות התפלגות ממוצע המדגם
תכונה 1: תוחלת ממוצע המדגם
\(E(\bar{X}) = \mu_{\bar{X}} = \mu\)
ממוצע כל ממוצעי המדגם האפשריים שווה לממוצע האוכלוסייה
תכונה 2: שונות ממוצע המדגם
\(V(\bar{X}) = \sigma_{\bar{X}}^2 = \frac{\sigma^2}{n}\)
שונות כל ממוצעי המדגם שווה לשונות האוכלוסייה מחולק ב-n
(תכונה זו נכונה רק במדגם מקרי)
תכונה 3: טעות תקן (Standard Error)
\(\sigma_{\bar{X}} = \frac{\sigma}{\sqrt{n}}\)
סטיית התקן של ממוצע המדגם נקראת "טעות תקן"
💡 תובנה חשובה: יש יחס הפוך בין גודל המדגם לבין שונות ממוצעי המדגם.
ככל שהמדגם גדול יותר → השונות קטנה יותר → הממוצעים מרוכזים יותר סביב μ
📈 השפעת גודל המדגם על השונות
מסקנה: ככל שגודל המדגם גדל, התפלגות ממוצע המדגם נעשית:
- יותר צרה (שונות קטנה יותר)
- יותר מרוכזת סביב ממוצע האוכלוסייה μ
🔔 מקרה 1: דגימה מהתפלגות נורמלית
אם: נדגום מתוך אוכלוסייה שהמשתנה בה מתפלג נורמלית עם ממוצע μ ושונות σ²
אז: ממוצע המדגם גם יתפלג נורמאלית!
\(\bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right)\)
💡 שימו לב: במקרה זה, ממוצע המדגם מתפלג נורמלית לכל גודל מדגם n, גם אם n קטן!
🌟 משפט הגבול המרכזי (Central Limit Theorem - CLT)
המשפט:
אם אוכלוסייה מתפלגת בהתפלגות כלשהי (לא חייב נורמלית!) עם ממוצע μ ושונות σ²,
אזי עבור מדגם מספיק גדול, ממוצע המדגם מתפלג בקירוב נורמאלי:
\(\bar{X} \xrightarrow{n \to \infty} N\left(\mu, \frac{\sigma^2}{n}\right)\)
🎯 זהו אחד המשפטים החשובים ביותר בסטטיסטיקה!
❓ מתי המדגם "מספיק גדול"?
כלל אצבע: בדרך כלל מספיק \(n \geq 30\)
אבל זה תלוי בהתפלגות המקורית:
- התפלגות סימטרית: גם n קטן יחסית (15-20) יכול להספיק
- התפלגות א-סימטרית: צריך n גדול יותר (30+)
- התפלגות מאוד א-סימטרית: צריך n גדול מאוד (50+)
📊 המחשה של משפט הגבול המרכזי
🧮 חישוב ציון Z לממוצע המדגם
\(Z = \frac{\bar{X} - \mu}{\frac{\sigma}{\sqrt{n}}} = \frac{\bar{X} - \mu}{\sigma_{\bar{X}}}\)
💡 שימו לב להבדל:
- עבור תצפית בודדת X: \(Z = \frac{X - \mu}{\sigma}\)
- עבור ממוצע מדגם \(\bar{X}\): \(Z = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}}\)
✏️ דוגמה מפורטת
שאלה: משקל תינוקות בלידה מתפלג עם ממוצע μ = 3.2 ק"ג וסטיית תקן σ = 0.5 ק"ג.
נדגמו 36 תינוקות. מה ההסתברות שממוצע המדגם יהיה גדול מ-3.35 ק"ג?
שלב 1: זיהוי הנתונים
\(\mu = 3.2, \quad \sigma = 0.5, \quad n = 36\)
שלב 2: חישוב טעות התקן
\(\sigma_{\bar{X}} = \frac{\sigma}{\sqrt{n}} = \frac{0.5}{\sqrt{36}} = \frac{0.5}{6} = 0.0833\)
שלב 3: חישוב ציון Z
\(Z = \frac{\bar{X} - \mu}{\sigma_{\bar{X}}} = \frac{3.35 - 3.2}{0.0833} = \frac{0.15}{0.0833} = 1.8\)
שלב 4: חישוב ההסתברות
\(P(\bar{X} > 3.35) = P(Z > 1.8) = 1 - P(Z \leq 1.8) = 1 - 0.9641 = 0.0359\)
תשובה: ההסתברות היא כ-3.59%
📋 טבלת סיכום
| מצב | התפלגות ממוצע המדגם |
|---|---|
| האוכלוסייה נורמלית | \(\bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right)\) בדיוק, לכל n |
| האוכלוסייה לא נורמלית, n גדול (≥30) | \(\bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right)\) בקירוב (CLT) |
| האוכלוסייה לא נורמלית, n קטן | לא ניתן להשתמש בקירוב נורמלי |
📝 נוסחאות מרכזיות
\(E(\bar{X}) = \mu\)
\(V(\bar{X}) = \frac{\sigma^2}{n}\)
\(\sigma_{\bar{X}} = \frac{\sigma}{\sqrt{n}}\) (טעות תקן)
\(Z = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}}\)
דוגמאות פתורות
🎯 מהי התפלגות נורמלית?
בחר/י את ההגדרה המתאימה ביותר להתפלגות נורמלית.
הצג פתרון
💡 הסבר:
שפה יומיומית:
התפלגות נורמלית היא "עקומת פעמון" – רוב התלמידים נמצאים סביב הממוצע, ומעט מאוד מאוד גבוהים או מאוד נמוכים. הגרף נראה כמו גבעה סימטרית באמצע.
שפה מתמטית:
התפלגות נורמלית היא התפלגות הסתברות רציפה, סימטרית סביב הממוצע μ. הצפיפות הגבוהה ביותר היא סביב μ, וההסתברות יורדת ככל שמתרחקים מהממוצע לשני הצדדים.
לכן התשובה הנכונה היא זו שמתארת עקומת פעמון סימטרית סביב הממוצע.
📐 סימטריה בהתפלגות נורמלית:
מה המשמעות של כך שההתפלגות הנורמלית סימטרית סביב הממוצע μ?
הצג פתרון
הסבר יומיומי:
אם התפלגות היא סימטרית, זה אומר שאם נסתכל כמה תלמידים נמצאים 10 נקודות מעל הממוצע – יהיה בערך אותו מספר תלמידים 10 נקודות מתחת לממוצע.
הסבר מתמטי:
בתפלגות נורמלית מסתמנת סימטריה כך ש:
P(X > μ + a) = P(X < μ - a)
לכל מרחק a > 0 מהממוצע.
לכן התשובה הנכונה היא שההסתברויות משני הצדדים במרחק שווה מהממוצע זהות.
⚖️ מיקום מדדי המרכז:
בהתפלגות נורמלית מושלמת, מה נכון לגבי הממוצע, החציון והשכיח?
הצג פתרון
הסבר יומיומי:
בעקומת פעמון "מושלמת", האמצע של הגבעה, הנקודה שבה הכי הרבה ערכים, והנקודה שמחלקת את התלמידים לשניים – כולן באותו מקום.
הסבר מתמטי:
בתפלגות נורמלית סימטרית, מתקיים:
μ = median = mode
כלומר הממוצע, החציון והשכיח שווים זה לזה ונמצאים במרכז ההתפלגות.
תרגול עכשיו
צרו שאלה חדשה אקראית ובדקו את עצמכם.