סטטיסטיקה לפסיכולוגים ב' – סיכום מלא למבחן
מבוא לסטטיסטיקה לפסיכולוגים ב', תשפ"ה · בנוי לפי חוברת התרגול – כל מושג שמופיע בקורס ובשאלות, ורק הוא.
כל פרק כולל: הסבר מושגים → נוסחאות → דוגמה פתורה → טעויות נפוצות → שאלות לתרגול עצמי.
⓪ מפת מושגי יסוד – חוט השני של הקורס
▾כל הקורס הוא וריאציה אחת גדולה על אותו רעיון: לקחת מדגם, לחשב עליו סטטיסטי, ולהכריע מה הוא מלמד על האוכלוסייה. הטבלה הבאה היא "מילון העבודה" שילווה אותך בכל הפרקים.
| מושג | הגדרה תמציתית |
|---|---|
| אוכלוסייה | כלל היחידות שעליהן רוצים להסיק. מאופיינת בפרמטרים (μ – תוחלת, σ – ס"ת). |
| מדגם | תת-קבוצה שנדגמה מקרית. מאופיין בסטטיסטיים (X̄ – ממוצע, S – ס"ת). |
| הסקה סטטיסטית | מבוססת על המדגם, ומתייחסת לאוכלוסייה. תמיד טנטטיבית (זמנית). |
| אומדן (אומד) | סטטיסטי המשמש לאמוד פרמטר מקביל באוכלוסייה (X̄ אומד את μ). |
| אומדן בלתי-מוטה | אומדן שתוחלתו (ממוצעו על פני כל המדגמים) שווה לפרמטר. X̄ והשונות המתוקנת Ŝ² בלתי-מוטים. |
| השערת האפס H₀ | תמיד מניחה שוויון / היעדר אפקט באוכלוסייה. נקודת המוצא שאותה מנסים לדחות. |
| השערת המחקר H₁ | טוענת לקיום אפקט (הבדל/קשר/חריגות) באוכלוסייה. שתי ההשערות מתייחסות לאוכלוסייה. |
⚠️ הטעויות הנפוצות ביותר במבחן – לעבור לפני שנכנסים
▾- ❌ מסיח שכתוב בו "הוכיח" / "בוודאות" ← ✔️ כמעט תמיד שגוי — בהסקה רק "תומך/מבסס"המלכודת הקלאסית: "המחקר הוכיח ש...". אין הוכחות בסטטיסטיקה.
- ❌ מסיח שמסיק על המדגם ← ✔️ המסקנה תמיד על האוכלוסייהדוגמים מדגם, אך מסיקים על האוכלוסייה שממנה נדגם.
- ❌ מסיח שבו H₁ = "אין הבדל" ← ✔️ H₁ תמיד טוענת לקיום אפקט"אין הבדל" זו בדיוק H₀. בחר מסיח שטוען להבדל/קשר.
- ❌ "לא דחינו H₀ ⇒ H₀ נכונה / אין אפקט" ← ✔️ אי-דחייה = רק p > αייתכן שמחקר חוזר כן ידחה. לא מקבלים ולא מוכיחים את H₀.
- ❌ מסיח: "H₀ על המדגם, H₁ על האוכלוסייה" ← ✔️ שתיהן מתייחסות לאוכלוסייה
- ❌ "α קטנה = קל לדחות" ← ✔️ α קטנה = מחמיר = קשה לדחותα=0.01 מחמיר מ-0.05. דחית ב-0.01 ⇒ בוודאי תדחה ב-0.05 (לא להפך).
- ❌ "p-value מחושב לפי H₁" ← ✔️ p-value מחושב לפי H₀זו ההסתברות לקבל את ממוצע המדגם (או קיצוני ממנו) בהתפלגות לפי H₀.
- ❌ "p-value יכול להיות 0" ← ✔️ לעולם לא בדיוק 0
- ❌ שימוש ב-σ/√n לשאלה על פרט בודד ← ✔️ פרט בודד → σ ; ממוצע מדגם → σ/√nהמלכודת הקלאסית של "אחוז האנשים" מול "הסתברות הממוצע".
- ❌ "ממוצע המדגם = ממוצע האוכלוסייה" ← ✔️ רק ממוצע כל הממוצעים = μמדגם בודד כמעט תמיד שונה במקצת מ-μ.
- ❌ "n גדול → טעות תקן גדולה" ← ✔️ n גדול → טעות תקן קטנה → התפלגות צרה
- ❌ "n=1 → טעות תקן 0" ו-"n=אוכלוסייה → מקסימום" ← ✔️ הפוך: n=1 → טעות תקן=σ ; n=אוכלוסייה → טעות תקן=0
- ❌ "התפלגות הדגימה תמיד נורמלית מ-n≥30" ← ✔️ גם אוכלוסייה נורמלית נותנת התפלגות דגימה נורמלית בכל n
- ❌ בחירת המבחן לפי גודל המדגם ← ✔️ Z אם σ ידועה, t אם σ לא ידועהזה הקריטריון היחיד שמבחין ביניהם.
- ❌ הצבת שונות המדגם במבחן Z ← ✔️ ב-Z מציבים את σ של האוכלוסייה
- ❌ "הגדלת n מגדילה את הערך הקריטי" ← ✔️ n מגדיל את הסטטיסטי המחושב; הקריטי של Z לא משתנה, של t קטן
- ❌ "t ו-Z אותו ערך קריטי" ← ✔️ t מחמיר מ-Z כש-n<120; שווים מ-120
- ❌ חישוב מיותר כשהמדגם בכיוון ההפוך מ-H₁ ← ✔️ כיוון הפוך → לא דוחים, בלי חישוב
- ❌ "דו-זנבי מקל" ← ✔️ דו-זנבי מחמיר (α מתחלקת לשני זנבות)
- ❌ שימוש ב-±1.96 בהשערה חד-זנבית ← ✔️ חד-זנבי 5% = 1.645 ; דו-זנבי 5% = ±1.96
- ❌ בלבול: טעות I מול טעות II ← ✔️ I = דחינו אפקט שלא קיים (α) · II = פספסנו אפקט שקיים (β)
- ❌ "תוצאה מובהקת ⇒ אפקט גדול" ← ✔️ מובהקות ≠ גודל אפקטייתכן אפקט חלש-ומובהק, וגם חזק-ולא-מובהק.
- ❌ "גודל אפקט גדל עם n" ← ✔️ גודל אפקט לא תלוי ב-n (העוצמה כן)
- ❌ "רמת ביטחון גבוהה → עוצמה גבוהה" ← ✔️ רמת ביטחון ↑ (α↓) → עוצמה ↓
- ❌ "ממוצע המדגם משפיע על רוחב הרווח" ← ✔️ הממוצע קובע רק מיקום, לא רוחבהרוחב תלוי ב-σ, n ורמת הביטחון בלבד.
- ❌ "רמת ביטחון גבוהה → רווח צר" ← ✔️ ביטחון ↑ → רווח רחב יותר
- ❌ בחירת t תלויים רק כי יש זוגות בנתונים ← ✔️ בוחרים לפי שאלת המחקר וההשערה"הבדל בין גברים לנשים" = בלתי-תלויים, גם אם חלקם נשואים.
- ❌ "df בתלויים = 2n−1" ← ✔️ תלויים df=n−1 (n=זוגות) · בלתי-תלויים df=n₁+n₂−2
- ❌ "הפרש בין מדגמים = עוצמה/טעות" ← ✔️ הפרש בין מדגמים = גודל אפקט
- ❌ "F מובהק ⇒ כל הקבוצות נבדלות" ← ✔️ מובהק ⇒ לפחות זוג אחד נבדל
- ❌ בדיקת F קריטי כש-F≤1 ← ✔️ F≤1 (MSB≤MSW) → בטוח לא דוחים
- ❌ הסקה מ-MSB לבד ← ✔️ צריך את היחס MSB/MSW — אף אחד לבד לא אומר כלום
- ❌ בלבול ב-df ← ✔️ DFB=k−1 (מונה) · DFW=N−k (מכנה)
- ❌ "הכפלת כל הערכים בקבוע תשנה את F" ← ✔️ טרנספורמציה לינארית לא משנה את F
1. מבוא להסקה סטטיסטית ובחינת השערות
▾השערות: מי מתייחס למי?
- H₀ (אפס) – תמיד מניחה שוויון, לעולם לא הבדל. מתארת את "המצב הרגיל" בהיעדר תופעה חריגה (כמו מטבע הוגן עם 0.5 לכל צד).
- H₁ (מחקר) – טוענת לאפקט, אך אינה ספציפית: היא אומרת ש-μ שונה/גדול/קטן מערך מסוים, אך לא מציינת מהו הערך החדש.
- לכן אפשר רק לדחות את H₀ – ודרך הדחייה לקבל תמיכה ב-H₁. לעולם לא "מקבלים" או "מוכיחים" השערה.
אלפא (α) ורמת מובהקות
α הוא ערך הסף לדחיית H₀ וגם ההסתברות לטעות מסוג ראשון (דחייה שגויה של H₀ נכונה). שני קריטריונים מקובלים:
α = 0.05– קריטריון מקל: המדגם צריך להיות ב-5% הקיצוניים.α = 0.01– קריטריון מחמיר: המדגם צריך להיות ב-1% הקיצוניים.
p-value (מובהקות התוצאה / "אלפא מינימלית")
ה-p-value הוא ההסתברות לקבל את ממוצע המדגם (או קיצוני ממנו) בהתפלגות הדגימה לפי H₀ – השטח שמתחת לעקומה מממוצע המדגם ועד קצה הזנב. זוהי ה-α המינימלית שעדיין מאפשרת דחייה.
- מסיח שכתוב בו "הוכיח" או "בוודאות" → כמעט תמיד שגוי. בהסקה רק תומכים/מבססים.
- מסיח שמסיק על המדגם → שגוי. המסקנה תמיד על האוכלוסייה.
- מסיח ש"אי-דחיית H₀ מוכיחה ש-H₀ נכונה" → שגוי. משמעו רק p-value > α.
1.2 מאפייני התפלגות הדגימה
▾התפלגות הדגימה של הממוצע = התפלגות תיאורטית של כל ממוצעי המדגמים האפשריים בגודל n מהאוכלוסייה. היא הבסיס לכל ההסקה.
שלוש תכונות שחובה לזכור
- הממוצע: ממוצע התפלגות הדגימה = ממוצע האוכלוסייה (μ). זה נובע מכך ש-X̄ הוא אומדן בלתי-מוטה.
- הפיזור – טעות התקן: קטנה מס"ת האוכלוסייה (כי מחלקים ב-√n).
- הצורה: נורמלית אם האוכלוסייה נורמלית (לכל n), או לפי משפט הגבול המרכזי כאשר n≥30.
מקרי קצה
- n = 1 → התפלגות הדגימה משחזרת את האוכלוסייה במדויק; טעות התקן = σ האוכלוסייה.
- n = כל האוכלוסייה → קיים מדגם אפשרי אחד בלבד → טעות התקן = 0.
- אוכלוסייה ללא פיזור (כולם זהים) → σ=0, וגם טעות התקן = 0.
ציון תקן (Z): יחיד מול ממוצע מדגם
לממוצע מדגם בהתפלגות הדגימה: Z = (X̄ − μ) / (σ/√n)
- שאלה על פרט בודד → משתמשים ב-σ (לא בטעות תקן). שאלה על ממוצע מדגם → משתמשים בטעות תקן σ/√n.
- ממוצע המדגם הבודד לא בהכרח שווה ל-μ. רק ממוצע כל הממוצעים שווה ל-μ.
- ס"ת של מדגם בודד אינה בהכרח שווה לס"ת האוכלוסייה – הסטטיסטי משתנה ממדגם למדגם.
1.3 מבחן Z לאומדן ממוצע באוכלוסייה אחת
▾משווים ממוצע של מדגם בודד לממוצע האוכלוסייה הידוע, כדי לבדוק אם המדגם חריג.
Zמחושב = (X̄ − μ₀) / (σ/√n) משווים ל-Z קריטי ודוחים את H₀ אם |Z מחושב| > |Z קריטי|.
| α (מובהקות) | חד-זנבי (ימני/שמאלי) | דו-זנבי |
|---|---|---|
| 5% (0.05) | 1.645 (≈1.65) | ±1.96 |
| 1% (0.01) | 2.33 | ±2.58 |
- במבחן Z מציבים את σ של האוכלוסייה – שונות המדגם לא רלוונטית ואינה משפיעה על ה-p-value.
- הגדלת n מגדילה את Z המחושב (כי n במכנה תחת שורש), אך אינה משנה את Z הקריטי.
- הסטטיסטי המחושב הוא מדד מיקום יחסי של המדגם בהתפלגות – לא ערך קריטי ולא מדד מרכז.
2. מבחן t למדגם יחיד (אומדן השונות באוכלוסייה)
▾זהה במהותו ל-Z, אך משמש כאשר שונות האוכלוסייה אינה ידועה – ואז אומדים אותה מהמדגם.
tמחושב = (X̄ − μ₀) / (Ŝ/√n) df = n − 1 את הערך הקריטי מחפשים בטבלת t לפי df ולפי כיוון ההשערה.
התפלגות t מול התפלגות Z
- t היא משפחה של התפלגויות סימטריות וכיפתיות (אחת לכל df), בעוד Z יחידה.
- t נמוכה ורחבה יותר מ-Z, עם יותר מקרים בזנבות → הערכים הקריטיים שלה מחמירים יותר (גדולים יותר) מ-Z.
- ככל ש-df גדל, t מתקרבת ל-Z. ב-n≥120 אין הבדל מעשי בין הערכים הקריטיים.
3.1 טעויות הסקה מסוג ראשון ושני
▾- טעות מסוג ראשון (α): דחיית H₀ בטעות – כשהיא נכונה במציאות ("זיהינו אפקט שלא קיים"). דוגמה: בדיקת היריון חיובית כשאין היריון.
- טעות מסוג שני (β): אי-דחיית H₀ – כש-H₁ נכונה במציאות ("פספסנו אפקט שקיים").
| ההחלטה ↓ \ במציאות → | H₀ נכונה | H₀ שגויה (H₁ נכונה) |
|---|---|---|
| דוחים את H₀ | טעות מסוג ראשון (α) | עוצמת המבחן (1−β) ✔️ |
| לא דוחים את H₀ | רמת ביטחון (1−α) ✔️ | טעות מסוג שני (β) |
• "כש-H₀ נכונה" → טעות I או רמת ביטחון.
• "כשדוחים H₀" → טעות I או עוצמה.
• "כש-H₀ שגויה" → טעות II או עוצמה.
• "כשלא דוחים H₀" → טעות II או רמת ביטחון.
הקשר ההפוך α ↔ β
קיים יחס הפוך: ככל שמקטינים את α (מחמירים, מעלים רמת ביטחון) → β גדלה והעוצמה קטנה. ולהפך: הגדלת α מקטינה את β. גורמים המשפיעים על β: רמת הביטחון (α), σ האוכלוסייה, וגודל המדגם.
3.2 עוצמת המבחן וגודל האפקט
▾גורמים המשפיעים על העוצמה
| אם... | העוצמה (1−β) | מדוע |
|---|---|---|
| n גדל ↑ | גדלה ↑ | טעות התקן קטנה → קל יותר לזהות חריגים |
| רמת ביטחון גדלה ↑ (α קטנה) | קטנה ↓ | נשמרים מטעות I אך "משלמים" בטעות II |
| σ האוכלוסייה גדל ↑ | קטנה ↓ | פיזור גדול → קשה לזהות אפקט |
גודל האפקט (Cohen's d)
מודד את עוצמת התופעה – המידה שבה קיים הבדל משמעותי בין הממוצעים.
אם גודל האפקט גדול – ניתן לזהות אותו גם במדגמים קטנים.
4.1 רווח סמך לאומדן ממוצע – רב"ס Z
▾במקום אומדן נקודתי (X̄), בונים טווח שבתוכו צפוי להימצא ממוצע האוכלוסייה, ברמת ביטחון נתונה.
מציאת n מתוך אורך רצוי L: n ≥ ( 2 · Zα/2 · σ / L )²
מה משפיע על רוחב הרווח?
| גורם | השפעה על הרוחב |
|---|---|
| רמת ביטחון ↑ (1−α גדלה) | הרווח גדל (כדי להבטיח לכידת μ) |
| גודל מדגם n ↑ | הרווח קטן (n במכנה תחת שורש) |
| שונות / σ ↑ | הרווח גדל |
| ממוצע המדגם X̄ | אינו משפיע על הרוחב (רק על המיקום!) |
שימוש ברווח סמך לבחינת השערות
למדגם יחיד: אם הרווח אינו מכיל את μ₀ של H₀ → דוחים את H₀. להפרש ממוצעים (שני מדגמים): אם הרווח אינו מכיל את 0 → דוחים.
4.2 רווח סמך – מבחן t
▾כאשר σ האוכלוסייה אינה ידועה, משתמשים בשונות המתוקנת Ŝ ובערך קריטי מטבלת t.
5.1 מבחן t לשני מדגמים בלתי-תלויים
▾משווים ממוצעים של שתי קבוצות נפרדות (שתי אוכלוסיות), כדי לבדוק אם ההבדל ביניהן מובהק.
H₀: μ₁ = μ₂ (ההפרש = 0) ; H₁: μ₁ ≠ μ₂ (או כיווני).
df = n₁ + n₂ − 2 שונות משוקללת (pooled): Ŝ²p = [ Ŝ₁²(n₁−1) + Ŝ₂²(n₂−1) ] / (n₁ + n₂ − 2) סטטיסטי המבחן: t = (X̄₁ − X̄₂) / √( Ŝ²p · (1/n₁ + 1/n₂) ) גודל אפקט (d של כהן): d = (X̄₁ − X̄₂) / √Ŝ²p
5.2 מבחן t לשני מדגמים תלויים (מזווגים)
▾משמש כאשר יש תלות/זיווג בין התצפיות: מדידות חוזרות על אותם נבדקים (לפני/אחרי), או זוגות (תאומים, בני-זוג, אחים).
כשנתונה ס"ת מתוקנת של ההפרשים: t = d̄ / (Ŝd / √n) מנתונים גולמיים: t = Σdᵢ / √( [ n·Σdᵢ² − (Σdᵢ)² ] / (n−1) )
6. ניתוח שונות חד-כיווני (One-Way ANOVA)
▾השוואת ממוצעים של שלוש קבוצות או יותר בו-זמנית, באמצעות יחס בין שני סוגי שונות.
| מקור שונות | SS (סכום ריבועים) | DF | MS | F |
|---|---|---|---|---|
| Between (בין-קבוצתית / מוסברת) | SSB = Σ nⱼ(X̄ⱼ − X̿)² | k − 1 | MSB = SSB/DFB | F = MSB / MSW |
| Within (תוך-קבוצתית / טעות / לא-מוסברת) | SSW = Σ(Xᵢⱼ − X̄ⱼ)² | N − k | MSW = SSW/DFW | |
| Total | SST = SSB + SSW = Σ(Xᵢⱼ − X̿)² | N − 1 | — | — |
k = מספר הקבוצות · N = סך כל הנבדקים · X̄ⱼ = ממוצע קבוצה j · X̿ = הממוצע הכללי · nⱼ = גודל קבוצה j
- F ≤ 1 (MSB ≤ MSW) → בטוח לא דוחים את H₀ (אין צורך אפילו בטבלה).
- F > 1 → בודקים מול F קריטי. דוחים רק אם F מחושב > F קריטי.
- F = 1 פירושו MSB = MSW בדיוק.
F(dfB, dfW) = value.
שינויים במערך – מה קורה ל-F?
| הפעולה | התוצאה |
|---|---|
| הוספת נבדקים הזהים לממוצע קבוצתם | SSB ↑ (n גדל), DFB ללא שינוי → MSB↑ ; SSW ללא שינוי, DFW↑ → MSW↓ → F מחושב גדל, F קריטי קטן → קל יותר לדחות |
| טרנספורמציה לינארית (הכפלת כל הערכים בקבוע) | F לא משתנה (SSB ו-SSW משתנים באותה מידה, df לא משתנה) |
| אין שונות בין הקבוצות (ממוצעים זהים) | SSB=0 → F=0 → בטוח לא דוחים |
נספח א': טבלת עזר לניסוח השערות
▾דוגמה: נתון שממוצע האוכלוסייה μ₀ = 80 (תקף למבחן Z ו-t למדגם יחיד).
| סוג המבחן | השערת אפס H₀ | השערת מחקר H₁ | אזור דחייה |
|---|---|---|---|
| חד-צדדי ימני ("גבוה מ-") | μ₀ ≤ 80 | μ₁ > 80 | זנב ימני |
| דו-צדדי ("שונה מ-") | μ₀ = 80 | μ₁ ≠ 80 | שני הזנבות (α/2 בכל אחד) |
| חד-צדדי שמאלי ("נמוך מ-") | μ₀ ≥ 80 | μ₁ < 80 | זנב שמאלי |
נספח ב': דף נוסחאות מרוכז
▾נספח ג': איך קוראים את טבלאות Z, t, F
▾טבלת Z
- בשוליים מאתרים את ערך ה-Z, ובתוך הטבלה מקבלים את השטח המצטבר (ההסתברות עד אותו Z).
- לזנב הימני (שטח מעל): מחשבים 1 − השטח המצטבר. דוגמה: Z=2.17 → מצטבר 0.9850 → מעל = 0.015.
- ערכים קריטיים נפוצים: 1.645 (5% חד), 1.96 (5% דו), 2.33 (1% חד), 2.58 (1% דו).
טבלת t
- נכנסים לפי דרגות החופש (df) בשורה, ולפי רמת המובהקות והכיוון (חד/דו-זנבי) בעמודה.
- ככל ש-df גדל הערך קטן ומתקרב ל-Z; מ-df≈120 הם שווים.
- בדו-זנבי משתמשים ב-α/2 בכל עמודה.
טבלת F
- שתי דרגות חופש: dfB = מונה (בראש העמודות), dfW = מכנה (בשורות).
- בוחרים את הטבלה/שורה לפי רמת המובהקות (יש טבלה נפרדת ל-5% ול-1%).
- דוגמה: F(3,16) ב-5% → ערך קריטי 3.24. F(2,3) ב-1% → 30.82.
טבלאות השוואה מסכמות – "מתי כל מבחן?"
▾| המבחן | מתי משתמשים | דרגות חופש |
|---|---|---|
| Z – מדגם יחיד | השוואת ממוצע מדגם ל-μ ידוע, כש-σ ידועה | אין (נורמלית) |
| t – מדגם יחיד | כמו Z, אבל σ אינה ידועה | n − 1 |
| t – שני מדגמים ב"ת | הבדל בין 2 קבוצות נפרדות (משתנה בת"ל דיכוטומי, תלוי כמותי) | n₁ + n₂ − 2 |
| t – שני מדגמים תלויים | 2 מדידות מזווגות (לפני/אחרי, זוגות) | n − 1 |
| ANOVA חד-כיווני | הבדל בין ≥3 קבוצות (בת"ל קטגוריאלי, תלוי כמותי) | dfB=k−1 ; dfW=N−k |
| מבחן Z | מבחן t | |
|---|---|---|
| שונות אוכלוסייה | ידועה | לא ידועה (אומדים ב-Ŝ²) |
| אומדן של | הממוצע בלבד | ממוצע + שונות |
| התפלגות | נורמלית אחת | משפחת התפלגויות (לפי df) |
| ערך קריטי (n<120) | קטן יותר (מקל) | גדול יותר (מחמיר) |
| ב-n≥120 | הערכים הקריטיים זהים | |
| Between (MSB) | Within (MSW) | |
|---|---|---|
| מה מודדת | שונות מוסברת (האפקט) | שונות לא-מוסברת (טעות/רעש) |
| מיקום ב-F | מונה | מכנה |
| df | k − 1 | N − k |
- זהה: σ ידועה? (Z/t) · כמה קבוצות? (1 / 2 / ≥3) · תלויות או לא?
- נסח השערות לפי כיוון (חד/דו-זנבי) – זה קובע את הערך הקריטי.
- חשב סטטיסטי מחושב, שלוף ערך קריטי לפי df ו-α.
- הכרעה: |מחושב| > |קריטי| → דחה H₀. בחר מסיח שמדבר על האוכלוסייה ב"שפת תמיכה" (פסול כל מסיח עם "הוכיח/בוודאות").
- זכור: מובהקות ≠ גודל אפקט · המסקנה על האוכלוסייה · אי-דחייה ≠ הוכחת H₀.