סטטיסטיקה לפסיכולוגים ב' – סיכום מלא למבחן

מבוא לסטטיסטיקה לפסיכולוגים ב', תשפ"ה · בנוי לפי חוברת התרגול – כל מושג שמופיע בקורס ובשאלות, ורק הוא.

כל פרק כולל: הסבר מושגים → נוסחאות → דוגמה פתורה → טעויות נפוצות → שאלות לתרגול עצמי.

🔵 נוסחה🟢 דוגמה פתורה🟠 טיפ למבחן🔴 טעות נפוצה🟣 תרגול עצמי

⓪ מפת מושגי יסוד – חוט השני של הקורס

▾

כל הקורס הוא וריאציה אחת גדולה על אותו רעיון: לקחת מדגם, לחשב עליו סטטיסטי, ולהכריע מה הוא מלמד על האוכלוסייה. הטבלה הבאה היא "מילון העבודה" שילווה אותך בכל הפרקים.

מושגי הליבה
מושג	הגדרה תמציתית
אוכלוסייה	כלל היחידות שעליהן רוצים להסיק. מאופיינת בפרמטרים (μ – תוחלת, σ – ס"ת).
מדגם	תת-קבוצה שנדגמה מקרית. מאופיין בסטטיסטיים (X̄ – ממוצע, S – ס"ת).
הסקה סטטיסטית	מבוססת על המדגם, ומתייחסת לאוכלוסייה. תמיד טנטטיבית (זמנית).
אומדן (אומד)	סטטיסטי המשמש לאמוד פרמטר מקביל באוכלוסייה (X̄ אומד את μ).
אומדן בלתי-מוטה	אומדן שתוחלתו (ממוצעו על פני כל המדגמים) שווה לפרמטר. X̄ והשונות המתוקנת Ŝ² בלתי-מוטים.
השערת האפס H₀	תמיד מניחה שוויון / היעדר אפקט באוכלוסייה. נקודת המוצא שאותה מנסים לדחות.
השערת המחקר H₁	טוענת לקיום אפקט (הבדל/קשר/חריגות) באוכלוסייה. שתי ההשערות מתייחסות לאוכלוסייה.

🟠 עיקרון-העל של הקורס בכל מבחן אנו מחשבים סטטיסטי מחושב (Z/t/F) ומשווים אותו לערך קריטי מהטבלה. אם המחושב קיצוני יותר (גדול בערך מוחלט) מהקריטי → דוחים את H₀ ומקבלים תמיכה ל-H₁. זה הכול. כל פרק רק מחליף את הנוסחה לסטטיסטי המחושב ואת הטבלה.

⚠️ הטעויות הנפוצות ביותר במבחן – לעבור לפני שנכנסים

▾

למה זה כאן רוב הנקודות במבחן נופלות על אותן מלכודות חוזרות. אם תזכור רק את הרשימה הזו — חסכת לעצמך טעויות יקרות. כל שורה: ❌ מה טועים ← ✔️ הנכון.

א. הסקה ומסקנות – לזהות את התשובה השגויה

❌ מסיח שכתוב בו "הוכיח" / "בוודאות" ← ✔️ כמעט תמיד שגוי — בהסקה רק "תומך/מבסס"המלכודת הקלאסית: "המחקר הוכיח ש...". אין הוכחות בסטטיסטיקה.
❌ מסיח שמסיק על המדגם ← ✔️ המסקנה תמיד על האוכלוסייהדוגמים מדגם, אך מסיקים על האוכלוסייה שממנה נדגם.
❌ מסיח שבו H₁ = "אין הבדל" ← ✔️ H₁ תמיד טוענת לקיום אפקט"אין הבדל" זו בדיוק H₀. בחר מסיח שטוען להבדל/קשר.
❌ "לא דחינו H₀ ⇒ H₀ נכונה / אין אפקט" ← ✔️ אי-דחייה = רק p > αייתכן שמחקר חוזר כן ידחה. לא מקבלים ולא מוכיחים את H₀.
❌ מסיח: "H₀ על המדגם, H₁ על האוכלוסייה" ← ✔️ שתיהן מתייחסות לאוכלוסייה

ב. אלפא, p-value ומובהקות

❌ "α קטנה = קל לדחות" ← ✔️ α קטנה = מחמיר = קשה לדחותα=0.01 מחמיר מ-0.05. דחית ב-0.01 ⇒ בוודאי תדחה ב-0.05 (לא להפך).
❌ "p-value מחושב לפי H₁" ← ✔️ p-value מחושב לפי H₀זו ההסתברות לקבל את ממוצע המדגם (או קיצוני ממנו) בהתפלגות לפי H₀.
❌ "p-value יכול להיות 0" ← ✔️ לעולם לא בדיוק 0

ג. התפלגות הדגימה

❌ שימוש ב-σ/√n לשאלה על פרט בודד ← ✔️ פרט בודד → σ ; ממוצע מדגם → σ/√nהמלכודת הקלאסית של "אחוז האנשים" מול "הסתברות הממוצע".
❌ "ממוצע המדגם = ממוצע האוכלוסייה" ← ✔️ רק ממוצע כל הממוצעים = μמדגם בודד כמעט תמיד שונה במקצת מ-μ.
❌ "n גדול → טעות תקן גדולה" ← ✔️ n גדול → טעות תקן קטנה → התפלגות צרה
❌ "n=1 → טעות תקן 0" ו-"n=אוכלוסייה → מקסימום" ← ✔️ הפוך: n=1 → טעות תקן=σ ; n=אוכלוסייה → טעות תקן=0
❌ "התפלגות הדגימה תמיד נורמלית מ-n≥30" ← ✔️ גם אוכלוסייה נורמלית נותנת התפלגות דגימה נורמלית בכל n

ד. בחירה בין Z ל-t

❌ בחירת המבחן לפי גודל המדגם ← ✔️ Z אם σ ידועה, t אם σ לא ידועהזה הקריטריון היחיד שמבחין ביניהם.
❌ הצבת שונות המדגם במבחן Z ← ✔️ ב-Z מציבים את σ של האוכלוסייה
❌ "הגדלת n מגדילה את הערך הקריטי" ← ✔️ n מגדיל את הסטטיסטי המחושב; הקריטי של Z לא משתנה, של t קטן
❌ "t ו-Z אותו ערך קריטי" ← ✔️ t מחמיר מ-Z כש-n<120; שווים מ-120
❌ חישוב מיותר כשהמדגם בכיוון ההפוך מ-H₁ ← ✔️ כיוון הפוך → לא דוחים, בלי חישוב

ה. חד-זנבי / דו-זנבי

❌ "דו-זנבי מקל" ← ✔️ דו-זנבי מחמיר (α מתחלקת לשני זנבות)
❌ שימוש ב-±1.96 בהשערה חד-זנבית ← ✔️ חד-זנבי 5% = 1.645 ; דו-זנבי 5% = ±1.96

ו. טעויות הסקה, עוצמה וגודל אפקט

❌ בלבול: טעות I מול טעות II ← ✔️ I = דחינו אפקט שלא קיים (α) · II = פספסנו אפקט שקיים (β)
❌ "תוצאה מובהקת ⇒ אפקט גדול" ← ✔️ מובהקות ≠ גודל אפקטייתכן אפקט חלש-ומובהק, וגם חזק-ולא-מובהק.
❌ "גודל אפקט גדל עם n" ← ✔️ גודל אפקט לא תלוי ב-n (העוצמה כן)
❌ "רמת ביטחון גבוהה → עוצמה גבוהה" ← ✔️ רמת ביטחון ↑ (α↓) → עוצמה ↓

ז. רווח סמך

❌ "ממוצע המדגם משפיע על רוחב הרווח" ← ✔️ הממוצע קובע רק מיקום, לא רוחבהרוחב תלוי ב-σ, n ורמת הביטחון בלבד.
❌ "רמת ביטחון גבוהה → רווח צר" ← ✔️ ביטחון ↑ → רווח רחב יותר

ח. שני מדגמים (תלויים/בלתי-תלויים)

❌ בחירת t תלויים רק כי יש זוגות בנתונים ← ✔️ בוחרים לפי שאלת המחקר וההשערה"הבדל בין גברים לנשים" = בלתי-תלויים, גם אם חלקם נשואים.
❌ "df בתלויים = 2n−1" ← ✔️ תלויים df=n−1 (n=זוגות) · בלתי-תלויים df=n₁+n₂−2
❌ "הפרש בין מדגמים = עוצמה/טעות" ← ✔️ הפרש בין מדגמים = גודל אפקט

ט. ניתוח שונות (ANOVA)

❌ "F מובהק ⇒ כל הקבוצות נבדלות" ← ✔️ מובהק ⇒ לפחות זוג אחד נבדל
❌ בדיקת F קריטי כש-F≤1 ← ✔️ F≤1 (MSB≤MSW) → בטוח לא דוחים
❌ הסקה מ-MSB לבד ← ✔️ צריך את היחס MSB/MSW — אף אחד לבד לא אומר כלום
❌ בלבול ב-df ← ✔️ DFB=k−1 (מונה) · DFW=N−k (מכנה)
❌ "הכפלת כל הערכים בקבוע תשנה את F" ← ✔️ טרנספורמציה לינארית לא משנה את F

1. מבוא להסקה סטטיסטית ובחינת השערות

▾

שורה תחתונה H₀ תמיד "אין הבדל", H₁ תמיד "יש אפקט" — ושתיהן על האוכלוסייה. דוחים רק את H₀, ואז תומכים ב-H₁ (לא "מוכיחים"). α קטנה = מחמיר. p<α → דוחים.

השערות: מי מתייחס למי?

H₀ (אפס) – תמיד מניחה שוויון, לעולם לא הבדל. מתארת את "המצב הרגיל" בהיעדר תופעה חריגה (כמו מטבע הוגן עם 0.5 לכל צד).
H₁ (מחקר) – טוענת לאפקט, אך אינה ספציפית: היא אומרת ש-μ שונה/גדול/קטן מערך מסוים, אך לא מציינת מהו הערך החדש.
לכן אפשר רק לדחות את H₀ – ודרך הדחייה לקבל תמיכה ב-H₁. לעולם לא "מקבלים" או "מוכיחים" השערה.

אלפא (α) ורמת מובהקות

α הוא ערך הסף לדחיית H₀ וגם ההסתברות לטעות מסוג ראשון (דחייה שגויה של H₀ נכונה). שני קריטריונים מקובלים:

α = 0.05 – קריטריון מקל: המדגם צריך להיות ב-5% הקיצוניים.
α = 0.01 – קריטריון מחמיר: המדגם צריך להיות ב-1% הקיצוניים.

🟠 כלל "קל וחומר" ככל ש-α קטנה יותר → קשה יותר לדחות את H₀. אם דחית את H₀ ב-α=0.01, בוודאות תדחה גם ב-α=0.05 (אך לא להפך). 1% הקיצוניים כלולים תמיד בתוך 5% הקיצוניים.

p-value (מובהקות התוצאה / "אלפא מינימלית")

ה-p-value הוא ההסתברות לקבל את ממוצע המדגם (או קיצוני ממנו) בהתפלגות הדגימה לפי H₀ – השטח שמתחת לעקומה מממוצע המדגם ועד קצה הזנב. זוהי ה-α המינימלית שעדיין מאפשרת דחייה.

🔵 כלל ההכרעה אם p < α → דוחים את H₀. אם p ≥ α → לא דוחים. ערך ה-p מחושב תמיד ביחס לממוצע התפלגות הדגימה לפי H₀ (ולא לפי H₁!), ולעולם אינו 0 בדיוק.

🔴 מסיחים מטעים (איך לפסול תשובה)

מסיח שכתוב בו "הוכיח" או "בוודאות" → כמעט תמיד שגוי. בהסקה רק תומכים/מבססים.
מסיח שמסיק על המדגם → שגוי. המסקנה תמיד על האוכלוסייה.
מסיח ש"אי-דחיית H₀ מוכיחה ש-H₀ נכונה" → שגוי. משמעו רק p-value > α.

🟣 תרגול 1.1

ככל שאלפא קטנה יותר, מה קורה לקריטריון לדחיית H₀? וכיצד זה משפיע על הקושי לדחות?

הקריטריון מחמיר יותר – אזור הדחייה (הזנבות) קטן, ולכן קשה יותר לדחות את H₀ ודרושה תוצאה קיצונית יותר. α מייצגת גם את ההסתברות לטעות מסוג ראשון.

🟣 תרגול 1.2

סטודנטית ניסחה השערת מחקר: "לא קיים הבדל ברמת האינטליגנציה של גברים ונשים". מה הבעיה?

ההשערה שגויה ועליה להחליפה. השערת מחקר (H₁) חייבת לטעון לקיום אפקט. "אין הבדל" הוא בדיוק ניסוח של H₀, לא של השערת מחקר.

1.2 מאפייני התפלגות הדגימה

▾

שורה תחתונה טעות תקן = σ/√n. מדגם גדול → התפלגות צרה וגבוהה. n≥30 → נורמלית (משפט הגבול המרכזי), גם אם האוכלוסייה לא. ממוצע התפלגות הדגימה = μ.

התפלגות הדגימה של הממוצע = התפלגות תיאורטית של כל ממוצעי המדגמים האפשריים בגודל n מהאוכלוסייה. היא הבסיס לכל ההסקה.

שלוש תכונות שחובה לזכור

הממוצע: ממוצע התפלגות הדגימה = ממוצע האוכלוסייה (μ). זה נובע מכך ש-X̄ הוא אומדן בלתי-מוטה.
הפיזור – טעות התקן: קטנה מס"ת האוכלוסייה (כי מחלקים ב-√n).
הצורה: נורמלית אם האוכלוסייה נורמלית (לכל n), או לפי משפט הגבול המרכזי כאשר n≥30.

🔵 טעות התקן (Standard Error) e = σ_X̄ = σ / √n ⬅️ ככל ש-n גדל → טעות התקן קטנה → ההתפלגות צרה וגבוהה. ככל ש-σ גדול → טעות התקן גדולה → ההתפלגות רחבה (הטרוגנית).

🔵 משפט הגבול המרכזי (CLT) אם n ≥ 30, התפלגות הדגימה של הממוצע תהיה נורמלית בקירוב – גם אם האוכלוסייה אינה נורמלית. אם האוכלוסייה כבר נורמלית, התפלגות הדגימה נורמלית לכל גודל מדגם.

מקרי קצה

n = 1 → התפלגות הדגימה משחזרת את האוכלוסייה במדויק; טעות התקן = σ האוכלוסייה.
n = כל האוכלוסייה → קיים מדגם אפשרי אחד בלבד → טעות התקן = 0.
אוכלוסייה ללא פיזור (כולם זהים) → σ=0, וגם טעות התקן = 0.

ציון תקן (Z): יחיד מול ממוצע מדגם

🔵 שתי נוסחאות שונות! ליחיד בודד באוכלוסייה: Z = (X − μ) / σ
לממוצע מדגם בהתפלגות הדגימה: Z = (X̄ − μ) / (σ/√n)

🟢 דוגמה פתורה – לחץ דם לחץ הדם מתפלג נורמלית, μ=130, σ=10.

▪ מדגם n=144: טעות תקן = 10/√144 = 10/12 = 0.83. הממוצע נשאר 130.

▪ מדגם n=49: טעות תקן = 10/√49 = 10/7 = 1.43 (גדולה יותר – מדגם קטן יותר).

▪ ההסתברות שממוצע מדגם בן 225 יהיה 133+: Z = (133−130)/(10/√225) = 3/(10/15) = 3/0.667 = 4.5 → הסתברות כמעט 0 (קצה ימני קיצוני).

▪ אחוז האנשים (לא ממוצעים!) עם לחץ דם 133+: Z = (133−130)/10 = 0.3 → שטח מעל = 1−0.6179 = 38.21%.

🔴 טעויות נפוצות

שאלה על פרט בודד → משתמשים ב-σ (לא בטעות תקן). שאלה על ממוצע מדגם → משתמשים בטעות תקן σ/√n.
ממוצע המדגם הבודד לא בהכרח שווה ל-μ. רק ממוצע כל הממוצעים שווה ל-μ.
ס"ת של מדגם בודד אינה בהכרח שווה לס"ת האוכלוסייה – הסטטיסטי משתנה ממדגם למדגם.

🟣 תרגול 1.2-א נכון/לא נכון

"ככל שהמדגם גדול יותר, התפלגות הדגימה צרה יותר."

נכון. n גדל → טעות התקן (σ/√n) קטנה → התפלגות הומוגנית וצרה יותר.

🟣 תרגול 1.2-ב נכון/לא נכון

"כאשר המדגם קטן מ-30, התפלגות הדגימה לעולם לא תהיה נורמלית."

לא נכון. אם האוכלוסייה המקורית נורמלית, התפלגות הדגימה נורמלית גם ב-n קטן מ-30. תנאי ה-n≥30 נדרש רק כשהאוכלוסייה אינה נורמלית (CLT).

🟣 תרגול 1.2-ג

נתונה אוכלוסייה שכולם בגובה 1.76 בדיוק, מדגמים בגודל 25. מה מאפייני התפלגות הדגימה?

הממוצע = 1.76 והשונות = 0. מאחר שאין פיזור באוכלוסייה (σ=0), טעות התקן = 0/√25 = 0, ואין "טעות דגימה".

1.3 מבחן Z לאומדן ממוצע באוכלוסייה אחת

▾

שורה תחתונה משתמשים ב-Z כש-σ ידועה. Z = (X̄−μ₀)/(σ/√n). דוחים את H₀ אם |Z מחושב| > |Z קריטי| (5%: 1.645 חד / ±1.96 דו).

משווים ממוצע של מדגם בודד לממוצע האוכלוסייה הידוע, כדי לבדוק אם המדגם חריג.

🔵 הנחות + נוסחה מתי Z? כאשר שונות האוכלוסייה ידועה, ובנוסף: האוכלוסייה נורמלית או n≥30 (כדי שהתפלגות הדגימה תהיה נורמלית).
Z_מחושב = (X̄ − μ₀) / (σ/√n) משווים ל-Z קריטי ודוחים את H₀ אם |Z מחושב| > |Z קריטי|.

ערכי Z קריטיים שכדאי לשנן
α (מובהקות)	חד-זנבי (ימני/שמאלי)	דו-זנבי
5% (0.05)	1.645 (≈1.65)	±1.96
1% (0.01)	2.33	±2.58

🟠 חד-זנבי מול דו-זנבי בדו-זנבי α מתחלקת לשני קצוות (α/2 בכל זנב), ולכן הערך הקריטי גדול יותר (מחמיר) – צריך תוצאה קיצונית יותר. כיוון ההשערה קובע היכן אזור הדחייה: השערה "גבוה מ-" → זנב ימני; "נמוך מ-" → זנב שמאלי; "שונה מ-" → שני הזנבות.

🟢 דוגמה פתורה – שיטת לימוד באנגלית ציונים: μ=68, σ=18. מדגם n=36, X̄=74.5. בודקים "שיפור" (חד-זנבי ימני).

השערות: H₀: μ≤68 ; H₁: μ>68

Z מחושב = (74.5−68)/(18/√36) = 6.5/3 = 2.17

ב-α=0.01: Z קריטי = 2.33. כיוון ש-2.17 < 2.33 → לא דוחים את H₀.

ב-α=0.05: Z קריטי = 1.65. כיוון ש-2.17 > 1.65 → דוחים את H₀, תמיכה בשיפור.

ה-α המינימלית (=p-value): השטח מעל Z=2.17 הוא 1−0.9850 = 0.015 (1.5%). לכן לא ניתן היה לדחות ב-1%.

🟢 דוגמה פתורה – מציאת n מינימלי IQ: μ=100, σ=16. מורה טוען שלתלמידיו IQ גבוה יותר, X̄=101, חד-זנבי ימני, α=0.05 (Z קריטי=1.65). מהו n המינימלי שיאפשר דחייה?

מציבים בנוסחת Z עם n כמשתנה: 1.65 = (101−100)/(16/√n) → 1.65 = √n/16 → √n = 26.4 → n ≈ 696.96 → מעגלים כלפי מעלה ל-n = 700.

🔴 טעויות נפוצות

במבחן Z מציבים את σ של האוכלוסייה – שונות המדגם לא רלוונטית ואינה משפיעה על ה-p-value.
הגדלת n מגדילה את Z המחושב (כי n במכנה תחת שורש), אך אינה משנה את Z הקריטי.
הסטטיסטי המחושב הוא מדד מיקום יחסי של המדגם בהתפלגות – לא ערך קריטי ולא מדד מרכז.

🟣 תרגול 1.3

ככל ש-Z המחושב גדל (בערך מוחלט), מה קורה ל-p-value?

p-value קטן. ככל ש-Z גדול וקיצוני יותר, השטח שנותר עד קצה ההתפלגות קטן יותר → קל יותר לדחות את H₀.

2. מבחן t למדגם יחיד (אומדן השונות באוכלוסייה)

▾

שורה תחתונה משתמשים ב-t כש-σ לא ידועה (אומדים ב-Ŝ). df = n−1. t מחמיר מ-Z כשהמדגם קטן מ-120, ושווה לו מ-120 ומעלה.

זהה במהותו ל-Z, אך משמש כאשר שונות האוכלוסייה אינה ידועה – ואז אומדים אותה מהמדגם.

🔵 הנחה, נוסחה, דרגות חופש מתי t? כאשר σ של האוכלוסייה אינה ידועה (ההבדל היחיד מ-Z!). אומדים אותה בעזרת שונות מתוקנת Ŝ² – אומדן בלתי-מוטה.
t_מחושב = (X̄ − μ₀) / (Ŝ/√n) df = n − 1 את הערך הקריטי מחפשים בטבלת t לפי df ולפי כיוון ההשערה.

התפלגות t מול התפלגות Z

t היא משפחה של התפלגויות סימטריות וכיפתיות (אחת לכל df), בעוד Z יחידה.
t נמוכה ורחבה יותר מ-Z, עם יותר מקרים בזנבות → הערכים הקריטיים שלה מחמירים יותר (גדולים יותר) מ-Z.
ככל ש-df גדל, t מתקרבת ל-Z. ב-n≥120 אין הבדל מעשי בין הערכים הקריטיים.

🟠 למה t מחמירה? ב-t אומדים גם את הממוצע וגם את השונות. אומדן השונות עלול להוביל לריבוי טעויות מסוג ראשון, ולכן "מענישים" עם ערך קריטי מחמיר יותר, כדי לשמור על רמת ה-α שקבע החוקר. לכן: לאותם נתונים, ל-Z סיכוי גדול יותר לדחות מ-t (כש-n<120).

🟢 דוגמה פתורה – אריזת גפרורים (דו-זנבי) μ=100, מדגם n=29, X̄=115, Ŝ=14. בודקים אם המכונה החדשה אורזת כמות שונה (דו-זנבי), α=0.05.

H₀: μ=100 ; H₁: μ≠100, df=29−1=28

t מחושב = (115−100)/(14/√29) = 15/2.6 = 5.77

t קריטי (df=28, דו-זנבי, α/2=0.025) = ±2.048. כיוון ש-5.77 > 2.048 → דוחים את H₀.

🟢 דוגמה פתורה – כיוון "הפוך" (פתרון ללא חישוב מלא) צריכת מים: μ=30, אב בית טוען שסטודנטים מבזבזים יותר (חד-זנבי ימני). מדגם X̄=28.2.

ממוצע המדגם נמוך מ-μ – כלומר בכיוון ההפוך מ-H₁. t מחושב יוצא שלילי (−2.4) ולכן בוודאי לא דוחים את H₀ – אפשר להסיק זאת עוד לפני החישוב.

🔴 טעות / טיפ קריטי "דחיתי ב-0.01 → דחה גם ב-0.05" (כי 0.05 מקלה). "לא דחיתי ב-0.05 → בוודאי לא אדחה ב-0.01" (כי 0.01 מחמירה). חוסך חישוב בסעיפים ב'!

🟣 תרגול 2.1

חוקר א' עשה מבחן Z וחוקר ב' מבחן t, אותם נתונים, n=25, אותה α. אם σ האוכלוסייה = האומדן הבלתי-מוטה במדגם – למי סיכוי גבוה יותר לדחות את H₀?

חוקר א' (Z). מאחר ש-n=25<120, הערך הקריטי של t (1.711 ל-df=24) גדול ומחמיר יותר מזה של Z (1.65). הסטטיסטי המחושב זהה אצל שניהם, ולכן ל-Z קל יותר לחצות את הערך הקריטי.

🟣 תרגול 2.2 נכון/לא נכון

"במבחן t, ככל שגדל מספר הנבדקים (n<120), הערך הקריטי קטן."

נכון. יותר df → t מתקרבת לנורמלית → הערך הקריטי קטן (פחות מחמיר). מעל 120 הערך מתייצב ושווה ל-Z.

3.1 טעויות הסקה מסוג ראשון ושני

▾

שורה תחתונה טעות I (α) = דחינו אפקט שלא קיים. טעות II (β) = פספסנו אפקט שקיים. ביניהן יחס הפוך: מקטינים את α → β גדלה.

🔵 ההגדרות

טעות מסוג ראשון (α): דחיית H₀ בטעות – כשהיא נכונה במציאות ("זיהינו אפקט שלא קיים"). דוגמה: בדיקת היריון חיובית כשאין היריון.
טעות מסוג שני (β): אי-דחיית H₀ – כש-H₁ נכונה במציאות ("פספסנו אפקט שקיים").

טבלת ההכרעה (2×2) — לב הפרק
ההחלטה ↓ \ במציאות →	H₀ נכונה	H₀ שגויה (H₁ נכונה)
דוחים את H₀	טעות מסוג ראשון (α)	עוצמת המבחן (1−β) ✔️
לא דוחים את H₀	רמת ביטחון (1−α) ✔️	טעות מסוג שני (β)

🟠 איך עונים על שאלות "המצבים האפשריים" קוראים את השורה או העמודה מהטבלה:
• "כש-H₀ נכונה" → טעות I או רמת ביטחון.
• "כשדוחים H₀" → טעות I או עוצמה.
• "כש-H₀ שגויה" → טעות II או עוצמה.
• "כשלא דוחים H₀" → טעות II או רמת ביטחון.

הקשר ההפוך α ↔ β

קיים יחס הפוך: ככל שמקטינים את α (מחמירים, מעלים רמת ביטחון) → β גדלה והעוצמה קטנה. ולהפך: הגדלת α מקטינה את β. גורמים המשפיעים על β: רמת הביטחון (α), σ האוכלוסייה, וגודל המדגם.

🔴 טעות נפוצה שימוש שגוי בטבלת Z במקום t (כש-n<120) → ערך קריטי מקל מדי → סיכוי גבוה יותר לטעות מסוג ראשון, ונמוך יותר לטעות מסוג שני, מהמתוכנן.

🟣 תרגול 3.1

פסיכולוג לא מצא הבדל מובהק בין שני טיפולים, אך ידוע שבמציאות קיים הבדל. איזו טעות?

טעות מסוג שני (β). לא דחה את H₀ למרות שבמציאות יש אפקט – כלומר "פספס" אותו.

3.2 עוצמת המבחן וגודל האפקט

▾

שורה תחתונה עוצמה = 1−β: גדלה עם n, קטנה עם רמת ביטחון ועם σ. גודל אפקט (d של כהן) לא תלוי ב-n, ואינו אותו דבר כמו מובהקות.

🔵 עוצמת המבחן עוצמה = 1 − β ההסתברות לדחות את H₀ כאשר H₁ נכונה במציאות (לזהות אפקט קיים, ולצדוק בדחייה).

גורמים המשפיעים על העוצמה

אם...	העוצמה (1−β)	מדוע
n גדל ↑	גדלה ↑	טעות התקן קטנה → קל יותר לזהות חריגים
רמת ביטחון גדלה ↑ (α קטנה)	קטנה ↓	נשמרים מטעות I אך "משלמים" בטעות II
σ האוכלוסייה גדל ↑	קטנה ↓	פיזור גדול → קשה לזהות אפקט

גודל האפקט (Cohen's d)

מודד את עוצמת התופעה – המידה שבה קיים הבדל משמעותי בין הממוצעים.

🟠 העיקרון הכי נבחן בפרק גודל האפקט אינו מושפע מגודל המדגם (בניגוד לעוצמה). וכן: מובהקות ≠ גודל אפקט. ייתכן אפקט חלש אך מובהק (תרופה שמורידה 2% סימפטומים במדגם ענק), וייתכן אפקט חזק שאינו מובהק (תרופה שמורידה 10% אך במדגם קטן מדי). אי אפשר לנבא גודל אפקט מתוך מובהקות, ולהפך.

אם גודל האפקט גדול – ניתן לזהות אותו גם במדגמים קטנים.

🟣 תרגול 3.2

דנה מצאה אפקט מובהק ברמת ביטחון 99%. מה גודל האפקט?

לא ניתן לדעת בוודאות. מובהקות אינה מגלה את גודל האפקט – הם בלתי תלויים.

4.1 רווח סמך לאומדן ממוצע – רב"ס Z

▾

שורה תחתונה X̄ ± Z_α/2·(σ/√n). מדגם גדול → רווח צר; רמת ביטחון גבוהה → רווח רחב; הממוצע לא משפיע על הרוחב. רווח שלא מכיל את μ₀ → דוחים את H₀.

במקום אומדן נקודתי (X̄), בונים טווח שבתוכו צפוי להימצא ממוצע האוכלוסייה, ברמת ביטחון נתונה.

🔵 נוסחאות (σ ידועה) CI: X̄ ± Z_α/2 · (σ/√n) אורך הרווח: L = 2 · Z_α/2 · (σ/√n) | הסטייה המרבית (חצי רווח) = L/2
מציאת n מתוך אורך רצוי L: n ≥ ( 2 · Z_α/2 · σ / L )²

מה משפיע על רוחב הרווח?

גורם	השפעה על הרוחב
רמת ביטחון ↑ (1−α גדלה)	הרווח גדל (כדי להבטיח לכידת μ)
גודל מדגם n ↑	הרווח קטן (n במכנה תחת שורש)
שונות / σ ↑	הרווח גדל
ממוצע המדגם X̄	אינו משפיע על הרוחב (רק על המיקום!)

🟢 דוגמה פתורה – לחץ דם קשישים n=225, X̄=148, σ=20, רמת ביטחון 95% (Z_α/2=1.96).

רווח = 148 ± 1.96·(20/√225) = 148 ± 1.96·1.333 = 148 ± 2.613 → P{145.387 – 150.613}

הסטייה המרבית = 2.613.

אם נגדיל את n פי 4: n במכנה תחת שורש → הרווח יצטמצם פי √4 = 2.

🟢 דוגמה פתורה – מציאת n מתוך L σ=30, רוצים לצמצם רווח ל-{198–204} (L=6), אותה רמת ביטחון (Z≈2):

n ≥ (2 · 2 · 30 / 6)² = (20)² = 400 נבדקים.

שימוש ברווח סמך לבחינת השערות

למדגם יחיד: אם הרווח אינו מכיל את μ₀ של H₀ → דוחים את H₀. להפרש ממוצעים (שני מדגמים): אם הרווח אינו מכיל את 0 → דוחים.

🟣 תרגול 4.1

חוקר רוצה להפוך רווח סמך לצר ומדויק יותר. כיצד יוכל?

הגדלת גודל המדגם ו/או שימוש ברמת ביטחון קטנה יותר. (שינוי הממוצע לא ישפיע על הרוחב.)

4.2 רווח סמך – מבחן t

▾

שורה תחתונה בדיוק כמו רווח סמך Z — אבל עם Ŝ ועם ערך t (לפי df=n−1), כי σ של האוכלוסייה לא ידועה.

כאשר σ האוכלוסייה אינה ידועה, משתמשים בשונות המתוקנת Ŝ ובערך קריטי מטבלת t.

🔵 נוסחה (σ לא ידועה) CI: X̄ ± t_{α/2 , df=n−1} · (Ŝ/√n) שלבים: מחשבים X̄ ו-Ŝ מנתוני המדגם, שולפים t קריטי לפי df ורמת הביטחון, ומציבים.

🟠 הומוגניות והרוחב ככל שהאוכלוסייה הומוגנית יותר (שונות קטנה) → הרווח קטן יותר. ערכים שליליים ברווח אפשריים לחלוטין (אם המשתנה יכול לקבל ערכים שליליים, או אם הגבול התחתון שלילי).

🟣 תרגול 4.2

מתי בוחרים רווח סמך t ולא Z?

כאשר σ של האוכלוסייה אינה ידועה ומשתמשים באומדן (Ŝ) מתוך נתוני המדגם – בדיוק כמו ההבדל בין מבחן t למבחן Z.

5.1 מבחן t לשני מדגמים בלתי-תלויים

▾

שורה תחתונה 2 קבוצות נפרדות. df = n₁+n₂−2. משתמשים בשונות משוקללת (Ŝ²ₚ). רווח להפרש שלא כולל 0 → דוחים את H₀.

משווים ממוצעים של שתי קבוצות נפרדות (שתי אוכלוסיות), כדי לבדוק אם ההבדל ביניהן מובהק.

🔵 מתי, השערות, נוסחאות מתי? משתנה בלתי-תלוי דיכוטומי/קטגוריאלי (שתי קבוצות), משתנה תלוי כמותי; הנתונים בשתי הקבוצות נאספו ללא תלות זה בזה.
H₀: μ₁ = μ₂ (ההפרש = 0) ; H₁: μ₁ ≠ μ₂ (או כיווני).
df = n₁ + n₂ − 2 שונות משוקללת (pooled): Ŝ²_p = [ Ŝ₁²(n₁−1) + Ŝ₂²(n₂−1) ] / (n₁ + n₂ − 2) סטטיסטי המבחן: t = (X̄₁ − X̄₂) / √( Ŝ²_p · (1/n₁ + 1/n₂) ) גודל אפקט (d של כהן): d = (X̄₁ − X̄₂) / √Ŝ²_p

🟢 דוגמה פתורה – שעות שינה (מעונות מול לא-מעונות) n₁=n₂=9. קבוצה 1: X̄₁=7.56, Ŝ₁=1.33. קבוצה 2: X̄₂=6.33, Ŝ₂=0.87. דו-זנבי, α=5%.

df = 9+9−2 = 16, t קריטי = ±2.12

שונות משוקללת: Ŝ²p = [1.33²·8 + 0.87²·8]/16 = 1.26

t מחושב = (7.56−6.33)/√(1.26·(1/9+1/9)) = 1.23/0.529 = 2.33 > 2.12 → דוחים H₀

גודל אפקט: d = 1.23/√1.26 = 1.09 → אפקט גדול.

🔴 טעות נפוצה ההפרש בין שני מדגמים מעיד על גודל אפקט (לא על עוצמה/טעות). הסטטיסטי הנבדק הוא הפרש הממוצעים (לא ממוצע יחיד). t מובהק = השונות בין הקבוצות (מונה) גדולה מהשונות בתוך הקבוצות (מכנה).

🟣 תרגול 5.1

רווח סמך להפרש הממוצעים יצא {2 עד 6}, וההשערה הייתה שקבוצה א' גדולה מ-ב'. האם דוחים H₀?

כן. שני הגבולות חיוביים → הרווח אינו מכיל את 0 (וכולו מימין לאפס, בכיוון ההשערה) → דוחים את H₀ ותומכים ב-H₁.

5.2 מבחן t לשני מדגמים תלויים (מזווגים)

▾

שורה תחתונה זוגות / לפני-אחרי. עובדים על ההפרשים d. df = n−1 (n=מספר הזוגות). בוחרים את המבחן לפי שאלת המחקר — לא לפי קיום זוגות בנתונים.

משמש כאשר יש תלות/זיווג בין התצפיות: מדידות חוזרות על אותם נבדקים (לפני/אחרי), או זוגות (תאומים, בני-זוג, אחים).

🔵 נוסחאות ודרגות חופש עובדים על ההפרשים d בין כל זוג. df = n − 1 (n = מספר הזוגות; n זוגות = 2n תצפיות).
כשנתונה ס"ת מתוקנת של ההפרשים: t = d̄ / (Ŝ_d / √n) מנתונים גולמיים: t = Σdᵢ / √( [ n·Σdᵢ² − (Σdᵢ)² ] / (n−1) )

🟠 למה t תלויים "חזק" יותר? בזיווג, כל נבדק משמש כ"קבוצת הביקורת של עצמו" → ההבדלים האינדיבידואליים מנוכים → שונות הטעות (הלא-מוסברת) קטנה → טעות התקן (המכנה) קטנה → t מחושב גדל → סיכוי גבוה יותר לדחות את H₀ וטעות II קטנה (בתנאי מתאם חיובי בין הזוגות). שים לב: df קטנה יותר (n−1 במקום n₁+n₂−2), ולכן הערך הקריטי מעט מחמיר – אבל היתרון בשונות הקטנה גובר.

🔴 הטעות הקלאסית במבחן בחירת המבחן נקבעת לפי שאלת המחקר וההשערה – לא לפי כך שבמקרה יש זוגות בנתונים! אם ההשערה אינה דורשת זיווג (למשל "הבדל בין גברים לנשים" כקבוצות), משתמשים ב-t בלתי-תלויים גם אם חלק מהנבדקים נשואים זה לזה. כמו כן, אם ההפרשים (או המדידות) אינם מתפלגים נורמלית – לא ניתן להשתמש במבחן t כלל.

🟢 דוגמה פתורה – טיפול בחרדת מבחנים (לפני/אחרי) n=10 סטודנטים, מדידה לפני ואחרי טיפול. השערה: הטיפול משפר ציונים (חד-זנבי ימני), α=5%.

H₀: μ_d ≤ 0 ; H₁: μ_d > 0, df = 10−1 = 9, t קריטי = 1.833

מחשבים לכל נבדק d = (ציון אחרי − לפני), ואז d̄ ו-Ŝ_d. מציבים בנוסחה ומשווים ל-1.833.

כלל ההכרעה: דוחים את H₀ אם t מחושב > 1.833.

🟣 תרגול 5.2

במדגם מזווג n=40 זוגות. כמה תצפיות יש? וכמה דרגות חופש?

80 תצפיות (כל זוג = 2 תצפיות), אך df = 40 − 1 = 39 (n הוא מספר הזוגות).

6. ניתוח שונות חד-כיווני (One-Way ANOVA)

▾

שורה תחתונה ≥3 קבוצות. F = MSB/MSW. F≤1 → לא דוחים (בלי טבלה). F>1 → בודקים מול F קריטי. מובהק → לפחות זוג אחד נבדל (לא כולם).

השוואת ממוצעים של שלוש קבוצות או יותר בו-זמנית, באמצעות יחס בין שני סוגי שונות.

🔵 מתי משתמשים? משתנה בלתי-תלוי קטגוריאלי (שמי/סדר) עם ≥3 קבוצות, ומשתנה תלוי כמותי. השערה: "קיים הבדל בין הקבוצות". תוצאה מובהקת מעידה שלפחות זוג אחד של קבוצות נבדל – לא בהכרח כולן.

טבלת ה-ANOVA – לשנן בעל-פה!
מקור שונות	SS (סכום ריבועים)	DF	MS	F
Between (בין-קבוצתית / מוסברת)	SSB = Σ nⱼ(X̄ⱼ − X̿)²	k − 1	MSB = SSB/DFB	F = MSB / MSW
Within (תוך-קבוצתית / טעות / לא-מוסברת)	SSW = Σ(Xᵢⱼ − X̄ⱼ)²	N − k	MSW = SSW/DFW	F = MSB / MSW
Total	SST = SSB + SSW = Σ(Xᵢⱼ − X̿)²	N − 1	—	—

k = מספר הקבוצות · N = סך כל הנבדקים · X̄ⱼ = ממוצע קבוצה j · X̿ = הממוצע הכללי · nⱼ = גודל קבוצה j

🟠 האינטואיציה של F F הוא יחס: כמה השונות בין הקבוצות (האפקט) גדולה מהשונות בתוך הקבוצות (רעש/טעות).

F ≤ 1 (MSB ≤ MSW) → בטוח לא דוחים את H₀ (אין צורך אפילו בטבלה).
F > 1 → בודקים מול F קריטי. דוחים רק אם F מחושב > F קריטי.
F = 1 פירושו MSB = MSW בדיוק.

מדווחים תמיד בצורה F(dfB, dfW) = value.

🟢 דוגמה פתורה – השלמת טבלת ANOVA נתון: SSB=120, DFB=3 ; SSW=100, DFW=20.

MSB = 120/3 = 40 · MSW = 100/20 = 5

F = 40/5 = 8 · SST = 220 · DFT = 23 → דיווח: F(3,20)=8

🟢 דוגמה פתורה – חישוב SSB והכרעה 4 קבוצות, n=5 בכל אחת, ממוצעים: 35 ; 25.8 ; 18.6 ; 29.4 ; נתון MSW=78, α=5%.

ממוצע כללי X̿ = 27.2 (ממוצע 4 הממוצעים, כי הקבוצות שוות בגודל)

SSB = 5·(35−27.2)² + 5·(25.8−27.2)² + 5·(18.6−27.2)² + 5·(29.4−27.2)² = 708

DFB = 4−1 = 3 → MSB = 708/3 = 236 · DFW = 20−4 = 16

F = 236/78 = 3.02 · F קריטי(3,16) ב-5% = 3.24

3.02 < 3.24 → לא דוחים את H₀, לא נמצא הבדל מובהק.

שינויים במערך – מה קורה ל-F?

הפעולה	התוצאה
הוספת נבדקים הזהים לממוצע קבוצתם	SSB ↑ (n גדל), DFB ללא שינוי → MSB↑ ; SSW ללא שינוי, DFW↑ → MSW↓ → F מחושב גדל, F קריטי קטן → קל יותר לדחות
טרנספורמציה לינארית (הכפלת כל הערכים בקבוע)	F לא משתנה (SSB ו-SSW משתנים באותה מידה, df לא משתנה)
אין שונות בין הקבוצות (ממוצעים זהים)	SSB=0 → F=0 → בטוח לא דוחים

🟠 הקשר בין t ל-F עבור שתי קבוצות בלבד, ANOVA ומבחן t לב"ת נותנים אותה מסקנה, ומתקיים F = t². (ל-≥3 קבוצות חייבים ANOVA – מתאם פירסון/ניבוי אינם רלוונטיים כאן.)

🟣 תרגול 6.1

נתון DFB=4 ו-DFW=40, מספר נבדקים שווה בקבוצות. כמה קבוצות וכמה נבדקים סה"כ ובכל קבוצה?

DFB = k−1 = 4 → k=5 קבוצות. DFW = N−k = N−5 = 40 → N=45. בכל קבוצה: 45/5 = 9 נבדקים.

🟣 תרגול 6.2 מתקיים/לא

תוצאת ANOVA מובהקת. נכון ש"קיים הבדל מובהק בין ממוצע כל קבוצה לכל קבוצה אחרת"?

לא מתקיים. תוצאה מובהקת מעידה רק שקיים הבדל אחד לפחות בין זוג קבוצות – לא בהכרח בין כולן. (מתקיים בוודאות: MSB>MSW, F>1, F מחושב>F קריטי.)

נספח א': טבלת עזר לניסוח השערות

▾

דוגמה: נתון שממוצע האוכלוסייה μ₀ = 80 (תקף למבחן Z ו-t למדגם יחיד).

סוג המבחן	השערת אפס H₀	השערת מחקר H₁	אזור דחייה
חד-צדדי ימני ("גבוה מ-")	μ₀ ≤ 80	μ₁ > 80	זנב ימני
דו-צדדי ("שונה מ-")	μ₀ = 80	μ₁ ≠ 80	שני הזנבות (α/2 בכל אחד)
חד-צדדי שמאלי ("נמוך מ-")	μ₀ ≥ 80	μ₁ < 80	זנב שמאלי

🟠 לשני מדגמים / ANOVA בהשוואה בין אוכלוסיות H₀ תמיד "אין הבדל" (ההפרש = 0). בקשר בין משתנים H₀ "אין קשר". ב-ANOVA H₀: כל הממוצעים שווים.

נספח ב': דף נוסחאות מרוכז

▾

🔵 התפלגות הדגימה ו-Z טעות תקן: e = σ / √n Z (יחיד): Z = (X − μ)/σ Z (ממוצע מדגם): Z = (X̄ − μ)/(σ/√n)

🔵 מבחן t למדגם יחיד t = (X̄ − μ₀)/(Ŝ/√n) , df = n − 1

🔵 רווח סמך + מציאת n רב"ס Z: X̄ ± Z_α/2·(σ/√n) רב"ס t: X̄ ± t_α/2·(Ŝ/√n) מציאת n: n ≥ (2·Z_α/2·σ / L)²

🔵 t לשני מדגמים בלתי-תלויים Ŝ²_p = [Ŝ₁²(n₁−1)+Ŝ₂²(n₂−1)]/(n₁+n₂−2) t = (X̄₁−X̄₂)/√(Ŝ²_p(1/n₁+1/n₂)) , df = n₁+n₂−2 d (כהן) = (X̄₁−X̄₂)/√Ŝ²_p

🔵 t לשני מדגמים תלויים t = d̄/(Ŝ_d/√n) , df = n − 1 גולמי: t = Σdᵢ / √([n·Σdᵢ² − (Σdᵢ)²]/(n−1))

🔵 ANOVA SSB = Σnⱼ(X̄ⱼ−X̿)² ; DFB = k−1 ; MSB = SSB/DFB SSW = Σ(Xᵢⱼ−X̄ⱼ)² ; DFW = N−k ; MSW = SSW/DFW SST = SSB+SSW ; DFT = N−1 ; F = MSB/MSW

נספח ג': איך קוראים את טבלאות Z, t, F

▾

טבלת Z

בשוליים מאתרים את ערך ה-Z, ובתוך הטבלה מקבלים את השטח המצטבר (ההסתברות עד אותו Z).
לזנב הימני (שטח מעל): מחשבים 1 − השטח המצטבר. דוגמה: Z=2.17 → מצטבר 0.9850 → מעל = 0.015.
ערכים קריטיים נפוצים: 1.645 (5% חד), 1.96 (5% דו), 2.33 (1% חד), 2.58 (1% דו).

טבלת t

נכנסים לפי דרגות החופש (df) בשורה, ולפי רמת המובהקות והכיוון (חד/דו-זנבי) בעמודה.
ככל ש-df גדל הערך קטן ומתקרב ל-Z; מ-df≈120 הם שווים.
בדו-זנבי משתמשים ב-α/2 בכל עמודה.

טבלת F

שתי דרגות חופש: dfB = מונה (בראש העמודות), dfW = מכנה (בשורות).
בוחרים את הטבלה/שורה לפי רמת המובהקות (יש טבלה נפרדת ל-5% ול-1%).
דוגמה: F(3,16) ב-5% → ערך קריטי 3.24. F(2,3) ב-1% → 30.82.

🔴 שים לבF תמיד חד-זנבי (ימני) – אין F שלילי. ב-ANOVA אין "כיוון" השערה.

טבלאות השוואה מסכמות – "מתי כל מבחן?"

▾

בחירת המבחן הסטטיסטי הנכון
המבחן	מתי משתמשים	דרגות חופש
Z – מדגם יחיד	השוואת ממוצע מדגם ל-μ ידוע, כש-σ ידועה	אין (נורמלית)
t – מדגם יחיד	כמו Z, אבל σ אינה ידועה	n − 1
t – שני מדגמים ב"ת	הבדל בין 2 קבוצות נפרדות (משתנה בת"ל דיכוטומי, תלוי כמותי)	n₁ + n₂ − 2
t – שני מדגמים תלויים	2 מדידות מזווגות (לפני/אחרי, זוגות)	n − 1
ANOVA חד-כיווני	הבדל בין ≥3 קבוצות (בת"ל קטגוריאלי, תלוי כמותי)	dfB=k−1 ; dfW=N−k

Z מול t
	מבחן Z	מבחן t
שונות אוכלוסייה	ידועה	לא ידועה (אומדים ב-Ŝ²)
אומדן של	הממוצע בלבד	ממוצע + שונות
התפלגות	נורמלית אחת	משפחת התפלגויות (לפי df)
ערך קריטי (n<120)	קטן יותר (מקל)	גדול יותר (מחמיר)
ב-n≥120	הערכים הקריטיים זהים

שונות בין-קבוצתית מול תוך-קבוצתית (ANOVA)
	Between (MSB)	Within (MSW)
מה מודדת	שונות מוסברת (האפקט)	שונות לא-מוסברת (טעות/רעש)
מיקום ב-F	מונה	מכנה
df	k − 1	N − k

🟠 דקה אחרונה לפני המבחן

זהה: σ ידועה? (Z/t) · כמה קבוצות? (1 / 2 / ≥3) · תלויות או לא?
נסח השערות לפי כיוון (חד/דו-זנבי) – זה קובע את הערך הקריטי.
חשב סטטיסטי מחושב, שלוף ערך קריטי לפי df ו-α.
הכרעה: |מחושב| > |קריטי| → דחה H₀. בחר מסיח שמדבר על האוכלוסייה ב"שפת תמיכה" (פסול כל מסיח עם "הוכיח/בוודאות").
זכור: מובהקות ≠ גודל אפקט · המסקנה על האוכלוסייה · אי-דחייה ≠ הוכחת H₀.