voor 1 gemiddelde/groep, toetsen voor bepaalde waarde
Schaalnive Toets voor gemiddelde:
au - x = één categorische variabele
variabelen - y = één continue variabele
Toets voor proportie:
- x = proportie van 0 tot 1
- y = één continue variabele
Voorbeeld Tweezijdig: Is het gemiddelde uurloon voor vrouwen gelijk aan 12?
vraag
Eenzijdig: Is het gemiddelde uurloon voor vrouwen hoger dan 12?
Hypothese Tweezijdig Eenzijdig:
n H0: μ = 12 H0: μ = 12
HA: μ ≠ 12 HA: μ > 12
α = .05 α = .10
Assumpties De steekproefgemiddelden zijn normaal verdeeld
(steekproevenverdeling). Bij een steekproef van minder dan 30
kan er moet je een t-toets doen. Voor steekproeven groter dan 30
kan een z-toets ook. SPSS voert alleen t-toetsen uit.
Uitrekenen Point estimate = gemiddelde, mediaan, modus. (SPSS: freq
met de y/stat=all)
hand Interval estimate = betrouwbaarheidsinterval.
Betrouwbaarheidsinterval = interval dat met een bepaalde
zekerheid aangeeft dat de populatiewaarde in dit interval liggen.
Bijvoorbeeld: We kunnen met 95% zekerheid zeggen dat het
interval μ bevat.
Definitie wikipedia = bij herhaling van de procedure met steeds
nieuwe steekproeven uit dezelfde populatie mogen we verwachten
dat 95% van de intervallen de ware μ bevatten.
- Point estimate ± Margin of error
- Formule CI95% = sample mean of sample prop ± 1.96 * SE.
- Formule CI90% = sample mean of sample prop ± 2.58 * SE.
- Hoe krijg je het interval met SPSS?
1) freq y/stat=all. Dan krijg je Mean en Std Error of Mean -> zelf
uitrekenen.
2) Examine reli/cint 95.
3) T-toets. Vul bij de test value in 0. Als de waarde van H0 niet in
het interval ligt dan kan H0 verworpen worden.
T-verdeling
- Voor grote sample sizes een z-verdeling. Voor sample size < 30
een t-verdeling.
- Verdeling hangt af van de df (df = n – 1). Hoe groter de df hoe
meer normaal verdeeld en hoe meer de verdeling op een z-
, verdeling lijkt.
SPSS Menu:
Analyze -> Compare Means -> One-Sample T Test -> vul y-var in
en test value = 12
Syntax:
T-TEST
/TESTVAL = 12
/MISSING = ANALYSIS
/VARIABLES = inc
/CRITERIA = CI (.95). of /CRITERIA = CI (.90).
Output Mean: is de richting zoals verwacht?
Mean difference = mean-test value
T-waarde: is toetsingsgrootheid = mean difference/SE mean
P-waarde: wel of niet significant
95% Confidence Interval: test value 0 invullen -> ligt de waarde
van H0 niet in het confidence interval? -> H0 verwerpen.
Rapportere Tweezijdig: er is bewijs dat het gemiddelde uurloon voor vrouwen
n significant niet gelijk is aan 12 (t=14.822, p<.001).
Eenzijdig: er is bewijs dat het gemiddelde uurloon voor vrouwen
significant hoger is dan 12 euro (t=14.822, p<.001/2).
Let op! Als je eenzijdig toetst en de richting is niet zoals je
had verwacht in je HA, dan moet je de 1 min de p-waarde doen.
Stel HA: gem > 25, maar het gem blijkt 20 te zijn met een p-
waarde kleiner dan .001. Dan moet je rapporteren dat je toets niet
sig met p = 1 – .001 = .999.
, T-toets
voor 2 gemiddelden, verschillen de twee groepen
Schaalniv - x = één categorische variabele met daarbinnen twee
eau groepen
variabele - y = één continue variabele
n
Voorbeel Onafhankelijke groepen: Afhankelijke groepen:
d vraag - Tweezijdig: Verschilt de - Tweezijdig: Is er een verschil in
leeftijd tussen jongens en de scores van de nameting en de
meisjes wanneer ze het huis scores van de voormeting?
uitgaan? - Eenzijdig: Zijn de scores van de
- Eenzijdig: Is de leeftijd dat nameting hoger dan de scores
meisjes het huis uitgaan hoger van de voormeting?
dan de leeftijd dat jongens het
huis uitgaan?
Hypothes Onafhankelijke groepen: Afhankelijke groepen:
en Tweezijdig Tweezijdig
H0: μ (meisjes) = μ (jongens) H0: μ (na) – μ (voor) = 0
HA: μ (meisjes) ≠ μ (jongens) HA: μ (na) – μ (voor) ≠ 0
α = .05 α = .05
Eenzijdig: Eenzijdig:
H0: μ (meisjes) ≤ μ (jongens) H0: μ (na) - μ (voor) ≤ 0
HA: μ (meisjes) > μ (jongens) HA: μ (na) - μ (voor) > 0
α = .10 α = .10
Uitrekene Zie schema t-toets voor 1 gemiddelde.
n met de
hand CI = (μ2 – μ1) ± t (se)
Je neemt de point estimate (gemiddelde) en dan doe je + en – de
margin of error (= t score * se).
Assumpti De steekproefgemiddelden zijn normaal verdeeld
es (steekproevenverdeling). Bij een steekproef van minder dan 30
kan er moet je een t-toets doen. Voor steekproeven groter dan 30
kan een z-toets ook. SPSS voert alleen t-toetsen uit.
De groepen moeten onafhankelijk zijn, dus bijvoorbeeld geen voor-
en nameting.
Levene test: toetst de nul-hypothese dat de variantie van de
groepen gelijk zijn. Als deze toets significant is dan moet je naar
de onderste rij kijken.
SPSS Onafhankelijke groepen: Afhankelijke groepen:
Menu: Menu:
Analyze -> Compare Means -> Analyze -> Compare Means ->
Independent Samples T Test Paired-Samples T-Test
, Syntax: Syntax:
T-TEST GROUPS=sex(0 1) T-TEST PAIRS=voor WITH na
/MISSING=ANALYSIS (PAIRED)
/VARIABLES=ageleft /CRITERIA=CI(.95)
/CRITERIA=CI(.95). /MISSING=ANALYSIS.
Output Mean: is de richting zoals verwacht?
Mean difference = het verschil in gemiddelden. Gem jongens –
gem meisjes.
Levene’s test for equality of variances: sig -> verder kijken in de
onderste rij.
T-waarde: is toetsingsgrootheid = mean difference/SE mean
P-waarde: wel of niet significant
95% Confidence Interval: test value 0 invullen -> ligt de waarde
van H0 niet in het Confidence Interval? -> H0 verwerpen.
Rapporte Onafhankelijke groepen:
ren Eenzijdig: Er is bewijs dat
meisjes significant eerder het
huis verlaten dan jongens
(t=15.22, p<.001/2). Meisjes
verlaten gemiddeld het huis als
ze 20.5 zijn. Jongens op de
leeftijd 22.2.
, F-toets/ANOVA
Voor meer dan 2 groepen
Schaalniv - x = één categorische variabele met daarbinnen meer dan
eau 2 groepen
variabele - y = één continue variabele
n
Voorbeel Tweezijdig: Is het inkomen van de klassen white collar, blue collar
d vraag en farm gelijk?
Hypothes Tweezijdig
en H0: gem farm = gem blue collar = gem white collar
Ha: tenminste één gemiddelde wijkt af
Assumpti Homogeniteit
es
Uitrekene
n met de
hand
SPSS Menu:
Analyze -> compare means -> oneway anova.
Syntax:
ONE WAY hrinc BY class
/STATISTICS DESCRIPTIVES
/MISSING ANALYSIS.
Output Mean: eyeballen, wat zijn de gemiddelden. Liggen de gemiddelden
ver uiteen?
Sum of Squares: Between Groups, Within Groups en Total
Df van SS Between, SS Within en SS Total
F-waarde
P-waarde: significant of niet?
95% Confidence Interval: Lower Bound en Upper Bound.
Rapporte M white collar = 19.06
ren M blue collar = 15.72
M farm = 14.44
SS Between = 4507.35 met df 2
SS Within = 171275.52 met df 1966
SS Total = 175782.87 met df 1968
F = 25.869
P<.001
Voor eenzijdig toetsen p=getal/2!!