Blok 1: T-toetsen en ANOVA
Berekenen van die associaties m.b.v. odds/risico’s kan alleen bij dichotome
variabele en dichotome uitkomst. Voor andere variabele (continue,
discreet, categoriaal >2 categorieën) voldoet de 2x2 tabel niet meer.
T-toetsen gebruiken we als we een associatie willen toetsen waarbij de
uitkomst kwantitatief is en de determinant dichotoom is.
We onderscheiden 3 typen t-toetsen:
- T-toets voor onafhankelijke steekproeven (independent t-test); bijv is
er een verschil in bloeddruk tussen de interventiegroep de controle
groep?
- Gepaarde t-toets (paired/dependent sample t-test); bijv is er een
verschil in rekenvaardigheden bij premasterstudenten
gezondheidswetenschappen aan het begin en aan het eind van het
premasterprogramma (= herhaalde metingen bij dezelfde
personen).
- One-sample t-test; bijv volgens het RIVM hebben Nederlandse
vrouwen tussen 30-39 jaar een gemiddeld BMI van 24,4. Heeft de
patientenpopulatie vrouwen 30-39 jaar van de huisartsenpraktijk X
een gemiddeld BMI van 24,4? (= een steekproef vergelijken met een
standaard).
Hoe groter de steekproef, hoe meer de t-verdeling op een normale
verdeling (strandard normal/z-verdeling) lijkt (zie verschil rood en groen).
De vorm van de t-verdeling wordt bepaald door het aantal vrijheidsgraden
(= DF = degrees of freedom). Geeft het aantal waarden in een steekproef
dat vrij en onafhankelijk mag variëren, zonder de waarde van de statistiek
te veranderen.
DF =n−1
,Je moet het aantal DF weten om de kritieke t-waarde waartegen we
toetsen op te zoeken.
Voorbeeld one-sample t-test
Stel: je docent statistiek vertelt aan het begin van de cursus dat het
gemiddelde tentamencijfer MTB vorig jaar een 7 was. Jij denkt dat jouw
docent je probeert te motiveren en een veel te positief beeld schetst.
Je trekt een steekproef om te weten te komen of het verschil tussen het
gemiddelde tentamencijfer in je steekproef en het door de docent
aangegeven tentamencijfer groter is dan je op basis van kans zou
verwachten. Welke hypothese formuleer je?
H0: gemiddelde = 7
H1: gemiddelde is niet gelijk aan 7.
Je vraagt 30 studenten die vorig jaar MTB 1 volgden naar hun
tentamencijfer. Je vindt een gemiddelde van 6.3 met een variantie van
1.96. Zijn deze gegevens genoeg bewijs om te concluderen dat de docent
een veel te positief beeld heeft geschetst van de tentamencijfers vorig
jaar?
De informatie op een rijtje:
- N = 30
- Steekproefgemiddelde = 6.3
- Variantie = 1.96
- Verwachte gemiddelde in populatie = 7
M −μ
t=
Sm
m s s2
S = =√
√N n
Sm = standaardfout.
S2 = variantie in de steekproef.
S = standaarddeviatie in de steekproef.
M = steekproefgemiddelde.
7.3−7
t=
Sm
, 1.96
Sm=√ = 0.255
30
7.3−7
t= = -2.745
0.255
DF =30−1=29
Kritieke waarde: minimale t-waarde om H0 af te mogen wijzen. Opzoeken
in tabel op basis van DF en gekozen p-waarde. In dit voorbeeld DF =29, P-
waarde = 0.05. Kritieke waarde = 2,042.
Conclusie: de berekende t-waarde valt buiten het kritieke gebied. De kans
op ons steekproefgemiddelde gegeven een verwachte populatie
gemiddelde van 7, is kleiner dan alpha = 0.05. Ofwel: p < alpha of p <
0.05. Op basis hiervan mag je de H0 afwijzen! De statistiekdocent heeft
inderdaad een te rooskleurig beeld geschetst.
One-sample t-test in SPSS: BMI
Via ANALYZE > COMPARE MEANS > One Sample T-test
Eerste tabel: Tweede tabel: uitkomst t-toets
- N - T-waarde
- Gemiddelde - DF
- SD - P-waarde (sig 2-tailed)
Berekenen van die associaties m.b.v. odds/risico’s kan alleen bij dichotome
variabele en dichotome uitkomst. Voor andere variabele (continue,
discreet, categoriaal >2 categorieën) voldoet de 2x2 tabel niet meer.
T-toetsen gebruiken we als we een associatie willen toetsen waarbij de
uitkomst kwantitatief is en de determinant dichotoom is.
We onderscheiden 3 typen t-toetsen:
- T-toets voor onafhankelijke steekproeven (independent t-test); bijv is
er een verschil in bloeddruk tussen de interventiegroep de controle
groep?
- Gepaarde t-toets (paired/dependent sample t-test); bijv is er een
verschil in rekenvaardigheden bij premasterstudenten
gezondheidswetenschappen aan het begin en aan het eind van het
premasterprogramma (= herhaalde metingen bij dezelfde
personen).
- One-sample t-test; bijv volgens het RIVM hebben Nederlandse
vrouwen tussen 30-39 jaar een gemiddeld BMI van 24,4. Heeft de
patientenpopulatie vrouwen 30-39 jaar van de huisartsenpraktijk X
een gemiddeld BMI van 24,4? (= een steekproef vergelijken met een
standaard).
Hoe groter de steekproef, hoe meer de t-verdeling op een normale
verdeling (strandard normal/z-verdeling) lijkt (zie verschil rood en groen).
De vorm van de t-verdeling wordt bepaald door het aantal vrijheidsgraden
(= DF = degrees of freedom). Geeft het aantal waarden in een steekproef
dat vrij en onafhankelijk mag variëren, zonder de waarde van de statistiek
te veranderen.
DF =n−1
,Je moet het aantal DF weten om de kritieke t-waarde waartegen we
toetsen op te zoeken.
Voorbeeld one-sample t-test
Stel: je docent statistiek vertelt aan het begin van de cursus dat het
gemiddelde tentamencijfer MTB vorig jaar een 7 was. Jij denkt dat jouw
docent je probeert te motiveren en een veel te positief beeld schetst.
Je trekt een steekproef om te weten te komen of het verschil tussen het
gemiddelde tentamencijfer in je steekproef en het door de docent
aangegeven tentamencijfer groter is dan je op basis van kans zou
verwachten. Welke hypothese formuleer je?
H0: gemiddelde = 7
H1: gemiddelde is niet gelijk aan 7.
Je vraagt 30 studenten die vorig jaar MTB 1 volgden naar hun
tentamencijfer. Je vindt een gemiddelde van 6.3 met een variantie van
1.96. Zijn deze gegevens genoeg bewijs om te concluderen dat de docent
een veel te positief beeld heeft geschetst van de tentamencijfers vorig
jaar?
De informatie op een rijtje:
- N = 30
- Steekproefgemiddelde = 6.3
- Variantie = 1.96
- Verwachte gemiddelde in populatie = 7
M −μ
t=
Sm
m s s2
S = =√
√N n
Sm = standaardfout.
S2 = variantie in de steekproef.
S = standaarddeviatie in de steekproef.
M = steekproefgemiddelde.
7.3−7
t=
Sm
, 1.96
Sm=√ = 0.255
30
7.3−7
t= = -2.745
0.255
DF =30−1=29
Kritieke waarde: minimale t-waarde om H0 af te mogen wijzen. Opzoeken
in tabel op basis van DF en gekozen p-waarde. In dit voorbeeld DF =29, P-
waarde = 0.05. Kritieke waarde = 2,042.
Conclusie: de berekende t-waarde valt buiten het kritieke gebied. De kans
op ons steekproefgemiddelde gegeven een verwachte populatie
gemiddelde van 7, is kleiner dan alpha = 0.05. Ofwel: p < alpha of p <
0.05. Op basis hiervan mag je de H0 afwijzen! De statistiekdocent heeft
inderdaad een te rooskleurig beeld geschetst.
One-sample t-test in SPSS: BMI
Via ANALYZE > COMPARE MEANS > One Sample T-test
Eerste tabel: Tweede tabel: uitkomst t-toets
- N - T-waarde
- Gemiddelde - DF
- SD - P-waarde (sig 2-tailed)