Aantekeningen practicum 5 - webinar
Continue uitkomstvariabele Categorische uitkomstvariabele
Aantal Parametrische Non-parametrische Parametrische Non-parametrische
groepen toetsen* toetsen* toetsen* toetsen*
2 Independent samples Mann-Whitney test
t-test Pearson’s chi-
Fisher’s exact test
kwadraat toets
>2 One-way ANOVA Kruskal-Wallis test
Aantal
variabele
1 Enkelvoudige
lineair regressie model Logistische regressie
≥2 Meervoudige (dichotoom uitkomst)
lineair regressie model
*Parametrisch (normaal verdeeld); non-parametrisch (niet-normaal verdeeld).
*Waarnemingen onafhankelijk
Voorbeeld onderzoeksvraag: verschilt de prevalentie van type 2 diabetes mellitus (DM2) tussen
mannen (400) en vrouwen (100) ? —> uitkomstvariabele = wel / niet hebben van DM2.
H0 = Er is geen verschil in proportie personen met DM2 tussen mannen en vrouwen
H1 = Er is wel verschil in proportie personen met DM2 tussen mannen en vrouwen
Pearson’s chi-kwadraattoets = vergelijkt per cel het aantal geobserveerde waarnemingen
(O) met het aantal verwachte (E) indien H0 waar is.
(O − E )2
2
∑
Toetsingsgrootheid is X2: X =
E
Proportie personen met DM2 in hele
steekproef = 0,12
Indien H0 waar is verwachten we:
- 0,12 * 400 = 48 mannen met DM2
- 60-48 = 12 vrouwen met DM2
Tabel invullen
- Rood = verwacht (E)
- Zwart = geobserveerd (O)
(360 − 352)2 (40 − 48)2
In formule + + . . . = 7,58
352 48
Vrijheidsgraden (df) = (aantal rijen - 1) * (aantal kolommen - 1)
De verdeling van toetsingsgrootheid X2 is chi-kwadraat, hoe groter de steekproef des te
nauwkeuriger deze benaderen —> meer normaal verdeeld.
Het verwachte aantal waarnemingen moet minimaal 5 zijn. Als dit niet het geval is en er te weinig
waarnemingen per cel zijn is een Fisher’s exact test beter want data is minder normaal verdeeld.
Continue uitkomstvariabele Categorische uitkomstvariabele
Aantal Parametrische Non-parametrische Parametrische Non-parametrische
groepen toetsen* toetsen* toetsen* toetsen*
2 Independent samples Mann-Whitney test
t-test Pearson’s chi-
Fisher’s exact test
kwadraat toets
>2 One-way ANOVA Kruskal-Wallis test
Aantal
variabele
1 Enkelvoudige
lineair regressie model Logistische regressie
≥2 Meervoudige (dichotoom uitkomst)
lineair regressie model
*Parametrisch (normaal verdeeld); non-parametrisch (niet-normaal verdeeld).
*Waarnemingen onafhankelijk
Voorbeeld onderzoeksvraag: verschilt de prevalentie van type 2 diabetes mellitus (DM2) tussen
mannen (400) en vrouwen (100) ? —> uitkomstvariabele = wel / niet hebben van DM2.
H0 = Er is geen verschil in proportie personen met DM2 tussen mannen en vrouwen
H1 = Er is wel verschil in proportie personen met DM2 tussen mannen en vrouwen
Pearson’s chi-kwadraattoets = vergelijkt per cel het aantal geobserveerde waarnemingen
(O) met het aantal verwachte (E) indien H0 waar is.
(O − E )2
2
∑
Toetsingsgrootheid is X2: X =
E
Proportie personen met DM2 in hele
steekproef = 0,12
Indien H0 waar is verwachten we:
- 0,12 * 400 = 48 mannen met DM2
- 60-48 = 12 vrouwen met DM2
Tabel invullen
- Rood = verwacht (E)
- Zwart = geobserveerd (O)
(360 − 352)2 (40 − 48)2
In formule + + . . . = 7,58
352 48
Vrijheidsgraden (df) = (aantal rijen - 1) * (aantal kolommen - 1)
De verdeling van toetsingsgrootheid X2 is chi-kwadraat, hoe groter de steekproef des te
nauwkeuriger deze benaderen —> meer normaal verdeeld.
Het verwachte aantal waarnemingen moet minimaal 5 zijn. Als dit niet het geval is en er te weinig
waarnemingen per cel zijn is een Fisher’s exact test beter want data is minder normaal verdeeld.