1
Inhoudsopgave
Hoorcollege 1 & 2 13-04-2023........................................................................................................................ 3
Lineaire relaties....................................................................................................................................................5
Statistisch model..................................................................................................................................................6
Analyse.................................................................................................................................................................7
Verklaarde variantie.............................................................................................................................................7
Assumpties...........................................................................................................................................................8
Voorbeeld met vier voorspellers.........................................................................................................................11
Afwijkingen in data en mogelijke oplossingen...................................................................................................11
Hoorcollege 3 20-04-2023 Variantieanalyses (ANOVA)..................................................................................13
T-toets voor onafhankelijke groepen.................................................................................................................13
T-toets voor 2 onafhankelijke groepen..............................................................................................................13
T-toets voor gepaarde waarnemingen..............................................................................................................14
Eénwegvariantieanalyse....................................................................................................................................14
Tweewegvariantieanalyse..................................................................................................................................16
Overig.................................................................................................................................................................17
Interactie-effect..................................................................................................................................................17
Hoorcollege 4 25-04-2023 Ancova................................................................................................................ 18
Covariantieanalyse.............................................................................................................................................18
Reductive errorvariantie.....................................................................................................................................19
Verwijdering van systematische bias.................................................................................................................19
Assumpties Ancova............................................................................................................................................20
Binnengroepsregressie.......................................................................................................................................20
Gecorrigeerde middelden...................................................................................................................................21
Samenvatting.....................................................................................................................................................23
Hoorcollege 5 02-04-2023 Regressieanalyse met categorische predictoren...................................................24
Regressielijnen voor verschillende groepen.......................................................................................................24
Analyseplan........................................................................................................................................................25
Analyse...............................................................................................................................................................27
Hoorcollege 6 09-05-2023 Logistische regressieanalyse.................................................................................29
Concepten...........................................................................................................................................................29
Statistisch model................................................................................................................................................32
Analyse...............................................................................................................................................................34
Odds en Odds ratio.............................................................................................................................................36
Transformatie.....................................................................................................................................................37
,2
Hoorcollege 7 11-05-2023 Repeated measures ANOVA.................................................................................39
Herhaalde metingen (repeated measures)...................................................................................................39
Assumpties van sfericiteit..............................................................................................................................40
Contrasten.....................................................................................................................................................40
Hoorcollege 8 08-06-2023 (wordt nog toegevoegd)......................................................................................43
,3
Hoorcollege 1 & 2 13-04-2023
Inferentiële statistiek: wat zegt de steekproefuitkomst over de populatie?
- Aangeven van onzekerheid
Terminologie
› Populatie:
§ Groep waarvan onderzoeker eigenschappen wil weten
› Parameter:
§ Numerieke samenvatting van eigenschap in populatie
› Steekproef:
§ Subgroep uit populatie die onderzocht wordt
› Statistic (ook wel schatter):
§ Numerieke samenvatting van eigenschap in steekproef
Inferentiële statistiek
› Voorbeeld: het gemiddelde in de steekproef kun je gebruiken om
§ Het gemiddelde in populatie te schatten
§ Kansuitspraken te doen over het gemiddelde in de populatie
› Nodig om kansuitspraken te doen:
§ Steekproevenverdeling:
Wat gebeurt er wanneer we het over zouden doen?
Twee methoden voor inferentie
1) Betrouwbaarheidsintervallen
Indicatie van de parameter (bij herhaald steekproeftrekken)
2) Hypothesetoetsen (= significantietoetsen)
“de kans op deze steekproefuitkomst is zo klein als de nulhypothese waar zou zijn, dat het
onwaarschijnlijk is dat de populatiegrootheid die waarde (H0) heeft”
Populatie en steekproef
Betrouwbaarheidsintervallen
› Bhi gebaseerd op steekproevenverdeling rond parameter (bv. µ, π)
§ Middelste C% van de verdeling
§ Afstand tot midden = margin of error
§ Margin of error = kritieke waarde * standaardfout
› Altijd rond steekproefuitkomst
› Iedere keer ander interval
› Doel: schatten parameter
› Algemeen: informatiever dan significantietoets
‘Als we heel vaak een betrouwbaarheidsinterval op deze manier zouden opstellen, zou dit in C% van
de gevallen de parameter omvatten’
‘Als ons betrouwbaarheidsinterval de parameter omvat (en dat is het geval in C% van de
steekproeven), dan ligt de parameter tussen [ondergrens] en [bovengrens]’
Opbouw betrouwbaarheidsinterval
§ Statistic +/- margin of error
Ofwel
§ Statistic +/- kritieke waarde * standaardfout
, 4
Toetsen
› Nulhypothese: een populatiegrootheid heeft een bepaalde waarde
› Alternatieve hypothese: de populatie-grootheid heeft die waarde niet (groter, kleiner, ongelijk)
Probeer de nulhypothese te verwerpen
Vb. H0: = 0 versus Ha: ≠ 0
Uit de steekproef In de populatie
› P-waarde
§ The probability of getting an outcome as extreme or more extreme than the actually
observed outcome, given H0.
§ Hoe kleiner p des te sterker is het bewijs tegen de nulhypothese, d.w.z. Hoe
onwaarschijnlijker de nulhypothese is.
• Hoe klein is p?
Vergelijk met significantieniveau
› P < α : significant : “er lijkt bewijs tegen de nulhypothese” (maar dit hoeft niet per se sterk
bewijs te zijn)
› P > α : niet significant : “geen idee of er een populatie-effect is”
Opbouw toets
› Test statistic: “hoeveel standaardfouten ligt gevonden uitkomst van de waarde onder de H0
af”?
› P-waarde: wat is de kans op minstens de gevonden test statistic?
Problemen bij significantietoetsing
1) Complexe redenatie: Heel vaak fouten bij interpretatie van resultaten
2) Slechts twee mogelijke uitkomsten (significant/niet significant):
Onnodige en schadelijke reductie van informatie!
3) Kan leiden tot gebruik questionable research practices
Belang beschrijvende statistiek
› Beschrijvende statistiek gebruik je vóór inferentiële statistiek, d.w.z.: bekijk eerst je data
voordat je toetst/bhis maakt
§ Beschrijvende maten, zoals gemiddelde, SD, mediaan, minimum, maximum, IQR, etc.
§ Grafische weergaven, zoals histogram, boxplot, spreidingsdiagram, QQ-plot, etc.
› Dit is niet minder, maar een essentiële eerste stap. Toesen/bhi’s zonder beschrijvende
statistiek is vaak niet informatief
Soorten variabelen
› NOM: nominaal (“labels”)
› DUM: dummyvariabelen (bv. D = 1: experimenteel, D = 0: controle)
› INT: interval/kwantitatieve variabele
Welk model?
Onafh. Afh.
X X Y Model
1 2
DUM INT t-toets voor onafhankelijke
groepen
NOM INT éénwegvariantieanalyse
(ANOVA)
NOM NOM INT tweewegvariantieanalyse
(ANOVA)
INT INT enkelvoudige
regressieanalyse
INT INT INT multipele regressieanalyse
Inhoudsopgave
Hoorcollege 1 & 2 13-04-2023........................................................................................................................ 3
Lineaire relaties....................................................................................................................................................5
Statistisch model..................................................................................................................................................6
Analyse.................................................................................................................................................................7
Verklaarde variantie.............................................................................................................................................7
Assumpties...........................................................................................................................................................8
Voorbeeld met vier voorspellers.........................................................................................................................11
Afwijkingen in data en mogelijke oplossingen...................................................................................................11
Hoorcollege 3 20-04-2023 Variantieanalyses (ANOVA)..................................................................................13
T-toets voor onafhankelijke groepen.................................................................................................................13
T-toets voor 2 onafhankelijke groepen..............................................................................................................13
T-toets voor gepaarde waarnemingen..............................................................................................................14
Eénwegvariantieanalyse....................................................................................................................................14
Tweewegvariantieanalyse..................................................................................................................................16
Overig.................................................................................................................................................................17
Interactie-effect..................................................................................................................................................17
Hoorcollege 4 25-04-2023 Ancova................................................................................................................ 18
Covariantieanalyse.............................................................................................................................................18
Reductive errorvariantie.....................................................................................................................................19
Verwijdering van systematische bias.................................................................................................................19
Assumpties Ancova............................................................................................................................................20
Binnengroepsregressie.......................................................................................................................................20
Gecorrigeerde middelden...................................................................................................................................21
Samenvatting.....................................................................................................................................................23
Hoorcollege 5 02-04-2023 Regressieanalyse met categorische predictoren...................................................24
Regressielijnen voor verschillende groepen.......................................................................................................24
Analyseplan........................................................................................................................................................25
Analyse...............................................................................................................................................................27
Hoorcollege 6 09-05-2023 Logistische regressieanalyse.................................................................................29
Concepten...........................................................................................................................................................29
Statistisch model................................................................................................................................................32
Analyse...............................................................................................................................................................34
Odds en Odds ratio.............................................................................................................................................36
Transformatie.....................................................................................................................................................37
,2
Hoorcollege 7 11-05-2023 Repeated measures ANOVA.................................................................................39
Herhaalde metingen (repeated measures)...................................................................................................39
Assumpties van sfericiteit..............................................................................................................................40
Contrasten.....................................................................................................................................................40
Hoorcollege 8 08-06-2023 (wordt nog toegevoegd)......................................................................................43
,3
Hoorcollege 1 & 2 13-04-2023
Inferentiële statistiek: wat zegt de steekproefuitkomst over de populatie?
- Aangeven van onzekerheid
Terminologie
› Populatie:
§ Groep waarvan onderzoeker eigenschappen wil weten
› Parameter:
§ Numerieke samenvatting van eigenschap in populatie
› Steekproef:
§ Subgroep uit populatie die onderzocht wordt
› Statistic (ook wel schatter):
§ Numerieke samenvatting van eigenschap in steekproef
Inferentiële statistiek
› Voorbeeld: het gemiddelde in de steekproef kun je gebruiken om
§ Het gemiddelde in populatie te schatten
§ Kansuitspraken te doen over het gemiddelde in de populatie
› Nodig om kansuitspraken te doen:
§ Steekproevenverdeling:
Wat gebeurt er wanneer we het over zouden doen?
Twee methoden voor inferentie
1) Betrouwbaarheidsintervallen
Indicatie van de parameter (bij herhaald steekproeftrekken)
2) Hypothesetoetsen (= significantietoetsen)
“de kans op deze steekproefuitkomst is zo klein als de nulhypothese waar zou zijn, dat het
onwaarschijnlijk is dat de populatiegrootheid die waarde (H0) heeft”
Populatie en steekproef
Betrouwbaarheidsintervallen
› Bhi gebaseerd op steekproevenverdeling rond parameter (bv. µ, π)
§ Middelste C% van de verdeling
§ Afstand tot midden = margin of error
§ Margin of error = kritieke waarde * standaardfout
› Altijd rond steekproefuitkomst
› Iedere keer ander interval
› Doel: schatten parameter
› Algemeen: informatiever dan significantietoets
‘Als we heel vaak een betrouwbaarheidsinterval op deze manier zouden opstellen, zou dit in C% van
de gevallen de parameter omvatten’
‘Als ons betrouwbaarheidsinterval de parameter omvat (en dat is het geval in C% van de
steekproeven), dan ligt de parameter tussen [ondergrens] en [bovengrens]’
Opbouw betrouwbaarheidsinterval
§ Statistic +/- margin of error
Ofwel
§ Statistic +/- kritieke waarde * standaardfout
, 4
Toetsen
› Nulhypothese: een populatiegrootheid heeft een bepaalde waarde
› Alternatieve hypothese: de populatie-grootheid heeft die waarde niet (groter, kleiner, ongelijk)
Probeer de nulhypothese te verwerpen
Vb. H0: = 0 versus Ha: ≠ 0
Uit de steekproef In de populatie
› P-waarde
§ The probability of getting an outcome as extreme or more extreme than the actually
observed outcome, given H0.
§ Hoe kleiner p des te sterker is het bewijs tegen de nulhypothese, d.w.z. Hoe
onwaarschijnlijker de nulhypothese is.
• Hoe klein is p?
Vergelijk met significantieniveau
› P < α : significant : “er lijkt bewijs tegen de nulhypothese” (maar dit hoeft niet per se sterk
bewijs te zijn)
› P > α : niet significant : “geen idee of er een populatie-effect is”
Opbouw toets
› Test statistic: “hoeveel standaardfouten ligt gevonden uitkomst van de waarde onder de H0
af”?
› P-waarde: wat is de kans op minstens de gevonden test statistic?
Problemen bij significantietoetsing
1) Complexe redenatie: Heel vaak fouten bij interpretatie van resultaten
2) Slechts twee mogelijke uitkomsten (significant/niet significant):
Onnodige en schadelijke reductie van informatie!
3) Kan leiden tot gebruik questionable research practices
Belang beschrijvende statistiek
› Beschrijvende statistiek gebruik je vóór inferentiële statistiek, d.w.z.: bekijk eerst je data
voordat je toetst/bhis maakt
§ Beschrijvende maten, zoals gemiddelde, SD, mediaan, minimum, maximum, IQR, etc.
§ Grafische weergaven, zoals histogram, boxplot, spreidingsdiagram, QQ-plot, etc.
› Dit is niet minder, maar een essentiële eerste stap. Toesen/bhi’s zonder beschrijvende
statistiek is vaak niet informatief
Soorten variabelen
› NOM: nominaal (“labels”)
› DUM: dummyvariabelen (bv. D = 1: experimenteel, D = 0: controle)
› INT: interval/kwantitatieve variabele
Welk model?
Onafh. Afh.
X X Y Model
1 2
DUM INT t-toets voor onafhankelijke
groepen
NOM INT éénwegvariantieanalyse
(ANOVA)
NOM NOM INT tweewegvariantieanalyse
(ANOVA)
INT INT enkelvoudige
regressieanalyse
INT INT INT multipele regressieanalyse