STATISTIEK 3
Inhoudsopgave
1 Inferentie voor vergelijken van 2 populatiegemiddelden ........................................................................ 7
1.1 Data...................................................................................................................................................... 7
2 Flowchart van data-analytische proces ................................................................................................... 7
2.1 Voorbereidingen ................................................................................................................................... 8
2.2 Exploratieve data-analyse .................................................................................................................... 8
2.3 Statistische inferentie ........................................................................................................................... 8
2.3.1 Stap 1: formuleer modellen en hypothesen ................................................................................... 9
2.3.2 Stap 2: toetsstatistiek → keuze en waarde ................................................................................... 10
2.3.3 Stap 3: leid steekproefverdeling af en bepaal p-waarde en (optioneel) neem beslissing ............ 11
2.3.4 Stap 4: bepaal effectgrootte ......................................................................................................... 12
2.4 Presentatie ......................................................................................................................................... 12
2.5 Opmerking.......................................................................................................................................... 13
1 Variantie-analyse met één factor .......................................................................................................... 14
2 Notatie en voorstelling van gegevens ................................................................................................... 14
3 Exploratieve data-analyse ..................................................................................................................... 15
4 Statistische inferentie ........................................................................................................................... 15
4.1 Formuleer modellen en hypothesen ................................................................................................... 15
4.2 Toetsstatistiek: keuze en waarde ....................................................................................................... 16
4.2.1 Fit van beide modellen .................................................................................................................. 16
4.2.2 Complexiteit van beide modellen ................................................................................................. 17
4.3 Leid steekproevenverdeling af ........................................................................................................... 19
5 Evaluatie van effectgrootte ................................................................................................................... 20
5.1 Verschilmaten .................................................................................................................................... 20
5.1.1 Gepland ruw verschil tussen 2 gemiddelden en BI (methode 1) .................................................. 20
5.1.2 Gestandaardiseerd verschil (methode 2) ...................................................................................... 21
5.2 Associatiematen ................................................................................................................................. 21
5.2.1 Methode 1: 𝑅2 (proportie verklaarde variantie) ......................................................................... 21
5.2.2 Methode 2: 𝜔2 .............................................................................................................................. 22
5.3 Opmerkingen ...................................................................................................................................... 22
6 Assumpties van ANOVA-modellen ........................................................................................................ 22
6.1 Schendingen van assumpties ............................................................................................................. 23
6.1.1 Gelijke populatiestandaarddeviaties = cruciaal ............................................................................ 23
6.1.2 Normaliteit .................................................................................................................................... 24
6.1.3 Onafhankelijkheid ......................................................................................................................... 24
6.2 Robuustheid tegen uitbijters .............................................................................................................. 24
1 Contrast-analyse ................................................................................................................................... 26
1
,2 Een gepland contrast............................................................................................................................. 27
2.1 Statistische inferentie ......................................................................................................................... 27
2.1.1 STAP 1: formuleer modellen en hypothesen ................................................................................ 27
2.1.2 STAP 2: toetsstatistiek → keuze en waarde .................................................................................. 28
2.1.3 STAP 3: leid steekproevenverdeling af en bepaal p-waarde ......................................................... 28
2.1.4 STAP 4: bepaal effectgrootte ........................................................................................................ 28
2.1.5 STAP 5: conclusie ........................................................................................................................... 28
3 Meerdere geplande contrasten (multiple comparisons) ........................................................................ 29
4 Complexe posthoc contrasten ............................................................................................................... 30
5 Paarsgewijze contrasten ....................................................................................................................... 32
6 Contrastcorrecties ................................................................................................................................. 32
1 Variantie-analyse met 2 factoren .......................................................................................................... 33
2 Exploratieve data-analyse ..................................................................................................................... 33
3 Notatie en voorstelling van gegevens ................................................................................................... 33
4 Hoofdeffecten en interactie-effecten .................................................................................................... 34
5 Effectparameters .................................................................................................................................. 36
5.1 Variantieanalyse met één factor ........................................................................................................ 36
5.2 Variantieanalyse met twee factoren .................................................................................................. 37
5.2.1 Parameters bij een 3x3 .................................................................................................................. 38
5.2.2 Schatten op basis van steekproef met kleinste kwadratenschatters van effectparameters ........ 39
6 Statistische inferentie ........................................................................................................................... 39
6.1 Hoofdeffect van factor A .................................................................................................................... 39
6.1.1 STAP 1: formuleer modellen en hypothesen ................................................................................ 39
6.1.2 STAP 2: toetsstatistiek: keuze en waarde ..................................................................................... 40
6.1.3 STAP 3: bepaal steekproevenverdeling en p-waarde ................................................................... 41
6.1.4 STAP 4: bepaal effectgrootte ........................................................................................................ 41
6.1.5 STAP 5: (voorlopige) conclusie voor hoofdeffect A ....................................................................... 42
6.2 Hoofdeffect van factor B .................................................................................................................... 42
6.2.1 STAP 1: formuleer modellen en hypothesen ................................................................................ 42
6.2.2 STAP 2: toetsstatistiek: keuze en waarde ..................................................................................... 42
6.2.3 STAP 3: bepaal steekproevenverdeling en p-waarde ................................................................... 43
6.2.4 STAP 4: bepaal effectgrootte ........................................................................................................ 43
6.3 Interactie-effect.................................................................................................................................. 43
6.3.1 STAP 1: formuleer modellen en hypothesen ................................................................................ 43
6.3.2 STAP 2: toetsstatistiek: keuze en waarde ..................................................................................... 44
6.3.3 STAP 3: bepaal steekproevenverdeling en p-waarde ................................................................... 44
6.3.4 STAP 4: bepaal effectgrootte ........................................................................................................ 44
6.3.5 STAP 5: conclusie opstellen ........................................................................................................... 45
6.4 Opmerkingen ...................................................................................................................................... 45
7 Assumpties ........................................................................................................................................... 45
8 Contrast-analyse ................................................................................................................................... 45
2
,1 Enkelvoudige regressieanalyse .............................................................................................................. 46
2 Notatie en voorstelling van gegevens ................................................................................................... 46
2.1 Voorstelling van variabelen ................................................................................................................ 46
3 Exploratieve data-analyse: lijnplot ........................................................................................................ 46
3.1 Kengetallen ........................................................................................................................................ 47
4 Enkelvoudige lineaire regressiemodel, assumpties en interpretatie ..................................................... 47
4.1 Interpretatie ....................................................................................................................................... 47
4.2 Assumpties ......................................................................................................................................... 48
5 Statistische inferentie ........................................................................................................................... 48
5.1 STAP 1: formuleer modellen en hypothesen ...................................................................................... 49
5.1.1 Fit................................................................................................................................................... 49
5.1.2 Complexiteit van beide modellen ................................................................................................. 50
5.2 STAP 2: toetsstatistiek: keuze en waarde .......................................................................................... 50
5.2.1 Optie 1: F-statistiek ....................................................................................................................... 50
5.2.2 Optie 2: t-statistiek ........................................................................................................................ 50
5.3 STAP 3: bepaal steekproevenverdeling en p-waarde ......................................................................... 51
6 Effectgrootte ......................................................................................................................................... 51
6.1 Associatiesterkte ................................................................................................................................ 51
6.2 Regressiegewicht (en BI) .................................................................................................................... 51
6.3 Gestandaardiseerde regressiegewichten ........................................................................................... 52
7 Centreren .............................................................................................................................................. 52
8 Assumpties van enkelvoudige lineaire regressie ................................................................................... 53
8.1 Lineariteit ........................................................................................................................................... 53
8.2 Gelijke varianties-onafhankelijkheid-normaliteit ............................................................................... 54
9 Grafische hulpmiddelen voor nagaan van modelassumpties ................................................................. 54
9.1 Spreidingsdiagrammen ...................................................................................................................... 54
9.2 Residuenplots ..................................................................................................................................... 54
9.3 Boxplots.............................................................................................................................................. 55
1 Meervoudige lineaire regressie ............................................................................................................. 56
2 Exploratieve data-analyse ..................................................................................................................... 56
2.1 Draftman’s plot/ matrix van spreidingsdiagrammen ........................................................................ 56
3 Notatie .................................................................................................................................................. 57
4 Meervoudige lineaire regressie ............................................................................................................. 57
4.1 Figuur voor meervoudige lineaire regressie ....................................................................................... 57
4.2 Regressiecoëfficiënten ....................................................................................................................... 57
4.3 Achterliggende assumpties ................................................................................................................ 58
3
, 4.4 Inferenties die mogelijk zijn................................................................................................................ 58
5 Statistische inferentie met betrekking tot 1 regressiegewicht ............................................................... 58
5.1 STAP 1: formuleer modellen en hypothesen ...................................................................................... 58
5.1.1 Fit van beide modellen .................................................................................................................. 59
5.1.2 Complexiteit van beide modellen ................................................................................................. 59
5.2 STAP 2: toetsstatistiek: keuze en waarde .......................................................................................... 60
5.2.1 F-statistiek ..................................................................................................................................... 60
5.2.2 T-statistiek ..................................................................................................................................... 60
5.3 STAP 3: bepaal steekproevenverdeling en p-waarde ......................................................................... 60
6 Effectgrootte ......................................................................................................................................... 61
6.1 Associatiesterkte ................................................................................................................................ 61
6.2 Gekwadrateerde partcorrelatie/ semi-partiële .................................................................................. 62
6.3 Regressiegewicht (en corresponderend BI) ........................................................................................ 63
6.4 Gestandaardiseerde regressiegewichten ........................................................................................... 64
6.5 Conclusie ............................................................................................................................................ 64
7 Correlaties tussen predictoren .............................................................................................................. 64
7.1 Onechte correlatie .............................................................................................................................. 65
7.2 Suppressie .......................................................................................................................................... 65
7.3 (Multi)collineariteit ............................................................................................................................ 66
8 Toets voor meerdere predictoren ......................................................................................................... 66
8.1 STAP 1: hypothesen en modellen (Toets voor β3, β4 en β5 samen) .................................................... 67
8.2 STAP 2: toetsstatistiek → F-statistiek ................................................................................................ 68
8.3 STAP 3: p-waarde ............................................................................................................................... 68
8.4 STAP 4: effectmaat ............................................................................................................................ 68
8.5 CONCLUSIE ......................................................................................................................................... 68
1 Speciale predictoren bij MLR ................................................................................................................. 69
2 Categorische predictoren en dummy-variabelen ................................................................................... 69
2.1 Voorbeeld ........................................................................................................................................... 69
2.1.1 Hartslag ......................................................................................................................................... 69
2.1.2 Scholastic Achievement Test (SAT)-data ....................................................................................... 69
2.1.3 Kwalitatieve/ categorische variabelen. ......................................................................................... 69
2.2 Exploratieve data-analyse .................................................................................................................. 70
2.2.1 Gecodeerd spreidingsdiagram ...................................................................................................... 70
2.3 Dummycodering ................................................................................................................................. 70
2.3.1 Hartslagvoorbeeld ......................................................................................................................... 70
2.3.2 SAT-data voorbeeld ....................................................................................................................... 70
2.4 Populatiemodel .................................................................................................................................. 71
2.4.1 c = 2 (dus 1 dummy) ...................................................................................................................... 71
2.4.2 c > 2 (dus meer dan 1 dummy) ...................................................................................................... 72
2.5 Statistische inferentie ......................................................................................................................... 73
2.5.1 C = 2 ............................................................................................................................................... 73
4
Inhoudsopgave
1 Inferentie voor vergelijken van 2 populatiegemiddelden ........................................................................ 7
1.1 Data...................................................................................................................................................... 7
2 Flowchart van data-analytische proces ................................................................................................... 7
2.1 Voorbereidingen ................................................................................................................................... 8
2.2 Exploratieve data-analyse .................................................................................................................... 8
2.3 Statistische inferentie ........................................................................................................................... 8
2.3.1 Stap 1: formuleer modellen en hypothesen ................................................................................... 9
2.3.2 Stap 2: toetsstatistiek → keuze en waarde ................................................................................... 10
2.3.3 Stap 3: leid steekproefverdeling af en bepaal p-waarde en (optioneel) neem beslissing ............ 11
2.3.4 Stap 4: bepaal effectgrootte ......................................................................................................... 12
2.4 Presentatie ......................................................................................................................................... 12
2.5 Opmerking.......................................................................................................................................... 13
1 Variantie-analyse met één factor .......................................................................................................... 14
2 Notatie en voorstelling van gegevens ................................................................................................... 14
3 Exploratieve data-analyse ..................................................................................................................... 15
4 Statistische inferentie ........................................................................................................................... 15
4.1 Formuleer modellen en hypothesen ................................................................................................... 15
4.2 Toetsstatistiek: keuze en waarde ....................................................................................................... 16
4.2.1 Fit van beide modellen .................................................................................................................. 16
4.2.2 Complexiteit van beide modellen ................................................................................................. 17
4.3 Leid steekproevenverdeling af ........................................................................................................... 19
5 Evaluatie van effectgrootte ................................................................................................................... 20
5.1 Verschilmaten .................................................................................................................................... 20
5.1.1 Gepland ruw verschil tussen 2 gemiddelden en BI (methode 1) .................................................. 20
5.1.2 Gestandaardiseerd verschil (methode 2) ...................................................................................... 21
5.2 Associatiematen ................................................................................................................................. 21
5.2.1 Methode 1: 𝑅2 (proportie verklaarde variantie) ......................................................................... 21
5.2.2 Methode 2: 𝜔2 .............................................................................................................................. 22
5.3 Opmerkingen ...................................................................................................................................... 22
6 Assumpties van ANOVA-modellen ........................................................................................................ 22
6.1 Schendingen van assumpties ............................................................................................................. 23
6.1.1 Gelijke populatiestandaarddeviaties = cruciaal ............................................................................ 23
6.1.2 Normaliteit .................................................................................................................................... 24
6.1.3 Onafhankelijkheid ......................................................................................................................... 24
6.2 Robuustheid tegen uitbijters .............................................................................................................. 24
1 Contrast-analyse ................................................................................................................................... 26
1
,2 Een gepland contrast............................................................................................................................. 27
2.1 Statistische inferentie ......................................................................................................................... 27
2.1.1 STAP 1: formuleer modellen en hypothesen ................................................................................ 27
2.1.2 STAP 2: toetsstatistiek → keuze en waarde .................................................................................. 28
2.1.3 STAP 3: leid steekproevenverdeling af en bepaal p-waarde ......................................................... 28
2.1.4 STAP 4: bepaal effectgrootte ........................................................................................................ 28
2.1.5 STAP 5: conclusie ........................................................................................................................... 28
3 Meerdere geplande contrasten (multiple comparisons) ........................................................................ 29
4 Complexe posthoc contrasten ............................................................................................................... 30
5 Paarsgewijze contrasten ....................................................................................................................... 32
6 Contrastcorrecties ................................................................................................................................. 32
1 Variantie-analyse met 2 factoren .......................................................................................................... 33
2 Exploratieve data-analyse ..................................................................................................................... 33
3 Notatie en voorstelling van gegevens ................................................................................................... 33
4 Hoofdeffecten en interactie-effecten .................................................................................................... 34
5 Effectparameters .................................................................................................................................. 36
5.1 Variantieanalyse met één factor ........................................................................................................ 36
5.2 Variantieanalyse met twee factoren .................................................................................................. 37
5.2.1 Parameters bij een 3x3 .................................................................................................................. 38
5.2.2 Schatten op basis van steekproef met kleinste kwadratenschatters van effectparameters ........ 39
6 Statistische inferentie ........................................................................................................................... 39
6.1 Hoofdeffect van factor A .................................................................................................................... 39
6.1.1 STAP 1: formuleer modellen en hypothesen ................................................................................ 39
6.1.2 STAP 2: toetsstatistiek: keuze en waarde ..................................................................................... 40
6.1.3 STAP 3: bepaal steekproevenverdeling en p-waarde ................................................................... 41
6.1.4 STAP 4: bepaal effectgrootte ........................................................................................................ 41
6.1.5 STAP 5: (voorlopige) conclusie voor hoofdeffect A ....................................................................... 42
6.2 Hoofdeffect van factor B .................................................................................................................... 42
6.2.1 STAP 1: formuleer modellen en hypothesen ................................................................................ 42
6.2.2 STAP 2: toetsstatistiek: keuze en waarde ..................................................................................... 42
6.2.3 STAP 3: bepaal steekproevenverdeling en p-waarde ................................................................... 43
6.2.4 STAP 4: bepaal effectgrootte ........................................................................................................ 43
6.3 Interactie-effect.................................................................................................................................. 43
6.3.1 STAP 1: formuleer modellen en hypothesen ................................................................................ 43
6.3.2 STAP 2: toetsstatistiek: keuze en waarde ..................................................................................... 44
6.3.3 STAP 3: bepaal steekproevenverdeling en p-waarde ................................................................... 44
6.3.4 STAP 4: bepaal effectgrootte ........................................................................................................ 44
6.3.5 STAP 5: conclusie opstellen ........................................................................................................... 45
6.4 Opmerkingen ...................................................................................................................................... 45
7 Assumpties ........................................................................................................................................... 45
8 Contrast-analyse ................................................................................................................................... 45
2
,1 Enkelvoudige regressieanalyse .............................................................................................................. 46
2 Notatie en voorstelling van gegevens ................................................................................................... 46
2.1 Voorstelling van variabelen ................................................................................................................ 46
3 Exploratieve data-analyse: lijnplot ........................................................................................................ 46
3.1 Kengetallen ........................................................................................................................................ 47
4 Enkelvoudige lineaire regressiemodel, assumpties en interpretatie ..................................................... 47
4.1 Interpretatie ....................................................................................................................................... 47
4.2 Assumpties ......................................................................................................................................... 48
5 Statistische inferentie ........................................................................................................................... 48
5.1 STAP 1: formuleer modellen en hypothesen ...................................................................................... 49
5.1.1 Fit................................................................................................................................................... 49
5.1.2 Complexiteit van beide modellen ................................................................................................. 50
5.2 STAP 2: toetsstatistiek: keuze en waarde .......................................................................................... 50
5.2.1 Optie 1: F-statistiek ....................................................................................................................... 50
5.2.2 Optie 2: t-statistiek ........................................................................................................................ 50
5.3 STAP 3: bepaal steekproevenverdeling en p-waarde ......................................................................... 51
6 Effectgrootte ......................................................................................................................................... 51
6.1 Associatiesterkte ................................................................................................................................ 51
6.2 Regressiegewicht (en BI) .................................................................................................................... 51
6.3 Gestandaardiseerde regressiegewichten ........................................................................................... 52
7 Centreren .............................................................................................................................................. 52
8 Assumpties van enkelvoudige lineaire regressie ................................................................................... 53
8.1 Lineariteit ........................................................................................................................................... 53
8.2 Gelijke varianties-onafhankelijkheid-normaliteit ............................................................................... 54
9 Grafische hulpmiddelen voor nagaan van modelassumpties ................................................................. 54
9.1 Spreidingsdiagrammen ...................................................................................................................... 54
9.2 Residuenplots ..................................................................................................................................... 54
9.3 Boxplots.............................................................................................................................................. 55
1 Meervoudige lineaire regressie ............................................................................................................. 56
2 Exploratieve data-analyse ..................................................................................................................... 56
2.1 Draftman’s plot/ matrix van spreidingsdiagrammen ........................................................................ 56
3 Notatie .................................................................................................................................................. 57
4 Meervoudige lineaire regressie ............................................................................................................. 57
4.1 Figuur voor meervoudige lineaire regressie ....................................................................................... 57
4.2 Regressiecoëfficiënten ....................................................................................................................... 57
4.3 Achterliggende assumpties ................................................................................................................ 58
3
, 4.4 Inferenties die mogelijk zijn................................................................................................................ 58
5 Statistische inferentie met betrekking tot 1 regressiegewicht ............................................................... 58
5.1 STAP 1: formuleer modellen en hypothesen ...................................................................................... 58
5.1.1 Fit van beide modellen .................................................................................................................. 59
5.1.2 Complexiteit van beide modellen ................................................................................................. 59
5.2 STAP 2: toetsstatistiek: keuze en waarde .......................................................................................... 60
5.2.1 F-statistiek ..................................................................................................................................... 60
5.2.2 T-statistiek ..................................................................................................................................... 60
5.3 STAP 3: bepaal steekproevenverdeling en p-waarde ......................................................................... 60
6 Effectgrootte ......................................................................................................................................... 61
6.1 Associatiesterkte ................................................................................................................................ 61
6.2 Gekwadrateerde partcorrelatie/ semi-partiële .................................................................................. 62
6.3 Regressiegewicht (en corresponderend BI) ........................................................................................ 63
6.4 Gestandaardiseerde regressiegewichten ........................................................................................... 64
6.5 Conclusie ............................................................................................................................................ 64
7 Correlaties tussen predictoren .............................................................................................................. 64
7.1 Onechte correlatie .............................................................................................................................. 65
7.2 Suppressie .......................................................................................................................................... 65
7.3 (Multi)collineariteit ............................................................................................................................ 66
8 Toets voor meerdere predictoren ......................................................................................................... 66
8.1 STAP 1: hypothesen en modellen (Toets voor β3, β4 en β5 samen) .................................................... 67
8.2 STAP 2: toetsstatistiek → F-statistiek ................................................................................................ 68
8.3 STAP 3: p-waarde ............................................................................................................................... 68
8.4 STAP 4: effectmaat ............................................................................................................................ 68
8.5 CONCLUSIE ......................................................................................................................................... 68
1 Speciale predictoren bij MLR ................................................................................................................. 69
2 Categorische predictoren en dummy-variabelen ................................................................................... 69
2.1 Voorbeeld ........................................................................................................................................... 69
2.1.1 Hartslag ......................................................................................................................................... 69
2.1.2 Scholastic Achievement Test (SAT)-data ....................................................................................... 69
2.1.3 Kwalitatieve/ categorische variabelen. ......................................................................................... 69
2.2 Exploratieve data-analyse .................................................................................................................. 70
2.2.1 Gecodeerd spreidingsdiagram ...................................................................................................... 70
2.3 Dummycodering ................................................................................................................................. 70
2.3.1 Hartslagvoorbeeld ......................................................................................................................... 70
2.3.2 SAT-data voorbeeld ....................................................................................................................... 70
2.4 Populatiemodel .................................................................................................................................. 71
2.4.1 c = 2 (dus 1 dummy) ...................................................................................................................... 71
2.4.2 c > 2 (dus meer dan 1 dummy) ...................................................................................................... 72
2.5 Statistische inferentie ......................................................................................................................... 73
2.5.1 C = 2 ............................................................................................................................................... 73
4