STATISTIEK
INHOUDSOPGAVE
1. De logica van statistische vergelijkingen en analyses ................................................................. 4
inleiding: waarom data analyseren? .................................................................................................. 4
geschiedenis van de statistiek in een notendop.................................................................................. 4
het gebruik van statistiek .................................................................................................................. 4
theorieconstructie in een oogopslag .................................................................................................. 5
wat is theorie? ............................................................................................................................... 5
theorie en onderzoek ..................................................................................................................... 5
het proces van wetenschappelijk onderzoek ...................................................................................... 5
observatie en nieuwsgierigheid ...................................................................................................... 6
de centrale onderzoeksvraag ......................................................................................................... 6
onderzoeksdeelvragen ................................................................................................................... 6
onderzoek: bewegen van theorie naar data en terug ........................................................................... 6
hypothese formuleren.................................................................................................................... 6
constructie van het onderzoeksdesign ............................................................................................ 6
conceptualisering .......................................................................................................................... 7
operationalisering.......................................................................................................................... 7
data verzamelen ............................................................................................................................ 7
conclusies trekken ........................................................................................................................ 7
communiceren van resultaten........................................................................................................ 7
2. inleidende begrippen ................................................................................................................ 8
inleiding ........................................................................................................................................... 8
beschrijven, schatten en veralgemenen als statistische bedrijvigheid ................................................. 8
statistiek en de beantwoording van beschrijvende en verklarende onderzoeksvragen .......................... 9
statistische eenheden ...................................................................................................................... 9
univariate, bivariate en multivariate beschrijvende analyse................................................................. 9
meetniveaus van variabelen.............................................................................................................. 9
discrete en continue variabelen ...................................................................................................... 10
de datamatrix als input voor statistische analyses ............................................................................ 10
een handige afrondingsregel voor statistische gegevens ................................................................... 11
het sommatieteken ........................................................................................................................ 11
aspraken bij het presenteren van tabellen ....................................................................................... 11
3. de univariate beschrijvende statistiek....................................................................................... 12
inleiding ......................................................................................................................................... 12
grafieken ........................................................................................................................................ 13
, parameters van centraliteit ............................................................................................................. 14
parameters van spreiding ............................................................................................................... 15
box plot ......................................................................................................................................... 16
4. toeval & kansrekenen ............................................................................................................... 17
inleiding ......................................................................................................................................... 17
basisbegrip .................................................................................................................................... 17
wetten van kansrekenen ................................................................................................................. 18
combinatoriek ................................................................................................................................ 19
stochastische variabelen ................................................................................................................ 20
de binomiale verdeling.................................................................................................................... 21
5. de standaardnormale verdeling en diens eigenschappen........................................................... 22
inleiding ......................................................................................................................................... 22
de normale en standaardnormale verdeling ..................................................................................... 22
van normale verdeling naar standaardnormale verdeling .................................................................. 22
Z-scores en het gebruik van de tabel van de standaardnormale verdeling .......................................... 23
6. inleiding tot de bivariate beschrijvende statistiek ...................................................................... 24
inleiding: causale relaties vs statistische relaties ............................................................................. 24
causaliteit op een bierviltje ............................................................................................................. 25
symmetrische en asymmetrische relaties tussen variabelen ............................................................ 25
de doelstelling van bivariate beschrijvende statistiek ....................................................................... 26
bivariate frequentieverdelingen ....................................................................................................... 26
verantwoord kiezen tussen een reeks van associatiematen .............................................................. 27
7. bivariate associatiematen voor nominale en ordinale variabelen ............................................... 28
het percentageverschil als associatiemaat op nominaal niveau ........................................................ 28
de odds ratio als associatiemaat op nominaal niveau ....................................................................... 28
chi-kwadraat als associatiemaat op nominaal niveau....................................................................... 28
Phi ................................................................................................................................................. 29
cramer’s v ...................................................................................................................................... 29
SPEARMAN’S RANGCORRELATIECOEFFICIËNT ............................................................................... 30
8. correlatie- en regressieanalyse ................................................................................................ 31
1. symmetrische associatiematen voor kenmerken op metrisch niveau ............................................ 31
2. De bivariate lineaire regressie als asymmetrische associatiemaat................................................. 31
9. inferentiële statistiek ............................................................................................................... 36
, 1. waarom gebruiken we inferentiële statistiek? ............................................................................... 36
2. de representativiteit van steekproeven ......................................................................................... 37
3. steekproeven en populatie .......................................................................................................... 37
4. steekproeven en het principe van toeval ...................................................................................... 38
5. de theorie van toevalssteekproeven ............................................................................................. 38
6. kenmerken van steekproevenverdelingen .................................................................................... 38
7. het gebruik van de normale verdeling in de inferentiële statistiek ................................................... 39
8. de centrale limietstelling ............................................................................................................. 40
10. het berekenen van een betrouwbaarheidsinterval rond een parameter ........................................ 40
11. statistische hypothesestelling ................................................................................................... 41
12. eenzijdig of tweezijdig toetsen van een nulhypothese? ................................................................ 45
13. andere belangrijke verdelingen .................................................................................................. 46
14. de variantieanalyse als toets voor verschillen tussen groepen inzake metrische kenmerken ......... 46
15. zelf uitrekenen van een variatieanalyse ...................................................................................... 47
16. Voorbeelden van statistische inferentie in andere analysetechnieken.......................................... 50
10. de partiële correlatie als introductie tot de multivariate statistiek ............................................ 51
1. inleiding ..................................................................................................................................... 51
2. de partiële correlatie ................................................................................................................... 51
3. berekenen adhv serie van regressievergelijkingen ......................................................................... 53
4. berekening van partiële correlatie adhv rekenkundige formule ...................................................... 54
5. supression-effect: voorbeeld ....................................................................................................... 54
11. regressie analyse met twee onafhankelijke variabelen ............................................................ 55
1. inleiding: meervoudige lineaire regressie (basismodel) ................................................................. 55
3. de vergelijking tussen twee bivariatie versus één meervoudige regressie........................................ 55
4. uitbreiding naar een meervoudige lineaire regressie (extensie) ...................................................... 56
5. het relatieve belang van elke onafhankelijke variabele .................................................................. 56
6. berekening van de gestandaardiseerde gewichten ........................................................................ 56
7. veronderstelligen bij het uitvoeren van een lineaire regressie analyse ............................................ 57
8. controle op regressievoorwaarden............................................................................................... 57
12. complexe relaties .................................................................................................................. 59
1. inleidende begrippen .................................................................................................................. 59
2. mediatorvariabele ...................................................................................................................... 59
3. vorbeeld van interactie-effect tussen variabelen op een laag meetniveau ...................................... 60
4. de padanalyse ............................................................................................................................ 60
, 1. DE LOGICA VAN STATISTISCHE VERGELIJKINGEN EN ANALYSES
INLEIDING: WAAROM DATA ANALYSEREN?
Sinds Renaissance nadruk op het meren en verbeteren van de wijze waarop we dingen doen à
wetenschap is het ontdekken van patronen en processen
• Het proces van wetenschappelijk onderzoek: een methode om zaken om een systematische
manier te bestuderen
o Bewijs nodig om argument te ondersteunen à verkrijgen van kwantitatieve data =
statistische analyse
GESCHIEDENIS VAN DE STATISTIEK IN EEN NOTENDOP
Statistische analyse: door Pythagoras à voorloper van de beschrijvende statistieken
Inferentiële statistiek à vorm van waarschijnlijkheidsanalyses à latere naam: kansberekening à later in
de vorm van gokberekeningen
Statistiek werd ‘political arithmetics’ genoemd à antwoorden op problemen van de staat krijgen à latere
naam: ‘statistics’ door Zimmerman
HET GEBRUIK VAN STATISTIEK
2 praktische toepassingen:
• De verzameling en bewaring van data
o Een samenvattende vorm
o Reflecteert de historiek van de term
o Door administatie verzameld à doel: zicht krijgen op bepaalde ontwikkelingen
o Vb. volkstelling- (= geeft voorstelling van karakteristieken/kenmerken van personen die in
en land wonen op een bepaald moment), sterftestatistieken (= geven inzicht in het aantal
personen die sterven in een land op een bepaald moment) of misdaadstatistieken (= de
oudste gerechtelijke statistiek)
• Een methode om data te analyseren verzameld in een wetenschapelijk onderzoek
o Stelt onderzoekers in staat logisch na te denken en tot bepaalde zaken te komen:
§ Een beknopte synthese en betekenisvolle conclusies over de data =
beschrijvende statistiek
§ Karakteristieken van grote groepen bepalen/afleiden gebaseerd op data
afkomstig van kleine delen (= steekproeven/samples) = inferentiële statistiek
Statistische analyse = werkinstrument van wetenschappelijke ontdekking en wetenschappelijke
onderbouw à vb. gebruik van onderzoek om het waarheidsgehalte van een criminologische theorie na te
gaan
• Iets “nagaan” gebeurt door gegevens te verzamelen à empirisch bewijs is gebaseerd op
onderzoekseenheden en de gegevens moeten systematisch worden bestudeerd
o Gebruik van basisvaardigheden uit wiskunde, algebra en statistische analyse à
onderzoekers kunnen statistische vergelijkingen opstellen + nieuwe informatie
ontdekken à beter begrijpen van je onderzoekseenheid
INHOUDSOPGAVE
1. De logica van statistische vergelijkingen en analyses ................................................................. 4
inleiding: waarom data analyseren? .................................................................................................. 4
geschiedenis van de statistiek in een notendop.................................................................................. 4
het gebruik van statistiek .................................................................................................................. 4
theorieconstructie in een oogopslag .................................................................................................. 5
wat is theorie? ............................................................................................................................... 5
theorie en onderzoek ..................................................................................................................... 5
het proces van wetenschappelijk onderzoek ...................................................................................... 5
observatie en nieuwsgierigheid ...................................................................................................... 6
de centrale onderzoeksvraag ......................................................................................................... 6
onderzoeksdeelvragen ................................................................................................................... 6
onderzoek: bewegen van theorie naar data en terug ........................................................................... 6
hypothese formuleren.................................................................................................................... 6
constructie van het onderzoeksdesign ............................................................................................ 6
conceptualisering .......................................................................................................................... 7
operationalisering.......................................................................................................................... 7
data verzamelen ............................................................................................................................ 7
conclusies trekken ........................................................................................................................ 7
communiceren van resultaten........................................................................................................ 7
2. inleidende begrippen ................................................................................................................ 8
inleiding ........................................................................................................................................... 8
beschrijven, schatten en veralgemenen als statistische bedrijvigheid ................................................. 8
statistiek en de beantwoording van beschrijvende en verklarende onderzoeksvragen .......................... 9
statistische eenheden ...................................................................................................................... 9
univariate, bivariate en multivariate beschrijvende analyse................................................................. 9
meetniveaus van variabelen.............................................................................................................. 9
discrete en continue variabelen ...................................................................................................... 10
de datamatrix als input voor statistische analyses ............................................................................ 10
een handige afrondingsregel voor statistische gegevens ................................................................... 11
het sommatieteken ........................................................................................................................ 11
aspraken bij het presenteren van tabellen ....................................................................................... 11
3. de univariate beschrijvende statistiek....................................................................................... 12
inleiding ......................................................................................................................................... 12
grafieken ........................................................................................................................................ 13
, parameters van centraliteit ............................................................................................................. 14
parameters van spreiding ............................................................................................................... 15
box plot ......................................................................................................................................... 16
4. toeval & kansrekenen ............................................................................................................... 17
inleiding ......................................................................................................................................... 17
basisbegrip .................................................................................................................................... 17
wetten van kansrekenen ................................................................................................................. 18
combinatoriek ................................................................................................................................ 19
stochastische variabelen ................................................................................................................ 20
de binomiale verdeling.................................................................................................................... 21
5. de standaardnormale verdeling en diens eigenschappen........................................................... 22
inleiding ......................................................................................................................................... 22
de normale en standaardnormale verdeling ..................................................................................... 22
van normale verdeling naar standaardnormale verdeling .................................................................. 22
Z-scores en het gebruik van de tabel van de standaardnormale verdeling .......................................... 23
6. inleiding tot de bivariate beschrijvende statistiek ...................................................................... 24
inleiding: causale relaties vs statistische relaties ............................................................................. 24
causaliteit op een bierviltje ............................................................................................................. 25
symmetrische en asymmetrische relaties tussen variabelen ............................................................ 25
de doelstelling van bivariate beschrijvende statistiek ....................................................................... 26
bivariate frequentieverdelingen ....................................................................................................... 26
verantwoord kiezen tussen een reeks van associatiematen .............................................................. 27
7. bivariate associatiematen voor nominale en ordinale variabelen ............................................... 28
het percentageverschil als associatiemaat op nominaal niveau ........................................................ 28
de odds ratio als associatiemaat op nominaal niveau ....................................................................... 28
chi-kwadraat als associatiemaat op nominaal niveau....................................................................... 28
Phi ................................................................................................................................................. 29
cramer’s v ...................................................................................................................................... 29
SPEARMAN’S RANGCORRELATIECOEFFICIËNT ............................................................................... 30
8. correlatie- en regressieanalyse ................................................................................................ 31
1. symmetrische associatiematen voor kenmerken op metrisch niveau ............................................ 31
2. De bivariate lineaire regressie als asymmetrische associatiemaat................................................. 31
9. inferentiële statistiek ............................................................................................................... 36
, 1. waarom gebruiken we inferentiële statistiek? ............................................................................... 36
2. de representativiteit van steekproeven ......................................................................................... 37
3. steekproeven en populatie .......................................................................................................... 37
4. steekproeven en het principe van toeval ...................................................................................... 38
5. de theorie van toevalssteekproeven ............................................................................................. 38
6. kenmerken van steekproevenverdelingen .................................................................................... 38
7. het gebruik van de normale verdeling in de inferentiële statistiek ................................................... 39
8. de centrale limietstelling ............................................................................................................. 40
10. het berekenen van een betrouwbaarheidsinterval rond een parameter ........................................ 40
11. statistische hypothesestelling ................................................................................................... 41
12. eenzijdig of tweezijdig toetsen van een nulhypothese? ................................................................ 45
13. andere belangrijke verdelingen .................................................................................................. 46
14. de variantieanalyse als toets voor verschillen tussen groepen inzake metrische kenmerken ......... 46
15. zelf uitrekenen van een variatieanalyse ...................................................................................... 47
16. Voorbeelden van statistische inferentie in andere analysetechnieken.......................................... 50
10. de partiële correlatie als introductie tot de multivariate statistiek ............................................ 51
1. inleiding ..................................................................................................................................... 51
2. de partiële correlatie ................................................................................................................... 51
3. berekenen adhv serie van regressievergelijkingen ......................................................................... 53
4. berekening van partiële correlatie adhv rekenkundige formule ...................................................... 54
5. supression-effect: voorbeeld ....................................................................................................... 54
11. regressie analyse met twee onafhankelijke variabelen ............................................................ 55
1. inleiding: meervoudige lineaire regressie (basismodel) ................................................................. 55
3. de vergelijking tussen twee bivariatie versus één meervoudige regressie........................................ 55
4. uitbreiding naar een meervoudige lineaire regressie (extensie) ...................................................... 56
5. het relatieve belang van elke onafhankelijke variabele .................................................................. 56
6. berekening van de gestandaardiseerde gewichten ........................................................................ 56
7. veronderstelligen bij het uitvoeren van een lineaire regressie analyse ............................................ 57
8. controle op regressievoorwaarden............................................................................................... 57
12. complexe relaties .................................................................................................................. 59
1. inleidende begrippen .................................................................................................................. 59
2. mediatorvariabele ...................................................................................................................... 59
3. vorbeeld van interactie-effect tussen variabelen op een laag meetniveau ...................................... 60
4. de padanalyse ............................................................................................................................ 60
, 1. DE LOGICA VAN STATISTISCHE VERGELIJKINGEN EN ANALYSES
INLEIDING: WAAROM DATA ANALYSEREN?
Sinds Renaissance nadruk op het meren en verbeteren van de wijze waarop we dingen doen à
wetenschap is het ontdekken van patronen en processen
• Het proces van wetenschappelijk onderzoek: een methode om zaken om een systematische
manier te bestuderen
o Bewijs nodig om argument te ondersteunen à verkrijgen van kwantitatieve data =
statistische analyse
GESCHIEDENIS VAN DE STATISTIEK IN EEN NOTENDOP
Statistische analyse: door Pythagoras à voorloper van de beschrijvende statistieken
Inferentiële statistiek à vorm van waarschijnlijkheidsanalyses à latere naam: kansberekening à later in
de vorm van gokberekeningen
Statistiek werd ‘political arithmetics’ genoemd à antwoorden op problemen van de staat krijgen à latere
naam: ‘statistics’ door Zimmerman
HET GEBRUIK VAN STATISTIEK
2 praktische toepassingen:
• De verzameling en bewaring van data
o Een samenvattende vorm
o Reflecteert de historiek van de term
o Door administatie verzameld à doel: zicht krijgen op bepaalde ontwikkelingen
o Vb. volkstelling- (= geeft voorstelling van karakteristieken/kenmerken van personen die in
en land wonen op een bepaald moment), sterftestatistieken (= geven inzicht in het aantal
personen die sterven in een land op een bepaald moment) of misdaadstatistieken (= de
oudste gerechtelijke statistiek)
• Een methode om data te analyseren verzameld in een wetenschapelijk onderzoek
o Stelt onderzoekers in staat logisch na te denken en tot bepaalde zaken te komen:
§ Een beknopte synthese en betekenisvolle conclusies over de data =
beschrijvende statistiek
§ Karakteristieken van grote groepen bepalen/afleiden gebaseerd op data
afkomstig van kleine delen (= steekproeven/samples) = inferentiële statistiek
Statistische analyse = werkinstrument van wetenschappelijke ontdekking en wetenschappelijke
onderbouw à vb. gebruik van onderzoek om het waarheidsgehalte van een criminologische theorie na te
gaan
• Iets “nagaan” gebeurt door gegevens te verzamelen à empirisch bewijs is gebaseerd op
onderzoekseenheden en de gegevens moeten systematisch worden bestudeerd
o Gebruik van basisvaardigheden uit wiskunde, algebra en statistische analyse à
onderzoekers kunnen statistische vergelijkingen opstellen + nieuwe informatie
ontdekken à beter begrijpen van je onderzoekseenheid