STATISTIEK
INHOUDSOPGAVE
01: inleidende begrippen ............................................................................................................... 6
Inleiding ...........................................................................................................................................6
Begrippenkader statistiek .................................................................................................................6
Beschrijvende en inferentiële statistiek ..........................................................................................6
Types onderzoeksvragen ...............................................................................................................6
Uni-, bi- en multiivariate statistiek ..................................................................................................6
Discrete en continue variabelen.....................................................................................................7
Variabiliteit.......................................................................................................................................7
Variabiliteit en verschil ..................................................................................................................7
Variabiliteit impliceert onzekerheid ................................................................................................8
Gebrek aan variabiliteit is een probleem .........................................................................................8
Waarom is variabiliteit zo belangrijk? .............................................................................................8
Meetniveaus ....................................................................................................................................9
Categorische meetniveaus ............................................................................................................9
Metrische meetniveaus .................................................................................................................9
Samengevat ............................................................................................................................... 10
02: Univariate statistiek ...............................................................................................................11
Inleiding ......................................................................................................................................... 11
Keuze van statistische parameters............................................................................................... 11
Absolute & relatieve frequentie .................................................................................................... 11
Voorbeeld .................................................................................................................................. 12
Grafieken ....................................................................................................................................... 12
Over de schaal en ijking van de x- en y-as ..................................................................................... 12
Staafdiagram (bar chart) .............................................................................................................. 13
Histogram .................................................................................................................................. 13
Parameters van centraliteit ............................................................................................................. 13
Modus (mode) ............................................................................................................................ 13
Mediaan (median) ....................................................................................................................... 14
Kwartielen (quartiles) .................................................................................................................. 14
Rekenkundig gemiddelde (mean) ................................................................................................. 14
Kenmerken van rekenkunig gemiddelde ....................................................................................... 15
Voorbeeld .................................................................................................................................. 15
Kiezen van gepaste centrummaat? .............................................................................................. 16
Vuistregel: .................................................................................................................................. 16
Parameters van spreiding ............................................................................................................... 16
Variatiebreedte ........................................................................................................................... 16
Interkwartielafstand (inter quartile range) ..................................................................................... 16
(steekproef)variantie (variance) ................................................................................................... 16
(steekproef)standaardafwijking (standard deviation) ..................................................................... 17
1
, Boxplot .......................................................................................................................................... 17
04: Een inleiding in kansrekenen ..................................................................................................19
1. waarom kansrekenen voor criminologie? ..................................................................................... 19
2. kansdefinitie ............................................................................................................................... 19
3. Kansregels ................................................................................................................................. 19
4. permutaties en combinaties ........................................................................................................ 20
5. kansvariabelen en de binomiale verdeling .................................................................................... 21
6. de binomiale verdeling ................................................................................................................ 21
7. de binomiale verdeling gaat over in een normale verdeling ............................................................ 21
8. waarom is de binomiale verdeling zo belangrijk in kwantitatief criminologische onderzoek? ............ 21
9. leerdoelen .................................................................................................................................. 21
05: normaalverdeling ...................................................................................................................22
1. Inleiding ..................................................................................................................................... 22
2. de normale en standaardnormale verdeling.................................................................................. 22
68-95-99,7% -REGEL (ZEER BELANGRIJK!!) ................................................................................... 23
3. van normale verdeling naar standaardnormale verdeling ............................................................... 23
4. standaardisatie = Z-transformatie ................................................................................................ 24
voorbeeld ................................................................................................................................... 24
Z-score....................................................................................................................................... 24
5. standaardnormale verdeling ........................................................................................................ 24
Criminologisch voorbeeld: .......................................................................................................... 25
6. het gebruik van de tabel van de standaardnormale verdeling ......................................................... 25
Voorbeeldoefening 1 ................................................................................................................... 25
Voorbeeldoefening 2 ................................................................................................................... 26
Voorbeeldoefening 3 ................................................................................................................... 26
Voorbeeldoefening 4 ................................................................................................................... 26
Theorievragen IFV het examen ......................................................................................................... 27
06: inleiding bivariate statsitieken ................................................................................................28
1. inleiding: causale versus statistische relaties ............................................................................... 28
2. Causaliteit op een bierviltje ......................................................................................................... 28
3. Symmetrisch of asymmetrische relaties ....................................................................................... 29
4. Doelstelling van de bivariate beschrijvende statistiek .................................................................... 30
5. Bivariate frequentieverdelingen voor hoge en lage meetniveaus ..................................................... 30
6. De kruistabel .............................................................................................................................. 30
7. Puntenwolk of spreidingsdiagram ................................................................................................ 31
8. Verantwoord kiezen tussen associatiematen ................................................................................ 31
2
,07: bivariaat categorisch ..............................................................................................................32
1. inleiding ..................................................................................................................................... 32
2. het percentageverschil: asymmetrische associatiemaat op nominaal niveau ................................. 32
3. de odds ratio: asymmetrische associatiemaat op nominaal niveau ................................................ 32
4. symmetrische associatiemaat op nominaal niveau ....................................................................... 33
5. chi-kwadraat (x2) ......................................................................................................................... 33
voorbeeld ................................................................................................................................... 34
6. phi ............................................................................................................................................. 34
7. cramer’s V .................................................................................................................................. 35
8. gamma: symmetrische maat op ordinaal niveau ........................................................................... 35
9. rangcorrelaties ........................................................................................................................... 36
08: correlatie en regressie ............................................................................................................37
1. SYMMETRISCHE ASSOCIATIEMATEN VOOR KENMERKEN OP METRISCH NIVEAU ......................... 37
DE COVARIATIE (SUM OF CROSS-PRODUCTS) ............................................................................. 37
De covariantie ............................................................................................................................ 38
DE PRODUCT-MOMENT CORRELATIECOËFFICIËNT VAN PEARSON .............................................. 38
2. COVARIATIE, COVARIANTIE EN CORRELATIE: EEN REKENVOORBEELD ......................................... 38
3. DE BIVARIATE LINEAIRE REGRESSIE ............................................................................................ 39
De puntenwolk ........................................................................................................................... 39
criminologische voorbeelden ...................................................................................................... 39
ENKELVOUDIGE LINEAIRE REGRESSIE ......................................................................................... 40
LINEARITEIT VERSUS NON-LINEARITEIT ....................................................................................... 40
INDELING VAN SCATTERPLOT IN 4 KWADRANTEN MET (X,Y)-WAARNEMINGEN ............................. 41
ENKELVOUDIGE LINEAIRE REGRESSIEANALYSE ........................................................................... 41
de regressierechte ...................................................................................................................... 42
enkelvoudige lineaire regressie .................................................................................................... 42
regressie = asyemmetrische analysetechniek ............................................................................... 43
evaluatie van de regressielijn (model fit) ....................................................................................... 43
PEARSON CORRELATIECOËFFICIËNT .......................................................................................... 44
FICTIEF VOORBEELD: OUTPUT > regressieanalyse ........................................................................ 45
‘REGRESSION SUM OF SQUARES’ ............................................................................................... 45
‘RESIDUAL SUM OF SQUARES’ .................................................................................................... 45
4. ZELF UITREKENEN VAN DE PARAMETERS ..................................................................................... 46
CONTROLE A.H.V. OUTPUT IN SPSS ............................................................................................ 46
5. Test jezelf (rapportge van de ! parameters van de regressierechte in een rapport) ........................... 47
REGRESSIE IN DE PRAKTIJK: KUNNEN WE SLACHTOFFERSCHAP VOORSPELLEN OP BASIS VAN
DADERSCHAP ? .......................................................................................................................... 48
OUTPUT VAN REGRESSIEANALYSE .............................................................................................. 48
6. WAT ALS DE MEETNIVEAUS VAN TWEE VARIABELEN VERSCHILLEND ZIJN ? .................................. 48
7. leerdoelen .................................................................................................................................. 49
09a: inferentiële statistieken........................................................................................................50
3
, 1. waarom inferentiële statistiek? .................................................................................................... 50
2. steekproeven en populaties......................................................................................................... 51
3. steekproeven en het principe van toeval ....................................................................................... 51
4. de theorie van toevalsteekproeven ............................................................................................... 51
5. kenmerken van steekproevenverdelingen (goed kennen!!!!).......................................................... 52
6. het gebruik van de normale verdeling in de inferentiële statistiek ................................................... 52
7. de centrale limiets ...................................................................................................................... 54
8. puntschatting en intervalschatting ............................................................................................... 54
9. betrouwbaarheidsinterval ........................................................................................................... 54
10. statistische hypothesetoetsing .................................................................................................. 56
11. eenzijdige of tweezijdige toetsen H0 ........................................................................................... 60
fsamenvatting inferentiële statistiek ................................................................................................ 61
09b: variantie analyse ..................................................................................................................62
14. variantieanaylyse ...................................................................................................................... 62
Centrale begrippen ..................................................................................................................... 62
15. zelf uitrekenen van een variantieanalyse ..................................................................................... 63
16. welke informatie heb je nodig? ................................................................................................... 63
Voorbeeld (deel 1) ....................................................................................................................... 64
voorbeeld (deel 2) ....................................................................................................................... 65
Vergelijking van gemiddelde en anova (output SPSS) ..................................................................... 65
De variantieanalyse in onderzoek ................................................................................................. 65
10: de partiële correlatie ..............................................................................................................66
1. inleiding ..................................................................................................................................... 66
2. de partiële correlatie ................................................................................................................... 66
Detectie van schijnverband (spurieuze relatie) .............................................................................. 66
Waarom is berekening van de partiële correlatiecoëfficiënt nodig? ................................................ 67
3. berekenig adhv serie van regressievergelijkingen .......................................................................... 68
4. berekening van partiële correlatie adhv rekenkundige formule ....................................................... 68
rekenvoorbeeld........................................................................................................................... 68
5. suppression-effect: voorbeeld ..................................................................................................... 69
Voorbeeld: spss output ............................................................................................................... 70
theorievragen ifv examen ................................................................................................................ 70
11: meervoudige regressie ...........................................................................................................71
1. inleiding: meervoudige lineaire regressie (basismodel) .................................................................. 71
waarom meervoudige regressie? ................................................................................................. 71
3. vergelijking tussen 2 bivariate versus 1 meervoudige regressie ...................................................... 71
4. uitbreiding naar een meervoudige lineaire regressie (extensie) ....................................................... 72
4
INHOUDSOPGAVE
01: inleidende begrippen ............................................................................................................... 6
Inleiding ...........................................................................................................................................6
Begrippenkader statistiek .................................................................................................................6
Beschrijvende en inferentiële statistiek ..........................................................................................6
Types onderzoeksvragen ...............................................................................................................6
Uni-, bi- en multiivariate statistiek ..................................................................................................6
Discrete en continue variabelen.....................................................................................................7
Variabiliteit.......................................................................................................................................7
Variabiliteit en verschil ..................................................................................................................7
Variabiliteit impliceert onzekerheid ................................................................................................8
Gebrek aan variabiliteit is een probleem .........................................................................................8
Waarom is variabiliteit zo belangrijk? .............................................................................................8
Meetniveaus ....................................................................................................................................9
Categorische meetniveaus ............................................................................................................9
Metrische meetniveaus .................................................................................................................9
Samengevat ............................................................................................................................... 10
02: Univariate statistiek ...............................................................................................................11
Inleiding ......................................................................................................................................... 11
Keuze van statistische parameters............................................................................................... 11
Absolute & relatieve frequentie .................................................................................................... 11
Voorbeeld .................................................................................................................................. 12
Grafieken ....................................................................................................................................... 12
Over de schaal en ijking van de x- en y-as ..................................................................................... 12
Staafdiagram (bar chart) .............................................................................................................. 13
Histogram .................................................................................................................................. 13
Parameters van centraliteit ............................................................................................................. 13
Modus (mode) ............................................................................................................................ 13
Mediaan (median) ....................................................................................................................... 14
Kwartielen (quartiles) .................................................................................................................. 14
Rekenkundig gemiddelde (mean) ................................................................................................. 14
Kenmerken van rekenkunig gemiddelde ....................................................................................... 15
Voorbeeld .................................................................................................................................. 15
Kiezen van gepaste centrummaat? .............................................................................................. 16
Vuistregel: .................................................................................................................................. 16
Parameters van spreiding ............................................................................................................... 16
Variatiebreedte ........................................................................................................................... 16
Interkwartielafstand (inter quartile range) ..................................................................................... 16
(steekproef)variantie (variance) ................................................................................................... 16
(steekproef)standaardafwijking (standard deviation) ..................................................................... 17
1
, Boxplot .......................................................................................................................................... 17
04: Een inleiding in kansrekenen ..................................................................................................19
1. waarom kansrekenen voor criminologie? ..................................................................................... 19
2. kansdefinitie ............................................................................................................................... 19
3. Kansregels ................................................................................................................................. 19
4. permutaties en combinaties ........................................................................................................ 20
5. kansvariabelen en de binomiale verdeling .................................................................................... 21
6. de binomiale verdeling ................................................................................................................ 21
7. de binomiale verdeling gaat over in een normale verdeling ............................................................ 21
8. waarom is de binomiale verdeling zo belangrijk in kwantitatief criminologische onderzoek? ............ 21
9. leerdoelen .................................................................................................................................. 21
05: normaalverdeling ...................................................................................................................22
1. Inleiding ..................................................................................................................................... 22
2. de normale en standaardnormale verdeling.................................................................................. 22
68-95-99,7% -REGEL (ZEER BELANGRIJK!!) ................................................................................... 23
3. van normale verdeling naar standaardnormale verdeling ............................................................... 23
4. standaardisatie = Z-transformatie ................................................................................................ 24
voorbeeld ................................................................................................................................... 24
Z-score....................................................................................................................................... 24
5. standaardnormale verdeling ........................................................................................................ 24
Criminologisch voorbeeld: .......................................................................................................... 25
6. het gebruik van de tabel van de standaardnormale verdeling ......................................................... 25
Voorbeeldoefening 1 ................................................................................................................... 25
Voorbeeldoefening 2 ................................................................................................................... 26
Voorbeeldoefening 3 ................................................................................................................... 26
Voorbeeldoefening 4 ................................................................................................................... 26
Theorievragen IFV het examen ......................................................................................................... 27
06: inleiding bivariate statsitieken ................................................................................................28
1. inleiding: causale versus statistische relaties ............................................................................... 28
2. Causaliteit op een bierviltje ......................................................................................................... 28
3. Symmetrisch of asymmetrische relaties ....................................................................................... 29
4. Doelstelling van de bivariate beschrijvende statistiek .................................................................... 30
5. Bivariate frequentieverdelingen voor hoge en lage meetniveaus ..................................................... 30
6. De kruistabel .............................................................................................................................. 30
7. Puntenwolk of spreidingsdiagram ................................................................................................ 31
8. Verantwoord kiezen tussen associatiematen ................................................................................ 31
2
,07: bivariaat categorisch ..............................................................................................................32
1. inleiding ..................................................................................................................................... 32
2. het percentageverschil: asymmetrische associatiemaat op nominaal niveau ................................. 32
3. de odds ratio: asymmetrische associatiemaat op nominaal niveau ................................................ 32
4. symmetrische associatiemaat op nominaal niveau ....................................................................... 33
5. chi-kwadraat (x2) ......................................................................................................................... 33
voorbeeld ................................................................................................................................... 34
6. phi ............................................................................................................................................. 34
7. cramer’s V .................................................................................................................................. 35
8. gamma: symmetrische maat op ordinaal niveau ........................................................................... 35
9. rangcorrelaties ........................................................................................................................... 36
08: correlatie en regressie ............................................................................................................37
1. SYMMETRISCHE ASSOCIATIEMATEN VOOR KENMERKEN OP METRISCH NIVEAU ......................... 37
DE COVARIATIE (SUM OF CROSS-PRODUCTS) ............................................................................. 37
De covariantie ............................................................................................................................ 38
DE PRODUCT-MOMENT CORRELATIECOËFFICIËNT VAN PEARSON .............................................. 38
2. COVARIATIE, COVARIANTIE EN CORRELATIE: EEN REKENVOORBEELD ......................................... 38
3. DE BIVARIATE LINEAIRE REGRESSIE ............................................................................................ 39
De puntenwolk ........................................................................................................................... 39
criminologische voorbeelden ...................................................................................................... 39
ENKELVOUDIGE LINEAIRE REGRESSIE ......................................................................................... 40
LINEARITEIT VERSUS NON-LINEARITEIT ....................................................................................... 40
INDELING VAN SCATTERPLOT IN 4 KWADRANTEN MET (X,Y)-WAARNEMINGEN ............................. 41
ENKELVOUDIGE LINEAIRE REGRESSIEANALYSE ........................................................................... 41
de regressierechte ...................................................................................................................... 42
enkelvoudige lineaire regressie .................................................................................................... 42
regressie = asyemmetrische analysetechniek ............................................................................... 43
evaluatie van de regressielijn (model fit) ....................................................................................... 43
PEARSON CORRELATIECOËFFICIËNT .......................................................................................... 44
FICTIEF VOORBEELD: OUTPUT > regressieanalyse ........................................................................ 45
‘REGRESSION SUM OF SQUARES’ ............................................................................................... 45
‘RESIDUAL SUM OF SQUARES’ .................................................................................................... 45
4. ZELF UITREKENEN VAN DE PARAMETERS ..................................................................................... 46
CONTROLE A.H.V. OUTPUT IN SPSS ............................................................................................ 46
5. Test jezelf (rapportge van de ! parameters van de regressierechte in een rapport) ........................... 47
REGRESSIE IN DE PRAKTIJK: KUNNEN WE SLACHTOFFERSCHAP VOORSPELLEN OP BASIS VAN
DADERSCHAP ? .......................................................................................................................... 48
OUTPUT VAN REGRESSIEANALYSE .............................................................................................. 48
6. WAT ALS DE MEETNIVEAUS VAN TWEE VARIABELEN VERSCHILLEND ZIJN ? .................................. 48
7. leerdoelen .................................................................................................................................. 49
09a: inferentiële statistieken........................................................................................................50
3
, 1. waarom inferentiële statistiek? .................................................................................................... 50
2. steekproeven en populaties......................................................................................................... 51
3. steekproeven en het principe van toeval ....................................................................................... 51
4. de theorie van toevalsteekproeven ............................................................................................... 51
5. kenmerken van steekproevenverdelingen (goed kennen!!!!).......................................................... 52
6. het gebruik van de normale verdeling in de inferentiële statistiek ................................................... 52
7. de centrale limiets ...................................................................................................................... 54
8. puntschatting en intervalschatting ............................................................................................... 54
9. betrouwbaarheidsinterval ........................................................................................................... 54
10. statistische hypothesetoetsing .................................................................................................. 56
11. eenzijdige of tweezijdige toetsen H0 ........................................................................................... 60
fsamenvatting inferentiële statistiek ................................................................................................ 61
09b: variantie analyse ..................................................................................................................62
14. variantieanaylyse ...................................................................................................................... 62
Centrale begrippen ..................................................................................................................... 62
15. zelf uitrekenen van een variantieanalyse ..................................................................................... 63
16. welke informatie heb je nodig? ................................................................................................... 63
Voorbeeld (deel 1) ....................................................................................................................... 64
voorbeeld (deel 2) ....................................................................................................................... 65
Vergelijking van gemiddelde en anova (output SPSS) ..................................................................... 65
De variantieanalyse in onderzoek ................................................................................................. 65
10: de partiële correlatie ..............................................................................................................66
1. inleiding ..................................................................................................................................... 66
2. de partiële correlatie ................................................................................................................... 66
Detectie van schijnverband (spurieuze relatie) .............................................................................. 66
Waarom is berekening van de partiële correlatiecoëfficiënt nodig? ................................................ 67
3. berekenig adhv serie van regressievergelijkingen .......................................................................... 68
4. berekening van partiële correlatie adhv rekenkundige formule ....................................................... 68
rekenvoorbeeld........................................................................................................................... 68
5. suppression-effect: voorbeeld ..................................................................................................... 69
Voorbeeld: spss output ............................................................................................................... 70
theorievragen ifv examen ................................................................................................................ 70
11: meervoudige regressie ...........................................................................................................71
1. inleiding: meervoudige lineaire regressie (basismodel) .................................................................. 71
waarom meervoudige regressie? ................................................................................................. 71
3. vergelijking tussen 2 bivariate versus 1 meervoudige regressie ...................................................... 71
4. uitbreiding naar een meervoudige lineaire regressie (extensie) ....................................................... 72
4