Kwantitatief luik, metho 3
Inhoud
Introductie ............................................................................................................................................... 3
1. Coderen en data-entry in SPSS ........................................................................................................ 3
1.1. De constructie van variabelen ................................................................................................. 3
1.2. Het coderen aan de hand van schalen .................................................................................... 3
2. Inleiding Multivariate Analyse ......................................................................................................... 5
2.1. Inleiding ................................................................................................................................... 5
2.2. Introductie ............................................................................................................................... 6
3. Beschrijvende en inferentiële statistiek .......................................................................................... 7
3.1. Data cleaning ........................................................................................................................... 7
3.2. Missing values ......................................................................................................................... 8
3.3. Variabelen prepareren ............................................................................................................ 9
3.4. Repliceerbaarheid van analyses ............................................................................................ 10
3.5. Statistische pakketten ........................................................................................................... 10
3.5.1. Beschrijvende en inferentiële statistiek in vogelvlucht................................................. 11
1. Beschrijvende statistiek ......................................................................................................... 11
o maten voor centrale tendentie ............................................................................................. 11
o maten voor spreiding ............................................................................................................ 11
2. Inferentiële statistiek ............................................................................................................ 11
o steekproeven en populaties .................................................................................................. 11
o omgaan met onzekerheid...................................................................................................... 11
o steekproefgrootte ................................................................................................................. 11
o betrouwbaarheidsintervallen ................................................................................................ 11
o verdelingen ............................................................................................................................ 11
4. Bivariate symmetrische technieken .............................................................................................. 13
4.1. Symmetrische bivariate technieken ...................................................................................... 13
4.2. correlatie als maat voor lineaire samenhang ........................................................................ 13
4.2.1. Pearson’s correlatiecoëfficient ...................................................................................... 13
4.2.2. kruistabellen, Chi² en odds ratio ................................................................................... 15
5. Verschillen tussen groepen ........................................................................................................... 17
5.1. Introductie ............................................................................................................................. 17
5.1.1. Overzicht schematisch................................................................................................... 17
5.2. Welke toets?.......................................................................................................................... 17
5.2.1. parametrische toetsen met twee groepen ................................................................... 18
1
, 5.2.2. Niet-parametrische toetsen met twee groepen ........................................................... 19
5.2.3. Parametrische toetsen met meer dan twee groepen ................................................... 19
5.2.4. niet-parametrische toetsen met meer dan twee groepen ........................................... 20
6. PCA en schaalconstructie .............................................................................................................. 21
6.1. Introductie ............................................................................................................................. 21
6.2. Schaalconstructie en betrouwbaarheid ................................................................................ 22
6.2.1. Likertschaal .................................................................................................................... 22
6.2.2. Cronbach’s alpha ........................................................................................................... 22
6.3. Principale componenten analyse .......................................................................................... 22
6.4. Praktische kwesties en assumpties ....................................................................................... 24
6.5. Voorbeelden met SPSS .......................................................................................................... 24
6.6. PCA en factoranalyse ............................................................................................................. 27
7. Regressieanalyse ........................................................................................................................... 27
7.1. Lineaire regressieanalyse ...................................................................................................... 27
7.1.1. Introductie ..................................................................................................................... 27
7.1.2. Enkelvoudige regressieanalyse...................................................................................... 27
7.1.3. Meervoudige regressieanalyse...................................................................................... 28
7.1.4. Assumpties .................................................................................................................... 28
7.1.5. Procedure met SPSS ...................................................................................................... 30
7.1.6. Rapportage .................................................................................................................... 32
7.2. Logistische regressieanalyse ................................................................................................. 32
8. Slotcollege: oefening ESS ‘vertrouwen in de instellingen’ ............................................................ 32
8.1. Voorbereidende analyses ...................................................................................................... 33
8.2. Beschrijvende analyses.......................................................................................................... 33
8.3. Bivariate samenhang (verband) ............................................................................................ 33
8.3.1. X²-toets .......................................................................................................................... 33
8.3.2. Correlatie analyse .......................................................................................................... 33
8.4. Verschillen tussen groepen ................................................................................................... 34
8.4.1. T-toets en one-way anova ............................................................................................. 34
8.5. Regressieanalyse ................................................................................................................... 34
8.5.1. Theoretisch model ......................................................................................................... 34
8.5.2. Doelstellingen ................................................................................................................ 34
8.5.3. Resultaten voorbereidende analyses ............................................................................ 34
8.5.4. Resultaten beschrijvende analyses ............................................................................... 35
8.5.5. Resultaten bivariate samenhang (verband) .................................................................. 35
8.5.6. resultaten verschillen tussen groepen .......................................................................... 36
2
, 8.5.7. Resultaten regressieanalyse .......................................................................................... 37
Introductie
1. Coderen en data-entry in SPSS
1.1. De constructie van variabelen
Vóór dataverzameling (methodologie deel 2)
: van concepten naar (enquête)vragen en items: operationaliseren
Na dataverzameling
: van antwoorden op een vraag (kwantitatieve gegevens) naar variabelen
o soms: variabelen = antwoorden (codes) op enquêtevragen
o soms: variabelen via hercoderen van enquêtevragen
o soms: enquêtevragen samennemen tot schalen om abstracte concepten (vb. anomie,
onveiligheid…) te meten = schaalconstructie
1.2. Het coderen aan de hand van schalen
Van vragenlijst via codeboek naar databestand dmv coderen
o Codeboek = duidelijk maken hoe databestand wordt omgevormd dmv het toekennen van
codes
o bijkomende illustraties:
▪ Veiligheidsmonitor: vragenlijst met module buurtproblemen, mijdgedrag, risico-
inschatting, politiefunctioneren……
▪ SCV survey: overzicht vragen en codeboek
▪ ESS: ‘main questionnaire’ en ‘data protocol’
▪ JOP-monitor: technisch verslag
▪ …
o Illustratie vraag veiligheidsmonitor (ivm onveiligheidsgevoelens): mijdgedrag in de VM
(v57 t.e.m. v60)
3
, V57 (= code die vraag krijgt) VRAAG 024.a.- Gebeurt het dat u BEPAALDE
PLEKKEN IN UW GEMEENTE MIJDT OMDAT U HET NIET VEILIG VINDT? (in
1997: "Hoe dikwijls gebeurt het dat u ...")
1. Altijd 2. Vaak 3. Soms 4. Zelden
5. Nooit 6. Nvt 7. Weet niet 8. Geen antwoord
→ antwoorden wegschrijven in databestand dmv codes (nummer): letterlijke
antwoorden worden omgevormd in databestand
Uiteindelijk databestand: rijen en kolommen met alleen cijfers (= codes die
worden toegekend ~ kwantitatieve gegevens)
Waar kolom en rij kruist → antwoord op vraag x → codeboek vertelt je de betekenis van codes
Verschillende stappen
o 1ste stap: vragenlijst afnemen
o 2de stap: codeboek
o 3de stap: data-entry in SPSS
o 4de stap: data-cleaning en analyse
o Doordat het computergestuurd is → minder fouten/onduidelijkheden mogelijk bij
coderen
4
, o vb: meerdere bolletjes invullen, onduidelijk ingekleurde bolletjes → geen eenduidig
antwoord
Coderen: bijkomende punten en samenvattende regels om databestand op te bouwen
o overzichtelijke vragenlijst (genummerd)
o duidelijk en consequent codeboek (‘veldcoderen’ uitsluiten)
o afspraken voor ‘weet niet’ (7, 77,…), ‘geen antwoord’ (8, 88,…), ‘niet van toepassing’ (9,
99,…): zie bv. codeboek SCV survey
o afspraken voor filtervragen
o afspraken voor onduidelijke antwoorden vb: hoe coderen we bij dubbel antwoord
o afspraken verwerking meerdere antwoordmogelijkheden
o …
o Data-entry = data invullen in computer
▪ SPSS format opmaken
▪ Input met 2
▪ Voordeel van websurvey of CAS/TI
o Data-cleaning =
▪ Check: frequentietabellen
▪ Check filtervragen
2. Inleiding Multivariate Analyse
2.1. Inleiding
Waarom methodologie?
o methodologie en statistiek als ‘toolkit’ voor sociale wetenschapper
o onderzoek opzetten, uitvoeren en analyseren (en ‘evalueren’)
o methodologie deel 2: opzetten, uitvoeren
o methodologie deel 3: analyseren, concluderen
Rol van statistiek?
o beschrijvende statistiek: frequenties, tabellen, grafieken…
o inferentiële statistiek = steekrpoefdata gebruiken om conclusie te trekken voor hele
populatie
▪ modelleren van onzekerheid
▪ ‘hoe waarschijnlijk is een resultaat onder een bepaalde veronderstelling van de
werkelijkheid’
▪ statistiek als wetenschap van de probabiliteit
o een voorbeeld
OV: Verschilt het onveiligheidsgevoel tussen mannen en vrouwen?
conceptualisering, operationalisering, steekproeftrekking, dataverzameling…
analyse: onveiligheidsgevoel vrouwen > onveiligheidsgevoel mannen (steekproef!)
‘hoe groot is de kans dat vrouwen zich onveiliger voelen dan mannen (steekproef),
wanneer we veronderstellen dat geslacht en onveiligheidsgevoelens niet
samenhangen (nulhypothese)’
H0: onveiligheidsgevoel vrouwen = onveiligheidsgevoel mannen: wordt
verworpen als het lager is dan 5% significantieniveau
Ha: onveiligheidsgevoel vrouwen ≠ onveiligheidsgevoel mannen
Is het verschil significant?
Analyse in het criminologische domein
5
Inhoud
Introductie ............................................................................................................................................... 3
1. Coderen en data-entry in SPSS ........................................................................................................ 3
1.1. De constructie van variabelen ................................................................................................. 3
1.2. Het coderen aan de hand van schalen .................................................................................... 3
2. Inleiding Multivariate Analyse ......................................................................................................... 5
2.1. Inleiding ................................................................................................................................... 5
2.2. Introductie ............................................................................................................................... 6
3. Beschrijvende en inferentiële statistiek .......................................................................................... 7
3.1. Data cleaning ........................................................................................................................... 7
3.2. Missing values ......................................................................................................................... 8
3.3. Variabelen prepareren ............................................................................................................ 9
3.4. Repliceerbaarheid van analyses ............................................................................................ 10
3.5. Statistische pakketten ........................................................................................................... 10
3.5.1. Beschrijvende en inferentiële statistiek in vogelvlucht................................................. 11
1. Beschrijvende statistiek ......................................................................................................... 11
o maten voor centrale tendentie ............................................................................................. 11
o maten voor spreiding ............................................................................................................ 11
2. Inferentiële statistiek ............................................................................................................ 11
o steekproeven en populaties .................................................................................................. 11
o omgaan met onzekerheid...................................................................................................... 11
o steekproefgrootte ................................................................................................................. 11
o betrouwbaarheidsintervallen ................................................................................................ 11
o verdelingen ............................................................................................................................ 11
4. Bivariate symmetrische technieken .............................................................................................. 13
4.1. Symmetrische bivariate technieken ...................................................................................... 13
4.2. correlatie als maat voor lineaire samenhang ........................................................................ 13
4.2.1. Pearson’s correlatiecoëfficient ...................................................................................... 13
4.2.2. kruistabellen, Chi² en odds ratio ................................................................................... 15
5. Verschillen tussen groepen ........................................................................................................... 17
5.1. Introductie ............................................................................................................................. 17
5.1.1. Overzicht schematisch................................................................................................... 17
5.2. Welke toets?.......................................................................................................................... 17
5.2.1. parametrische toetsen met twee groepen ................................................................... 18
1
, 5.2.2. Niet-parametrische toetsen met twee groepen ........................................................... 19
5.2.3. Parametrische toetsen met meer dan twee groepen ................................................... 19
5.2.4. niet-parametrische toetsen met meer dan twee groepen ........................................... 20
6. PCA en schaalconstructie .............................................................................................................. 21
6.1. Introductie ............................................................................................................................. 21
6.2. Schaalconstructie en betrouwbaarheid ................................................................................ 22
6.2.1. Likertschaal .................................................................................................................... 22
6.2.2. Cronbach’s alpha ........................................................................................................... 22
6.3. Principale componenten analyse .......................................................................................... 22
6.4. Praktische kwesties en assumpties ....................................................................................... 24
6.5. Voorbeelden met SPSS .......................................................................................................... 24
6.6. PCA en factoranalyse ............................................................................................................. 27
7. Regressieanalyse ........................................................................................................................... 27
7.1. Lineaire regressieanalyse ...................................................................................................... 27
7.1.1. Introductie ..................................................................................................................... 27
7.1.2. Enkelvoudige regressieanalyse...................................................................................... 27
7.1.3. Meervoudige regressieanalyse...................................................................................... 28
7.1.4. Assumpties .................................................................................................................... 28
7.1.5. Procedure met SPSS ...................................................................................................... 30
7.1.6. Rapportage .................................................................................................................... 32
7.2. Logistische regressieanalyse ................................................................................................. 32
8. Slotcollege: oefening ESS ‘vertrouwen in de instellingen’ ............................................................ 32
8.1. Voorbereidende analyses ...................................................................................................... 33
8.2. Beschrijvende analyses.......................................................................................................... 33
8.3. Bivariate samenhang (verband) ............................................................................................ 33
8.3.1. X²-toets .......................................................................................................................... 33
8.3.2. Correlatie analyse .......................................................................................................... 33
8.4. Verschillen tussen groepen ................................................................................................... 34
8.4.1. T-toets en one-way anova ............................................................................................. 34
8.5. Regressieanalyse ................................................................................................................... 34
8.5.1. Theoretisch model ......................................................................................................... 34
8.5.2. Doelstellingen ................................................................................................................ 34
8.5.3. Resultaten voorbereidende analyses ............................................................................ 34
8.5.4. Resultaten beschrijvende analyses ............................................................................... 35
8.5.5. Resultaten bivariate samenhang (verband) .................................................................. 35
8.5.6. resultaten verschillen tussen groepen .......................................................................... 36
2
, 8.5.7. Resultaten regressieanalyse .......................................................................................... 37
Introductie
1. Coderen en data-entry in SPSS
1.1. De constructie van variabelen
Vóór dataverzameling (methodologie deel 2)
: van concepten naar (enquête)vragen en items: operationaliseren
Na dataverzameling
: van antwoorden op een vraag (kwantitatieve gegevens) naar variabelen
o soms: variabelen = antwoorden (codes) op enquêtevragen
o soms: variabelen via hercoderen van enquêtevragen
o soms: enquêtevragen samennemen tot schalen om abstracte concepten (vb. anomie,
onveiligheid…) te meten = schaalconstructie
1.2. Het coderen aan de hand van schalen
Van vragenlijst via codeboek naar databestand dmv coderen
o Codeboek = duidelijk maken hoe databestand wordt omgevormd dmv het toekennen van
codes
o bijkomende illustraties:
▪ Veiligheidsmonitor: vragenlijst met module buurtproblemen, mijdgedrag, risico-
inschatting, politiefunctioneren……
▪ SCV survey: overzicht vragen en codeboek
▪ ESS: ‘main questionnaire’ en ‘data protocol’
▪ JOP-monitor: technisch verslag
▪ …
o Illustratie vraag veiligheidsmonitor (ivm onveiligheidsgevoelens): mijdgedrag in de VM
(v57 t.e.m. v60)
3
, V57 (= code die vraag krijgt) VRAAG 024.a.- Gebeurt het dat u BEPAALDE
PLEKKEN IN UW GEMEENTE MIJDT OMDAT U HET NIET VEILIG VINDT? (in
1997: "Hoe dikwijls gebeurt het dat u ...")
1. Altijd 2. Vaak 3. Soms 4. Zelden
5. Nooit 6. Nvt 7. Weet niet 8. Geen antwoord
→ antwoorden wegschrijven in databestand dmv codes (nummer): letterlijke
antwoorden worden omgevormd in databestand
Uiteindelijk databestand: rijen en kolommen met alleen cijfers (= codes die
worden toegekend ~ kwantitatieve gegevens)
Waar kolom en rij kruist → antwoord op vraag x → codeboek vertelt je de betekenis van codes
Verschillende stappen
o 1ste stap: vragenlijst afnemen
o 2de stap: codeboek
o 3de stap: data-entry in SPSS
o 4de stap: data-cleaning en analyse
o Doordat het computergestuurd is → minder fouten/onduidelijkheden mogelijk bij
coderen
4
, o vb: meerdere bolletjes invullen, onduidelijk ingekleurde bolletjes → geen eenduidig
antwoord
Coderen: bijkomende punten en samenvattende regels om databestand op te bouwen
o overzichtelijke vragenlijst (genummerd)
o duidelijk en consequent codeboek (‘veldcoderen’ uitsluiten)
o afspraken voor ‘weet niet’ (7, 77,…), ‘geen antwoord’ (8, 88,…), ‘niet van toepassing’ (9,
99,…): zie bv. codeboek SCV survey
o afspraken voor filtervragen
o afspraken voor onduidelijke antwoorden vb: hoe coderen we bij dubbel antwoord
o afspraken verwerking meerdere antwoordmogelijkheden
o …
o Data-entry = data invullen in computer
▪ SPSS format opmaken
▪ Input met 2
▪ Voordeel van websurvey of CAS/TI
o Data-cleaning =
▪ Check: frequentietabellen
▪ Check filtervragen
2. Inleiding Multivariate Analyse
2.1. Inleiding
Waarom methodologie?
o methodologie en statistiek als ‘toolkit’ voor sociale wetenschapper
o onderzoek opzetten, uitvoeren en analyseren (en ‘evalueren’)
o methodologie deel 2: opzetten, uitvoeren
o methodologie deel 3: analyseren, concluderen
Rol van statistiek?
o beschrijvende statistiek: frequenties, tabellen, grafieken…
o inferentiële statistiek = steekrpoefdata gebruiken om conclusie te trekken voor hele
populatie
▪ modelleren van onzekerheid
▪ ‘hoe waarschijnlijk is een resultaat onder een bepaalde veronderstelling van de
werkelijkheid’
▪ statistiek als wetenschap van de probabiliteit
o een voorbeeld
OV: Verschilt het onveiligheidsgevoel tussen mannen en vrouwen?
conceptualisering, operationalisering, steekproeftrekking, dataverzameling…
analyse: onveiligheidsgevoel vrouwen > onveiligheidsgevoel mannen (steekproef!)
‘hoe groot is de kans dat vrouwen zich onveiliger voelen dan mannen (steekproef),
wanneer we veronderstellen dat geslacht en onveiligheidsgevoelens niet
samenhangen (nulhypothese)’
H0: onveiligheidsgevoel vrouwen = onveiligheidsgevoel mannen: wordt
verworpen als het lager is dan 5% significantieniveau
Ha: onveiligheidsgevoel vrouwen ≠ onveiligheidsgevoel mannen
Is het verschil significant?
Analyse in het criminologische domein
5