Inhoud
Les 1............................................................................................................................................. 4
Video 1: Voorbeelden van statistisch onderzoek................................................................................... 4
Video 2: De juiste statistische methoden en technieken kiezen............................................................ 5
Meetniveaus van variabelen........................................................................................ 5
Kengetallen..................................................................................................................7
Video 3: Bedrijfs- en empirisch onderzoek.............................................................................................9
Video 4: Modellen................................................................................................................................11
Causaal verband schema.......................................................................................... 11
Causaal verband schema.......................................................................................... 12
Formuleren van onderzoekshypotheses....................................................................14
Definitie van een model............................................................................................. 17
Video 5: Afronden................................................................................................................................ 19
College 2............................................................................................................................... 20
Video 1: Steekproef en populatie.........................................................................................................20
Steekproef en populatie.............................................................................................20
Video 2: Beschrijvende analyse............................................................................................................22
(Beschrijvende analyse) Kwantitatieve gegevens..................................................... 22
Video 3: Inferentiële analyse: basisconcepten..................................................................................... 27
Samenvatting van steekproefverdelingen..................................................................33
Video 4: Inferentiële analyse: schatting............................................................................................... 33
Begrippen en schattingsprobleem............................................................................. 33
Achtergrond Intervalschatting en samenvatting.........................................................35
Toepassingen: gemiddelde, variantie en Ratio.......................................................... 37
Video 5: Bijzonderheden van statistische schattingen......................................................................... 41
Interpretatie van intervalschatters..............................................................................41
Nauwkeurigheid van intervalschatters....................................................................... 42
Bepaal de minimaal vereiste steekproefomvang....................................................... 43
Video 6: Afronden................................................................................................................................ 44
Week 3: Hypothesetesten......................................................................................................46
Video 1: Univariate testen: idee...........................................................................................................46
Univariate testen: idee............................................................................................... 46
Video 2: Testen: 7-stappenplan (Neyman-Pearson-procedure)........................................................... 49
Visualisatie 7-stappenschema................................................................................... 50
Video 3: Overzicht teststatistieken en voorbeeldtestvariantie............................................................ 52
Video 4.1: Bijzonderheden hypothesetoetsing.................................................................................... 54
Rapportage................................................................................................................ 55
Keuze significantieniveau a....................................................................................... 55
Eenzijdig en tweezijdig testen....................................................................................56
Fisher's p-benadering van testen...............................................................................57
Let op: in onderstaand voorbeeld staat de p voor de proportie, niet voor de p-waarde
, 58
Video 4.2: Bijzonderheden hypothesetoetsing.................................................................................... 59
Type II-fouten en de Onderscheidend vermogen (of Power) van een test................ 59
Minimale vereiste steekproefgrootte..........................................................................61
Betekenis en relevantie............................................................................................. 63
Video 5: Afsluiting................................................................................................................................ 65
Vooruitzichten............................................................................................................ 66
Week 4: Statistische methoden in onderzoek........................................................................ 67
Video 1: Analyse van paarsgewijze samenhangs..................................................................................67
Overzicht van methoden en technieken voor de analyse van paarsgewijze
afhankelijkheden........................................................................................................68
Overzicht methoden en technieken........................................................................... 68
Parametrische en niet-parametrische technieken..................................................... 70
Technieken voor onafhankelijke en afhankelijke steekproeven................................. 70
Analysemethode en aandachtspunten...................................................................... 71
Video 2: Kernconcept: statistische onafhankelijkheid..........................................................................71
Definitie van statistische onafhankelijkheid............................................................... 72
Video 3: Afronden................................................................................................................................ 80
Week 5: Bivariate analyse.........................................................................................................82
Video 1: Onderzoek samenhang tussen twee kwalitatieve veriabelen..................................82
Video 2: Achtergrond Pearson's χ2 grootheid onderzoek gegeven kansverdelingen........... 83
Probleem................................................................................................................... 87
Video 3: Toepassing Pearson's χ2 grootheid onderzoek onafhankelijkheid.......................... 88
Video 4: Kruistabel bijzonderheden....................................................................................... 89
Fisher's exacte toets.................................................................................................. 90
Testen met P waarde................................................................................................. 91
Aard en mate van samenhang, rapportage............................................................... 92
Wrap up week 5.....................................................................................................................93
Overzicht.....................................................................................................................................................94
Overzicht van Variabelen en Effecten......................................................................................96
Causaal schema van verwachte relaties................................................................................. 99
R-code bibliotheek.................................................................................................................. 101
# Schoonmaken van de omgeving (Altijd fijn om mee te beginnen)....................................102
# DEEL 1: DATA INLADEN & BASIS INSPECTIE...............................................................103
# DEEL 2: DATAMANIPULATIE (DE INSTINKERS)........................................................... 103
# DEEL 3: BESCHRIJVENDE STATISTIEK........................................................................ 104
# DEEL 4: VISUALISATIE (GGPLOT2 & BASE)................................................................. 104
# DEEL 5: DE "P" VERSUS "Q" LOGICA (CRUCIAAL!)..................................................... 105
# DEEL 6: BETROUWBAARHEIDSINTERVALLEN (CI).....................................................106
# DEEL 7: HYPOTHESE TOETSEN................................................................................... 108
# DEEL 8: STEEKPROEFOMVANG BEREKENEN (PLANNING)...................................... 109
# DEEL 9: Pearson's χ2 test met kwalitatieve gegevens (kruistabellen).............................109
2
,# DEEL 10: POWER ANALYSE & steekproef bepalen via power(COMPACT)................... 112
# DEEL 11: SPECIFIEKE ZOEKFUNCTIES & HANDIGHEIDJES (GEREEDSCHAPSKIST)...
113
3
, Les 1
Video 1: Voorbeelden van statistisch onderzoek
De keuze voor een geschikte statistische methode hangt af van de volgende vijf criteria:
1. Onderzoeksopzet (Research Design) De structuur van je dataset bepaalt de opzet. We onderscheiden
drie vormen:
● Dwarsdoorsnede (Cross-sectional): Variabelen worden gemeten op één specifiek moment bij
verschillende eenheden (zoals personen, bedrijven of landen). Een voorbeeld is de uitslag van de
Amerikaanse verkiezingen, waarbij het stemgedrag van verschillende staten op één dag is
gemeten.
● Tijdreeks (Time series): Hierbij wordt één enkele eenheid (zoals een land) gemeten over
meerdere momenten in de tijd. Een voorbeeld is het dagelijkse aantal COVID-besmettingen in
Nederland gedurende het jaar 2020.
● Paneldata: Dit is een combinatie van de bovenstaande twee (een tijdreeks van een
dwarsdoorsnede). Je meet hierbij meerdere eenheden over meerdere momenten in de tijd.
Bijvoorbeeld: de dagelijkse COVID-cijfers per regio gedurende een jaar.
Let op: In deze cursus concentreren we ons voornamelijk op dwarsdoorsnede data.
2. Steekproefontwerp Hoewel de theorie vaak uitgaat van aselecte (willekeurige) steekproeven, is dit in
de praktijk vaak te duur of onpraktisch. Onderzoekers kiezen daarom vaak voor alternatieven zoals
gestratificeerde of geclusterde steekproeven.
3. Meetniveaus (Informatie-inhoud) Het meetniveau van de variabelen is cruciaal voor de keuze van de
techniek. We onderscheiden vier niveaus:
● Nominaal
● Ordinaal
● Interval
● Ratio
4. Complexiteit van de analyse Dit gaat over hoeveel variabelen je tegelijkertijd onderzoekt:
● Univariaat: Analyse van één variabele.
● Bivariaat: Onderzoek naar de relatie tussen twee variabelen.
● Multivariaat: Onderzoek naar relaties tussen meer dan twee variabelen.
5. Overige factoren Naast statistische regels spelen ook praktische zaken een rol:
● Communicatie: Soms heeft een eenvoudigere analyse de voorkeur omdat deze beter te
begrijpen is voor de doelgroep.
● Hulpbronnen: Beperkingen in tijd en geld beïnvloeden vaak de steekproefmethode.
● Politiek: Politieke belangen kunnen de keuze voor bepaalde methoden of presentatiewijzen
sturen.
4
Les 1............................................................................................................................................. 4
Video 1: Voorbeelden van statistisch onderzoek................................................................................... 4
Video 2: De juiste statistische methoden en technieken kiezen............................................................ 5
Meetniveaus van variabelen........................................................................................ 5
Kengetallen..................................................................................................................7
Video 3: Bedrijfs- en empirisch onderzoek.............................................................................................9
Video 4: Modellen................................................................................................................................11
Causaal verband schema.......................................................................................... 11
Causaal verband schema.......................................................................................... 12
Formuleren van onderzoekshypotheses....................................................................14
Definitie van een model............................................................................................. 17
Video 5: Afronden................................................................................................................................ 19
College 2............................................................................................................................... 20
Video 1: Steekproef en populatie.........................................................................................................20
Steekproef en populatie.............................................................................................20
Video 2: Beschrijvende analyse............................................................................................................22
(Beschrijvende analyse) Kwantitatieve gegevens..................................................... 22
Video 3: Inferentiële analyse: basisconcepten..................................................................................... 27
Samenvatting van steekproefverdelingen..................................................................33
Video 4: Inferentiële analyse: schatting............................................................................................... 33
Begrippen en schattingsprobleem............................................................................. 33
Achtergrond Intervalschatting en samenvatting.........................................................35
Toepassingen: gemiddelde, variantie en Ratio.......................................................... 37
Video 5: Bijzonderheden van statistische schattingen......................................................................... 41
Interpretatie van intervalschatters..............................................................................41
Nauwkeurigheid van intervalschatters....................................................................... 42
Bepaal de minimaal vereiste steekproefomvang....................................................... 43
Video 6: Afronden................................................................................................................................ 44
Week 3: Hypothesetesten......................................................................................................46
Video 1: Univariate testen: idee...........................................................................................................46
Univariate testen: idee............................................................................................... 46
Video 2: Testen: 7-stappenplan (Neyman-Pearson-procedure)........................................................... 49
Visualisatie 7-stappenschema................................................................................... 50
Video 3: Overzicht teststatistieken en voorbeeldtestvariantie............................................................ 52
Video 4.1: Bijzonderheden hypothesetoetsing.................................................................................... 54
Rapportage................................................................................................................ 55
Keuze significantieniveau a....................................................................................... 55
Eenzijdig en tweezijdig testen....................................................................................56
Fisher's p-benadering van testen...............................................................................57
Let op: in onderstaand voorbeeld staat de p voor de proportie, niet voor de p-waarde
, 58
Video 4.2: Bijzonderheden hypothesetoetsing.................................................................................... 59
Type II-fouten en de Onderscheidend vermogen (of Power) van een test................ 59
Minimale vereiste steekproefgrootte..........................................................................61
Betekenis en relevantie............................................................................................. 63
Video 5: Afsluiting................................................................................................................................ 65
Vooruitzichten............................................................................................................ 66
Week 4: Statistische methoden in onderzoek........................................................................ 67
Video 1: Analyse van paarsgewijze samenhangs..................................................................................67
Overzicht van methoden en technieken voor de analyse van paarsgewijze
afhankelijkheden........................................................................................................68
Overzicht methoden en technieken........................................................................... 68
Parametrische en niet-parametrische technieken..................................................... 70
Technieken voor onafhankelijke en afhankelijke steekproeven................................. 70
Analysemethode en aandachtspunten...................................................................... 71
Video 2: Kernconcept: statistische onafhankelijkheid..........................................................................71
Definitie van statistische onafhankelijkheid............................................................... 72
Video 3: Afronden................................................................................................................................ 80
Week 5: Bivariate analyse.........................................................................................................82
Video 1: Onderzoek samenhang tussen twee kwalitatieve veriabelen..................................82
Video 2: Achtergrond Pearson's χ2 grootheid onderzoek gegeven kansverdelingen........... 83
Probleem................................................................................................................... 87
Video 3: Toepassing Pearson's χ2 grootheid onderzoek onafhankelijkheid.......................... 88
Video 4: Kruistabel bijzonderheden....................................................................................... 89
Fisher's exacte toets.................................................................................................. 90
Testen met P waarde................................................................................................. 91
Aard en mate van samenhang, rapportage............................................................... 92
Wrap up week 5.....................................................................................................................93
Overzicht.....................................................................................................................................................94
Overzicht van Variabelen en Effecten......................................................................................96
Causaal schema van verwachte relaties................................................................................. 99
R-code bibliotheek.................................................................................................................. 101
# Schoonmaken van de omgeving (Altijd fijn om mee te beginnen)....................................102
# DEEL 1: DATA INLADEN & BASIS INSPECTIE...............................................................103
# DEEL 2: DATAMANIPULATIE (DE INSTINKERS)........................................................... 103
# DEEL 3: BESCHRIJVENDE STATISTIEK........................................................................ 104
# DEEL 4: VISUALISATIE (GGPLOT2 & BASE)................................................................. 104
# DEEL 5: DE "P" VERSUS "Q" LOGICA (CRUCIAAL!)..................................................... 105
# DEEL 6: BETROUWBAARHEIDSINTERVALLEN (CI).....................................................106
# DEEL 7: HYPOTHESE TOETSEN................................................................................... 108
# DEEL 8: STEEKPROEFOMVANG BEREKENEN (PLANNING)...................................... 109
# DEEL 9: Pearson's χ2 test met kwalitatieve gegevens (kruistabellen).............................109
2
,# DEEL 10: POWER ANALYSE & steekproef bepalen via power(COMPACT)................... 112
# DEEL 11: SPECIFIEKE ZOEKFUNCTIES & HANDIGHEIDJES (GEREEDSCHAPSKIST)...
113
3
, Les 1
Video 1: Voorbeelden van statistisch onderzoek
De keuze voor een geschikte statistische methode hangt af van de volgende vijf criteria:
1. Onderzoeksopzet (Research Design) De structuur van je dataset bepaalt de opzet. We onderscheiden
drie vormen:
● Dwarsdoorsnede (Cross-sectional): Variabelen worden gemeten op één specifiek moment bij
verschillende eenheden (zoals personen, bedrijven of landen). Een voorbeeld is de uitslag van de
Amerikaanse verkiezingen, waarbij het stemgedrag van verschillende staten op één dag is
gemeten.
● Tijdreeks (Time series): Hierbij wordt één enkele eenheid (zoals een land) gemeten over
meerdere momenten in de tijd. Een voorbeeld is het dagelijkse aantal COVID-besmettingen in
Nederland gedurende het jaar 2020.
● Paneldata: Dit is een combinatie van de bovenstaande twee (een tijdreeks van een
dwarsdoorsnede). Je meet hierbij meerdere eenheden over meerdere momenten in de tijd.
Bijvoorbeeld: de dagelijkse COVID-cijfers per regio gedurende een jaar.
Let op: In deze cursus concentreren we ons voornamelijk op dwarsdoorsnede data.
2. Steekproefontwerp Hoewel de theorie vaak uitgaat van aselecte (willekeurige) steekproeven, is dit in
de praktijk vaak te duur of onpraktisch. Onderzoekers kiezen daarom vaak voor alternatieven zoals
gestratificeerde of geclusterde steekproeven.
3. Meetniveaus (Informatie-inhoud) Het meetniveau van de variabelen is cruciaal voor de keuze van de
techniek. We onderscheiden vier niveaus:
● Nominaal
● Ordinaal
● Interval
● Ratio
4. Complexiteit van de analyse Dit gaat over hoeveel variabelen je tegelijkertijd onderzoekt:
● Univariaat: Analyse van één variabele.
● Bivariaat: Onderzoek naar de relatie tussen twee variabelen.
● Multivariaat: Onderzoek naar relaties tussen meer dan twee variabelen.
5. Overige factoren Naast statistische regels spelen ook praktische zaken een rol:
● Communicatie: Soms heeft een eenvoudigere analyse de voorkeur omdat deze beter te
begrijpen is voor de doelgroep.
● Hulpbronnen: Beperkingen in tijd en geld beïnvloeden vaak de steekproefmethode.
● Politiek: Politieke belangen kunnen de keuze voor bepaalde methoden of presentatiewijzen
sturen.
4