Samenvatting Data Exploration
Data Driven Business – Periode A
ANOVA (H12).................................................................................................3
Soorten ANOVA’s............................................................................................................ 3
ANOVA interpreteren...................................................................................................... 3
Planned Contrasts (H12.4).............................................................................................. 4
Post-Hoc-tests (H12.5).................................................................................................... 4
Effect sizes (H3.7)..........................................................................................5
Cohen’s d........................................................................................................................ 5
Pearson’s r...................................................................................................................... 5
The odds ratio................................................................................................................. 5
Meta-analyse.................................................................................................................. 6
Bias (H6.2)..................................................................................................... 8
Schending van assumpties (H6.4 t/m H6.8)....................................................................8
Additiviteit en lineariteit (H6.5)...................................................................................8
Normaliteit (H6.6)........................................................................................................ 8
Homoscedastiteit – Homogeniteit (H6.7)...................................................................10
Onafhankelijkheid (H6.8)........................................................................................... 10
Multicollineariteit....................................................................................................... 10
Outliers....................................................................................................... 11
Uitschieters spotten (H6.9)........................................................................................... 11
Bias reduceren (H6.12).................................................................................................11
Factoranalyse (H18).....................................................................................12
Factoren en componenten (H18.3)...............................................................................13
Grafische weergave factoranalyse – voorbeeld.........................................................13
Het ontdekken van factoren (18.4)...............................................................................13
Een methode kiezen (H18.4.1)..................................................................................13
Communaliteit (H18.4.2)........................................................................................... 13
Eigenwaarden (H18.4.5)............................................................................................ 14
Rotatie (H18.4.6).......................................................................................................... 14
Steekproef (18.5.2)....................................................................................................... 15
Correlaties tussen variabelen (18.5.3)..........................................................................16
Factoranalyse interpreteren (18.7)...............................................................................17
Betrouwbaarheidsanalyse (H18.9).................................................................20
Non-parametrische testen (H7).....................................................................20
Vergelijking van twee onafhankelijke condities (7.4)....................................................20
Vergelijking van twee afhankelijke condities (7.5)........................................................21
Vergelijking van meer dan twee afhankelijke groepen (7.7).........................................21
Vergelijking van meer dan twee onafhankelijke groepen (7.6).....................................22
Regressie (H9)............................................................................................. 22
1
, Introductie (9.2)............................................................................................................ 22
Enkelvoudige regressie (9.2.1).....................................................................................22
Meervoudige regressie (9.2.2)......................................................................................22
Assumpties regressieanalyse........................................................................................23
De fit van het model (9.2.4).......................................................................................... 23
Individuele predictoren (9.2.5)......................................................................................23
Bias in lineaire modellen (9.3)......................................................................................24
Cross-validatie.............................................................................................................. 25
Enkelvoudige regressie interpreteren...........................................................................25
Meervoudige regressiemethoden (9.9.1)......................................................................26
Multicollineariteit (9.9.3)........................................................................................... 26
Interpreteren van een meervoudige regressieanalyse..............................................27
Moderatie-modellen (H11)............................................................................29
Interpretatie SPSS-output............................................................................................. 29
Mediatieanalyse (H11)..................................................................................30
Interpretatie SPSS-output............................................................................................. 31
(Non-) technologische dataverzamelingsmethoden........................................32
XML (eXtensible Markup Language)..............................................................................32
JSON (JavaScript Object Notation).................................................................................35
Introductie.................................................................................................................... 35
JSON versus XML........................................................................................................... 36
Application Programming Interface (API)......................................................................37
REpresentational State Transfer (REST)........................................................................37
Overzicht-sheets..........................................................................................38
2
, ANOVA (H12)
De Analysis Of Variance (ANOVA) is zoals de naam al zegt een variantieanalyse, ook wel
een t-toets genoemd. Met een ANOVA kun je de gemiddeldes van drie of meer groepen
met elkaar vergelijken om na te gaan of er een significant verschil is tussen de
gemiddeldes van de groepen.
Voorbeeld onderzoeksvragen waar je ANOVA voor zou kunnen gebruiken zijn:
Wegen Amerikanen gemiddeld genomen zwaarder dan Europeanen en Aziaten?
Is er een verschil tussen de lengte van Amerikanen, Europeanen en Aziaten?
Soorten ANOVA’s
One-way-ANOVA
Deze variantieanalyse gebruik je wanneer één groepsvariabele de groepen bepaalt en er
maar één afhankelijke variabele is. Bijvoorbeeld als je het gewicht van mensen uit
verschillende landen vergelijkt. Het land van herkomst is de enige groepsvariabele en het
gewicht de enige afhankelijke variabele.
Two-way-ANOVA
Deze variantieanalyse gebruik je als er wél sprake is van twee of meer groepsvariabelen.
Je vergelijkt bijvoorbeeld het gewicht van mensen uit verschillende landen en hun
geslacht.
Multivariate ANOVA (MANOVA)
Deze variantieanalyse gebruik je als je meerdere afhankelijke variabelen gebruikt. Je
vergelijkt bijvoorbeeld het gewicht en de gemiddelde lengte van mensen uit verschillende
landen.
Repeated measures ANOVA
Je gebruikt deze variantieanalyse wanneer je een groep respondenten meerdere keren
onderzoekt. Je vergelijkt bijvoorbeeld het gewicht van Europeanen in 2005, 2010 en
2020. De steekproef is dan afhankelijk.
Voorwaarden voor het gebruik van ANOVA
Drie of meer groepen (bij 2 groepen gebruik je een normale t-toets)
Iedere groep is normaal verdeeld
De afhankelijke variabelen is gemeten op ratio- of intervalniveau
De varianties zijn voor elke groep gelijk (zie homoscedasticiteit)
De data is verzameld via een aselecte steekproef
ANOVA interpreteren
Als allereerst wil je bepalen of de varianties van de groepen gelijk zijn, dit is immers een
voorwaarden voor de ANOVA. Hiervoor kijk je naar de test of homogeneity of
variances. Kijk naar de significantiewaarde (sig.) gebaseerd op het gemiddelde (based
on mean). Als de waarde groter is dan 0.05 (de nulhypothese wordt verworpen) dan zijn
de varianties gelijk. Zo niet, dan kun je beter geen ANOVA uitvoeren.
De volgende stap is de ANOVA-tabel. Met een F-toets kan je bepalen of een significant
deel van de variantie verklaard wordt door de groepsvariabele. Dus is er bijvoorbeeld een
significant verschil tussen het gewicht van Europeanen en het gewicht van Amerikanen?
F-toets (df): de F-toets wordt gebruikt om twee varianties met elkaar te
vergelijken. Als de varianties gelijk zijn dan is de uitkomst 1. Zijn ze verschillend
dan is de uitkomst groter of kleiner dan 1, maar nooit 0. Het test in hoeverre de
data in het model past. Wanneer het gaat om gemiddelden, dan kijkt de F-toets of
er verschillen zijn tussen de gemiddeldes.
3
Data Driven Business – Periode A
ANOVA (H12).................................................................................................3
Soorten ANOVA’s............................................................................................................ 3
ANOVA interpreteren...................................................................................................... 3
Planned Contrasts (H12.4).............................................................................................. 4
Post-Hoc-tests (H12.5).................................................................................................... 4
Effect sizes (H3.7)..........................................................................................5
Cohen’s d........................................................................................................................ 5
Pearson’s r...................................................................................................................... 5
The odds ratio................................................................................................................. 5
Meta-analyse.................................................................................................................. 6
Bias (H6.2)..................................................................................................... 8
Schending van assumpties (H6.4 t/m H6.8)....................................................................8
Additiviteit en lineariteit (H6.5)...................................................................................8
Normaliteit (H6.6)........................................................................................................ 8
Homoscedastiteit – Homogeniteit (H6.7)...................................................................10
Onafhankelijkheid (H6.8)........................................................................................... 10
Multicollineariteit....................................................................................................... 10
Outliers....................................................................................................... 11
Uitschieters spotten (H6.9)........................................................................................... 11
Bias reduceren (H6.12).................................................................................................11
Factoranalyse (H18).....................................................................................12
Factoren en componenten (H18.3)...............................................................................13
Grafische weergave factoranalyse – voorbeeld.........................................................13
Het ontdekken van factoren (18.4)...............................................................................13
Een methode kiezen (H18.4.1)..................................................................................13
Communaliteit (H18.4.2)........................................................................................... 13
Eigenwaarden (H18.4.5)............................................................................................ 14
Rotatie (H18.4.6).......................................................................................................... 14
Steekproef (18.5.2)....................................................................................................... 15
Correlaties tussen variabelen (18.5.3)..........................................................................16
Factoranalyse interpreteren (18.7)...............................................................................17
Betrouwbaarheidsanalyse (H18.9).................................................................20
Non-parametrische testen (H7).....................................................................20
Vergelijking van twee onafhankelijke condities (7.4)....................................................20
Vergelijking van twee afhankelijke condities (7.5)........................................................21
Vergelijking van meer dan twee afhankelijke groepen (7.7).........................................21
Vergelijking van meer dan twee onafhankelijke groepen (7.6).....................................22
Regressie (H9)............................................................................................. 22
1
, Introductie (9.2)............................................................................................................ 22
Enkelvoudige regressie (9.2.1).....................................................................................22
Meervoudige regressie (9.2.2)......................................................................................22
Assumpties regressieanalyse........................................................................................23
De fit van het model (9.2.4).......................................................................................... 23
Individuele predictoren (9.2.5)......................................................................................23
Bias in lineaire modellen (9.3)......................................................................................24
Cross-validatie.............................................................................................................. 25
Enkelvoudige regressie interpreteren...........................................................................25
Meervoudige regressiemethoden (9.9.1)......................................................................26
Multicollineariteit (9.9.3)........................................................................................... 26
Interpreteren van een meervoudige regressieanalyse..............................................27
Moderatie-modellen (H11)............................................................................29
Interpretatie SPSS-output............................................................................................. 29
Mediatieanalyse (H11)..................................................................................30
Interpretatie SPSS-output............................................................................................. 31
(Non-) technologische dataverzamelingsmethoden........................................32
XML (eXtensible Markup Language)..............................................................................32
JSON (JavaScript Object Notation).................................................................................35
Introductie.................................................................................................................... 35
JSON versus XML........................................................................................................... 36
Application Programming Interface (API)......................................................................37
REpresentational State Transfer (REST)........................................................................37
Overzicht-sheets..........................................................................................38
2
, ANOVA (H12)
De Analysis Of Variance (ANOVA) is zoals de naam al zegt een variantieanalyse, ook wel
een t-toets genoemd. Met een ANOVA kun je de gemiddeldes van drie of meer groepen
met elkaar vergelijken om na te gaan of er een significant verschil is tussen de
gemiddeldes van de groepen.
Voorbeeld onderzoeksvragen waar je ANOVA voor zou kunnen gebruiken zijn:
Wegen Amerikanen gemiddeld genomen zwaarder dan Europeanen en Aziaten?
Is er een verschil tussen de lengte van Amerikanen, Europeanen en Aziaten?
Soorten ANOVA’s
One-way-ANOVA
Deze variantieanalyse gebruik je wanneer één groepsvariabele de groepen bepaalt en er
maar één afhankelijke variabele is. Bijvoorbeeld als je het gewicht van mensen uit
verschillende landen vergelijkt. Het land van herkomst is de enige groepsvariabele en het
gewicht de enige afhankelijke variabele.
Two-way-ANOVA
Deze variantieanalyse gebruik je als er wél sprake is van twee of meer groepsvariabelen.
Je vergelijkt bijvoorbeeld het gewicht van mensen uit verschillende landen en hun
geslacht.
Multivariate ANOVA (MANOVA)
Deze variantieanalyse gebruik je als je meerdere afhankelijke variabelen gebruikt. Je
vergelijkt bijvoorbeeld het gewicht en de gemiddelde lengte van mensen uit verschillende
landen.
Repeated measures ANOVA
Je gebruikt deze variantieanalyse wanneer je een groep respondenten meerdere keren
onderzoekt. Je vergelijkt bijvoorbeeld het gewicht van Europeanen in 2005, 2010 en
2020. De steekproef is dan afhankelijk.
Voorwaarden voor het gebruik van ANOVA
Drie of meer groepen (bij 2 groepen gebruik je een normale t-toets)
Iedere groep is normaal verdeeld
De afhankelijke variabelen is gemeten op ratio- of intervalniveau
De varianties zijn voor elke groep gelijk (zie homoscedasticiteit)
De data is verzameld via een aselecte steekproef
ANOVA interpreteren
Als allereerst wil je bepalen of de varianties van de groepen gelijk zijn, dit is immers een
voorwaarden voor de ANOVA. Hiervoor kijk je naar de test of homogeneity of
variances. Kijk naar de significantiewaarde (sig.) gebaseerd op het gemiddelde (based
on mean). Als de waarde groter is dan 0.05 (de nulhypothese wordt verworpen) dan zijn
de varianties gelijk. Zo niet, dan kun je beter geen ANOVA uitvoeren.
De volgende stap is de ANOVA-tabel. Met een F-toets kan je bepalen of een significant
deel van de variantie verklaard wordt door de groepsvariabele. Dus is er bijvoorbeeld een
significant verschil tussen het gewicht van Europeanen en het gewicht van Amerikanen?
F-toets (df): de F-toets wordt gebruikt om twee varianties met elkaar te
vergelijken. Als de varianties gelijk zijn dan is de uitkomst 1. Zijn ze verschillend
dan is de uitkomst groter of kleiner dan 1, maar nooit 0. Het test in hoeverre de
data in het model past. Wanneer het gaat om gemiddelden, dan kijkt de F-toets of
er verschillen zijn tussen de gemiddeldes.
3