Toegepaste data-analyse
H9: KRUISTABELLEN
Chi-kwadraat-toets ( X 2 ¿
- Verband tussen twee categorische variabelen toetsen, bij onafhankelijke groepen
- Verschil tussen de geobserveerde frequenties (fo) binnen een steekproef met de verwachte
frequenties (fe) binnen een populatie = X 2 -waarde
Hoe groter discrepantie
o Hoe groter de kans dat steekproef en populatie van elkaar verschillen
o Hoe groter de kans op vaststellen van significant verband
Assumpties
1. Categorische variabelen absolute frequenties
2. Elke variabele min. 2 mutueel exclusieve categorieën
indien meer dan 2 categorieën => partitioneren (select cases)
3. 2 onafhankelijke groepen
indien 2 afhankelijke groepen => McNemar
4. Iederen cel moet minstens 5 frequenties bevatten (f(e) > 5)
indien minder dan 5 => Fisher exact
SPSS: Pearson Chi-Square
- Analyze descriptive statistics crosstabs
- rows = AV
- columns = OV
Statistics aanvinken: Chi-squared en Phi & Cramers’ V
Cells aanvinken: observed en column
output
- assumptie 4 checken
- % within (vergelijking groepen)
- Pearson chi-squared = chi-kwadraat
- P-waarde (asymptotic significance (2-sided)) vergelijk met vooropgesteld significantieniveau
p < α H0 verwerpen (wel significante verband)
p > α H0 aannemen (geen significante verband)
- Effectgrootte Cramer’s V
0= geen associatie 1= perfecte associatie
,Toegepaste data-analyse
Fisher-Exact-toets
= alternatieve toets bij schending assumptie 4
- Geeft een gecorrigeerde, meer nauwkeurige p-waarde
- Bij 2X2-kruistabellen
Automatisch gegenereerd in SPSS
McNemar-toets
= Chi2-toets bij afhankelijke steekproeven
- Frequenties van variabele op twee verschillende tijdsmomenten
- Twee keer bij dezelfde groep gemeten
Assumpties
- de twee groepen die vergeleken worden, zijn afhankelijk van elkaar
- twee nominale variabelen met elk dezelfde twee categorieën
SPSS
Analyze Nonparametric Tests Legacy Dialogs 2 Related Samples
(McNemar aanvinken)
output
- McNemar vergelijken met vooropgestelde significantieniveau
p < α H0 verwerpen (wel significante verandering)
p > α H0 aannemen (geen significante verandering)
, Toegepaste data-analyse
H10: TWEE GEMIDDELDEN VERGELIJKEN
t-toetsen
- Twee gemiddelden vergelijken
- Hypothese: H0: x1 =x2
HA: x1 x2
Non-parametrische toetsen
- Twee medianen vergelijken
- Als assumptie(s) bij t-toets niet voldaan zijn
Onafhankelijke t-toets
- Gemiddelden vergelijken van 2 onafhankelijke groepen (niet gerelateerd)
- Wat is hun gemiddelde score op dezelfde afhankelijke variabele?
- Toetsingsgrootheid t-waarde met sp = gepoolde schatter, combinatie van de
standaardfouten van beide groepen
- Maat van effectgrootte: Cohen’s d (berekend door SPSS)
Assumpties
- Afhankelijke variabele = metrisch
- Onafhankelijke variabele = categorisch, max 2 groepen
- Onafhankelijke groepen onderzoekseenheden
- Normaliteit: AV binnen elke groep normaal verdeeld (of CLS: n > 100 voor elke groep)
checken adhv z-score van scheefheid & kurtosis
z-score van 1 van beide > 1,96 => variabele is niet normaal verdeeld
analyze descriptive statistics explore
dependent list = AV
factor list = OV
plots aanvinken: histogram en normality plots with tests
kijk naar normal Q-Q plot
Als punten op de lijn liggen = normaal verdeeld
- Homogeniteit van varianties: gelijke varianties van de afhankelijke variabele in elke groep
Checken in SPSS-output: Levene toets
SPSS
(eerst aanmaken van gemiddelden van veerschillende variabelen transfrom compute variable
functions: mean)
Analyze Compare Means Independent-Samples T Test
test variables: AV
grouping variables: OV
define groups: groepen aanpassen indien nodig
estimate effectsize aanvinken
H9: KRUISTABELLEN
Chi-kwadraat-toets ( X 2 ¿
- Verband tussen twee categorische variabelen toetsen, bij onafhankelijke groepen
- Verschil tussen de geobserveerde frequenties (fo) binnen een steekproef met de verwachte
frequenties (fe) binnen een populatie = X 2 -waarde
Hoe groter discrepantie
o Hoe groter de kans dat steekproef en populatie van elkaar verschillen
o Hoe groter de kans op vaststellen van significant verband
Assumpties
1. Categorische variabelen absolute frequenties
2. Elke variabele min. 2 mutueel exclusieve categorieën
indien meer dan 2 categorieën => partitioneren (select cases)
3. 2 onafhankelijke groepen
indien 2 afhankelijke groepen => McNemar
4. Iederen cel moet minstens 5 frequenties bevatten (f(e) > 5)
indien minder dan 5 => Fisher exact
SPSS: Pearson Chi-Square
- Analyze descriptive statistics crosstabs
- rows = AV
- columns = OV
Statistics aanvinken: Chi-squared en Phi & Cramers’ V
Cells aanvinken: observed en column
output
- assumptie 4 checken
- % within (vergelijking groepen)
- Pearson chi-squared = chi-kwadraat
- P-waarde (asymptotic significance (2-sided)) vergelijk met vooropgesteld significantieniveau
p < α H0 verwerpen (wel significante verband)
p > α H0 aannemen (geen significante verband)
- Effectgrootte Cramer’s V
0= geen associatie 1= perfecte associatie
,Toegepaste data-analyse
Fisher-Exact-toets
= alternatieve toets bij schending assumptie 4
- Geeft een gecorrigeerde, meer nauwkeurige p-waarde
- Bij 2X2-kruistabellen
Automatisch gegenereerd in SPSS
McNemar-toets
= Chi2-toets bij afhankelijke steekproeven
- Frequenties van variabele op twee verschillende tijdsmomenten
- Twee keer bij dezelfde groep gemeten
Assumpties
- de twee groepen die vergeleken worden, zijn afhankelijk van elkaar
- twee nominale variabelen met elk dezelfde twee categorieën
SPSS
Analyze Nonparametric Tests Legacy Dialogs 2 Related Samples
(McNemar aanvinken)
output
- McNemar vergelijken met vooropgestelde significantieniveau
p < α H0 verwerpen (wel significante verandering)
p > α H0 aannemen (geen significante verandering)
, Toegepaste data-analyse
H10: TWEE GEMIDDELDEN VERGELIJKEN
t-toetsen
- Twee gemiddelden vergelijken
- Hypothese: H0: x1 =x2
HA: x1 x2
Non-parametrische toetsen
- Twee medianen vergelijken
- Als assumptie(s) bij t-toets niet voldaan zijn
Onafhankelijke t-toets
- Gemiddelden vergelijken van 2 onafhankelijke groepen (niet gerelateerd)
- Wat is hun gemiddelde score op dezelfde afhankelijke variabele?
- Toetsingsgrootheid t-waarde met sp = gepoolde schatter, combinatie van de
standaardfouten van beide groepen
- Maat van effectgrootte: Cohen’s d (berekend door SPSS)
Assumpties
- Afhankelijke variabele = metrisch
- Onafhankelijke variabele = categorisch, max 2 groepen
- Onafhankelijke groepen onderzoekseenheden
- Normaliteit: AV binnen elke groep normaal verdeeld (of CLS: n > 100 voor elke groep)
checken adhv z-score van scheefheid & kurtosis
z-score van 1 van beide > 1,96 => variabele is niet normaal verdeeld
analyze descriptive statistics explore
dependent list = AV
factor list = OV
plots aanvinken: histogram en normality plots with tests
kijk naar normal Q-Q plot
Als punten op de lijn liggen = normaal verdeeld
- Homogeniteit van varianties: gelijke varianties van de afhankelijke variabele in elke groep
Checken in SPSS-output: Levene toets
SPSS
(eerst aanmaken van gemiddelden van veerschillende variabelen transfrom compute variable
functions: mean)
Analyze Compare Means Independent-Samples T Test
test variables: AV
grouping variables: OV
define groups: groepen aanpassen indien nodig
estimate effectsize aanvinken