Periode 2
Eénweg ANOVA
Eenweg ANOVA
- Eén afhankelijke variabele (Y)
- Eén factor
One way ANOVA
Aannames ANOVA-model
1. Onafhankelijkheid van waarnemingen (observaties) bij respondenten (independence).
2. Meetniveau Y minimaal interval en factoren nominaal
3. Spreiding (variantie) van residuen per groep gelijk (homoscedastisch / homogeneity of
variance).
4. Residuen per X-categorie normaal verdeeld (normally distributed errors).
5. Geen uitbijters (outliers) en ‘te’ invloedrijke respondenten (influential cases).
F-toetsingsgrootheid voor eenweg ANOVA
Toetsingsgrootheid F
- Ratio van de model variantie (MSm) en de residuele (error) variantie (MSr)
- Vergelijkt de door het model verklaarde variantie (MSm) met de niet door het model
verklaarde variantie (MSr).
Meerweg ANOVA
Padmodel meerweg ANOVA
- Eén afhankelijke variabele (Y)
- Eén of meerdere onafhankelijke variabelen met twee of meer categorieën
(minimaal nominaal meetniveau)
Door er streepjes door te zetten, kun je zien dat het gaat om groepen. Bij X1 = 3 groepen en X2 = 2
groepen.
Meerweg ANOVA (factorial ANOVA)
- Eén afhankelijke variabele (Y)
- Meer dan één factor (X1, X2, …)
Two-way, Three-way … ANOVA
Meetniveaus:
Meetniveau afhankelijke variabele Y? = minimale meetniveau : interval
Meetniveau onafhankelijke variabele X? = minimaal meetniveau : nominaal met a categorieën
,Waar kijken we naar?
De gemiddelden in kennis van getallen van groepen beschrijven en toetsen = gemiddelden model
Passende analysetechniek? = variantieanalyse = (meerweg) ANOVA
Aannames ANOVA-model
6. Onafhankelijkheid van waarnemingen (observaties) bij respondenten (independence).
7. Meetniveau Y minimaal interval en factoren nominaal
8. Spreiding (variantie) van residuen per groep gelijk (homoscedastisch / homogeneity of
variance).
9. Residuen per X-categorie normaal verdeeld (normally distributed errors).
10. Geen uitbijters (outliers) en ‘te’ invloedrijke respondenten (influential cases).
Algemeen: verschillen twee of meer groepen op het gemiddelde van een variabele Y?
Voorbeeld onderzoeksvraag: verschillen groepen gebaseerd op leeftijd en sekse in hun kennis van
getallen?
De variabelen die daar bij horen:
- Afhankelijke variabele (Y) = Kennis van getallen
- Verklaren met onafhankelijke variabelen (X): - Sekse
-Leeftijd in drie categorieën
Afhankelijke variabele = prenumb (kennis van getallen)
Factoren
- Age3 (leeftijd)
1. = jong = jonger dan 47 maanden
2. = midden = tussen 47 en 58 maanden
3. = oud = ouder dan 58 maanden
- Sexe (sekse)
1. = jongen
2. = meisje
Dit wordt ene 3 x 2 factorieel ontwerp genoemd
Model en hypothesen
Toetsing
Sum of sqaures : DF = mean square
Mean square = sum of squaes : DF
,Toetsing alle vier de hypothesen:
F-ratio tweeweg ANOVA
F-toetsingsgrootheid opsplitsing
De verklaarde variantie (MSm) bepaald door:
- Effect eerste onafhankelijke variabele A (MSa)
- Effect tweede onafhankelijke variabele B (MSb)
- Interactie-effect A en B (MS axb)
Effectgrootte
Bij ANOVA: n² = verklaarde variantie door gemiddelden model
Rapportage volgens APA richtlijnen: F(2,234) = 0.99, p = .37 n(etta)² = .01
, Categorische kenmerken
Voorbeeld: Sekse en leeftijd zijn factoren in de tweeweg ANOVA
Vraag: Kunnen we deze categorische kenmerken (nominale variabelen) meenemen als predictoren in
een regressieanalyse?
Meetniveau sekse en leeftijd
Sekse: nominaal meetniveau, twee categorieën (dichotoom)
Leeftijd: ordinaal meetniveau, drie categorieën
Antwoord:
Sekse: ja dat kan, want het is een dichotome variabele
Leeftijd: Nee, tenzij we de variabele representeren door dummyvariabelen.
Dummyvariabelen (1)
Dummyvariabelen voor leeftijd
- Representeren nominale of ordinale variabele met twee of meer categorieën
- Dummyvariabele heeft slechts twee waarden (bijv. 0 en 1)
- Door de representatie categorische variabelen met dummy’s → lineaire regressieanalyse
mogelijk
K = aantal groepen
Dummyvariabelen (2)
Omzetten nominale variabele naar dummyvariabelen (D)
- Voor variabele Sekse
- Voor variabele leeftijd
Eénweg ANOVA
Eenweg ANOVA
- Eén afhankelijke variabele (Y)
- Eén factor
One way ANOVA
Aannames ANOVA-model
1. Onafhankelijkheid van waarnemingen (observaties) bij respondenten (independence).
2. Meetniveau Y minimaal interval en factoren nominaal
3. Spreiding (variantie) van residuen per groep gelijk (homoscedastisch / homogeneity of
variance).
4. Residuen per X-categorie normaal verdeeld (normally distributed errors).
5. Geen uitbijters (outliers) en ‘te’ invloedrijke respondenten (influential cases).
F-toetsingsgrootheid voor eenweg ANOVA
Toetsingsgrootheid F
- Ratio van de model variantie (MSm) en de residuele (error) variantie (MSr)
- Vergelijkt de door het model verklaarde variantie (MSm) met de niet door het model
verklaarde variantie (MSr).
Meerweg ANOVA
Padmodel meerweg ANOVA
- Eén afhankelijke variabele (Y)
- Eén of meerdere onafhankelijke variabelen met twee of meer categorieën
(minimaal nominaal meetniveau)
Door er streepjes door te zetten, kun je zien dat het gaat om groepen. Bij X1 = 3 groepen en X2 = 2
groepen.
Meerweg ANOVA (factorial ANOVA)
- Eén afhankelijke variabele (Y)
- Meer dan één factor (X1, X2, …)
Two-way, Three-way … ANOVA
Meetniveaus:
Meetniveau afhankelijke variabele Y? = minimale meetniveau : interval
Meetniveau onafhankelijke variabele X? = minimaal meetniveau : nominaal met a categorieën
,Waar kijken we naar?
De gemiddelden in kennis van getallen van groepen beschrijven en toetsen = gemiddelden model
Passende analysetechniek? = variantieanalyse = (meerweg) ANOVA
Aannames ANOVA-model
6. Onafhankelijkheid van waarnemingen (observaties) bij respondenten (independence).
7. Meetniveau Y minimaal interval en factoren nominaal
8. Spreiding (variantie) van residuen per groep gelijk (homoscedastisch / homogeneity of
variance).
9. Residuen per X-categorie normaal verdeeld (normally distributed errors).
10. Geen uitbijters (outliers) en ‘te’ invloedrijke respondenten (influential cases).
Algemeen: verschillen twee of meer groepen op het gemiddelde van een variabele Y?
Voorbeeld onderzoeksvraag: verschillen groepen gebaseerd op leeftijd en sekse in hun kennis van
getallen?
De variabelen die daar bij horen:
- Afhankelijke variabele (Y) = Kennis van getallen
- Verklaren met onafhankelijke variabelen (X): - Sekse
-Leeftijd in drie categorieën
Afhankelijke variabele = prenumb (kennis van getallen)
Factoren
- Age3 (leeftijd)
1. = jong = jonger dan 47 maanden
2. = midden = tussen 47 en 58 maanden
3. = oud = ouder dan 58 maanden
- Sexe (sekse)
1. = jongen
2. = meisje
Dit wordt ene 3 x 2 factorieel ontwerp genoemd
Model en hypothesen
Toetsing
Sum of sqaures : DF = mean square
Mean square = sum of squaes : DF
,Toetsing alle vier de hypothesen:
F-ratio tweeweg ANOVA
F-toetsingsgrootheid opsplitsing
De verklaarde variantie (MSm) bepaald door:
- Effect eerste onafhankelijke variabele A (MSa)
- Effect tweede onafhankelijke variabele B (MSb)
- Interactie-effect A en B (MS axb)
Effectgrootte
Bij ANOVA: n² = verklaarde variantie door gemiddelden model
Rapportage volgens APA richtlijnen: F(2,234) = 0.99, p = .37 n(etta)² = .01
, Categorische kenmerken
Voorbeeld: Sekse en leeftijd zijn factoren in de tweeweg ANOVA
Vraag: Kunnen we deze categorische kenmerken (nominale variabelen) meenemen als predictoren in
een regressieanalyse?
Meetniveau sekse en leeftijd
Sekse: nominaal meetniveau, twee categorieën (dichotoom)
Leeftijd: ordinaal meetniveau, drie categorieën
Antwoord:
Sekse: ja dat kan, want het is een dichotome variabele
Leeftijd: Nee, tenzij we de variabele representeren door dummyvariabelen.
Dummyvariabelen (1)
Dummyvariabelen voor leeftijd
- Representeren nominale of ordinale variabele met twee of meer categorieën
- Dummyvariabele heeft slechts twee waarden (bijv. 0 en 1)
- Door de representatie categorische variabelen met dummy’s → lineaire regressieanalyse
mogelijk
K = aantal groepen
Dummyvariabelen (2)
Omzetten nominale variabele naar dummyvariabelen (D)
- Voor variabele Sekse
- Voor variabele leeftijd