Kennisclip 9.1 – ANOVA
Anova => variantie-analyse
Variantie tussen groepen en variantie binnen groepen
Waarom ANOVA? Bij ANOVA gaan we ervan uit dat er een onafhankelijke variable is die een
effect heeft op een afhankelijke variabele. De onafhankelijke variabele bij een anova is
gemeten op nominaal meetniveau. De variabele bestaat dus uit een meting van
verschillende groepen, nationaliteit is zo’n nominale variabele. De ANOVA is ook geschikt bij
experimenten wanneer deelnemers zijn verdeeld in verschillende groepen die een
verschillende behandeling hebben gekregen. De ANOVA wordt dan gebruikt om te kijken of
de groepen van elkaar verschillen op de afhankelijke variabele. De afhankelijke variabele
moet worden gemeten op minstens interval niveau.
➔ Toetsen of groepen hetzelfde gemiddelde hebben of van elkaar verschillen
Een ANOVA bepaalt hoeveel totale variantie er in de afhankelijke variabele bestaat.
Vervolgens gaat het toetsen hoeveel van die variantie kan worden toegeschreven aan het
effect van groep en hoeveel aan toeval?
Een ander woord voor spreiding is variantie.
Variantie tussen groepen => de gemiddelden van de verschillende groepen wijken van elkaar
af. Hoeveel de groepen als geheel van elkaar verschillen. In een ANOVA de verklaarde
variantie, het groepseffect.
Variantie binnen groepen => de individuele datapunten binnen elke groep van het
gemiddelde die van die groep afwijken. Hoeveel scores binnen een groep van elkaar
verschillen. In een ANOVA de onverklaarde variantie.
Bij de ANOVA ga je de totale variantie opdelen in een binnengroepen variantie en een
tussengroepen variantie en de verhoudingen daartussen onderzoeken. Hoeveel van de
totale variantie wordt veroorzaakt door het groepseffect, en hoeveel door de onverklaarde
variantie?
SSbetween / SStot = proportie verklaarde variantie
SSbetween / SStot = R2
R2 = 0,01 zwak
R2 = 0,14 sterk
Alternatieven: 𝜂 2 of 𝜔2
• Hoe groot is de totale variantie; hoe ver liggen de punten van het algehele
gemiddelde?
• Hoe groot is het groepseffect; hoe ver liggen de groepsgemiddelden van het algehele
gemiddelde af?
• Hoe groot is de variantie die niet verklaard kan worden; hoe ver liggen de punten van
het groepsgemiddelde?
• Hoeveel van de totale variantie kan verklaard worden door het groepseffect?
, Kennisclip 9.2 – F-toets
Het aantal vrijheidsgraden wordt altijd aangeduid met df. De df behorende bij de
tussengroepen variantie is altijd gelijk aan k-1, oftewel het aantal groepen minus 1. Het
aantal vrijheidsgraden behorende bij de binnengroepen variantie is altijd gelijk aan N-k,
oftewel het aantal respondenten minus het aantal groepen.
dfbetween = k-1(df1)
dfwithin = N-k (df2)
MSbetween = SSbetween / dfbetween
MSwithin = SSwithin / dfwithin
F = MSbetween / MSwithin
Dat is de F-toets. Hoe groter de F-waarde, hoe groter het groepseffect.
Je kunt dan df1 en df2 gebruiken om de kritieke waarde van F te achterhalen. Vanaf wanneer
is de waarde van F significant?
Wetenschappelijke notatie: F(df1, df2) = F-waarde, p-waarde, R2 =
• Hoe groot is het groepseffect? (MSbetween)
• Hoe groot is de variantie die niet verklaard kan worden? (MSwithin)
• Wat is de verhouding tussen die twee? (F-waarde)
• Is het groepseffect groot genoeg in verhouding tot de onverklaarde variantie om een
significante F-waarde op te leveren?
Anova => variantie-analyse
Variantie tussen groepen en variantie binnen groepen
Waarom ANOVA? Bij ANOVA gaan we ervan uit dat er een onafhankelijke variable is die een
effect heeft op een afhankelijke variabele. De onafhankelijke variabele bij een anova is
gemeten op nominaal meetniveau. De variabele bestaat dus uit een meting van
verschillende groepen, nationaliteit is zo’n nominale variabele. De ANOVA is ook geschikt bij
experimenten wanneer deelnemers zijn verdeeld in verschillende groepen die een
verschillende behandeling hebben gekregen. De ANOVA wordt dan gebruikt om te kijken of
de groepen van elkaar verschillen op de afhankelijke variabele. De afhankelijke variabele
moet worden gemeten op minstens interval niveau.
➔ Toetsen of groepen hetzelfde gemiddelde hebben of van elkaar verschillen
Een ANOVA bepaalt hoeveel totale variantie er in de afhankelijke variabele bestaat.
Vervolgens gaat het toetsen hoeveel van die variantie kan worden toegeschreven aan het
effect van groep en hoeveel aan toeval?
Een ander woord voor spreiding is variantie.
Variantie tussen groepen => de gemiddelden van de verschillende groepen wijken van elkaar
af. Hoeveel de groepen als geheel van elkaar verschillen. In een ANOVA de verklaarde
variantie, het groepseffect.
Variantie binnen groepen => de individuele datapunten binnen elke groep van het
gemiddelde die van die groep afwijken. Hoeveel scores binnen een groep van elkaar
verschillen. In een ANOVA de onverklaarde variantie.
Bij de ANOVA ga je de totale variantie opdelen in een binnengroepen variantie en een
tussengroepen variantie en de verhoudingen daartussen onderzoeken. Hoeveel van de
totale variantie wordt veroorzaakt door het groepseffect, en hoeveel door de onverklaarde
variantie?
SSbetween / SStot = proportie verklaarde variantie
SSbetween / SStot = R2
R2 = 0,01 zwak
R2 = 0,14 sterk
Alternatieven: 𝜂 2 of 𝜔2
• Hoe groot is de totale variantie; hoe ver liggen de punten van het algehele
gemiddelde?
• Hoe groot is het groepseffect; hoe ver liggen de groepsgemiddelden van het algehele
gemiddelde af?
• Hoe groot is de variantie die niet verklaard kan worden; hoe ver liggen de punten van
het groepsgemiddelde?
• Hoeveel van de totale variantie kan verklaard worden door het groepseffect?
, Kennisclip 9.2 – F-toets
Het aantal vrijheidsgraden wordt altijd aangeduid met df. De df behorende bij de
tussengroepen variantie is altijd gelijk aan k-1, oftewel het aantal groepen minus 1. Het
aantal vrijheidsgraden behorende bij de binnengroepen variantie is altijd gelijk aan N-k,
oftewel het aantal respondenten minus het aantal groepen.
dfbetween = k-1(df1)
dfwithin = N-k (df2)
MSbetween = SSbetween / dfbetween
MSwithin = SSwithin / dfwithin
F = MSbetween / MSwithin
Dat is de F-toets. Hoe groter de F-waarde, hoe groter het groepseffect.
Je kunt dan df1 en df2 gebruiken om de kritieke waarde van F te achterhalen. Vanaf wanneer
is de waarde van F significant?
Wetenschappelijke notatie: F(df1, df2) = F-waarde, p-waarde, R2 =
• Hoe groot is het groepseffect? (MSbetween)
• Hoe groot is de variantie die niet verklaard kan worden? (MSwithin)
• Wat is de verhouding tussen die twee? (F-waarde)
• Is het groepseffect groot genoeg in verhouding tot de onverklaarde variantie om een
significante F-waarde op te leveren?