H8: VARIANTIEANALYSE
ANOVA (variantieanalyse) is een toetsingsprocedure die wordt gebruikt bij het toetsen van
de gemiddelden van meer dan twee onafhankelijke groepen.
Onderscheid op basis van een categorische variabele
Toetsvariabele heeft interval/ratioschaal
Grand mean = totale gemiddelde van alle waarnemingen ongeacht tot welke groep ze
behoren Xt
Kwadraatsommen = de som van de gekwadrateerde afwijkingen van alle waarnemingen ten
opzichte van het gemiddelde de berekening van de variantieanalyse is gebaseerd op de
variantie tussen de waarnemingen.
SST= totale kwadraatsom
som van de gekwadrateerde afwijkingen van alle waarnemingen ten opzichte van het totale
gemiddelde (grand mean)
SST ( xi xT )2
SSB = tussenkwadraatsom
gekwadrateerde afwijking van de groepsgemiddelden t.o.v. het totale gemiddelde,
gewogen voor het aantal waarnemingen
SSB n j ( x j xT )
2
SSW = binnenkwadraatsom
de spreiding van de waarnemingen binnen iedere groep, ook wel ruis genoemd. Dit wordt
dus niet verklaard door de verschillen tussen de groepen.
SSW ( xi x j )
2
(Rekenformules staan op het formuleblad)
ANOVA-tabel
SS B /(k 1)
F
SSW / (n k )
Toetsingsgrootheid F = verhouding tussen de tussen- en binnenkwadraattoets. Als F groot
is, wordt het merendeel van de variantie bepaald door de SSB, dus verwerpen we de
nulhypothese dat de groepen gelijk zijn.
- F-verdeling is ALTIJD éénzijdig, met het gehele kritieke gebied rechts!
- Bijbehorende tabel is tabel E met df1=(k-1) en df2=(n-k)
- H0 verwerpen als X ≥ kritieke waarde
, Vooronderstellingen ANOVA
1. Aselect en onafhankelijke steekproef
2. Onderscheid op basis van categorische variabele, toetsvariabele is interval/ratio
3. Toetsvariabele normaal verdeeld
a. N>30 centrale limiet stelling
b. Schatten aan de hand van histogram, Q-Qplot, Shapiro Wilks of
Skewness/Kurtosis
c. ! als de groepen EVEN GROOT zijn, wordt uitgegaan van normaliteit
4. Gelijke varianties (homogeniteit)
a. S2max/S2min<4
b. Levene’s test
c. ! als de groepen EVEN GROOT zijn, wordt uitgegaan van homogeniteit
Effect size (Eta-square)
SSB 293
2 0,25
SST 1166
In dit voorbeeld wordt dus 25% verklaard door de verschillen tussen de groepen (sterk
effect).
ANOVA met SPSS
P<0,05 dus H0 (dat de populatiegemiddelden gelijk zijn) wordt verworpen, er is sprake van
een significant verschil.
de effect size kan je handmatig berekenen met de bovenstaande formule, of anders via
SPSS.
Post-Hoc test (Bonferroni)
Als de gemiddelden niet allemaal gelijk zijn, kun je met de bonferroni-test onderzoeken
welke gemiddelden van welke groepen significant van elkaar verschillen. Uit onderstaande
tabel kan geconcludeerd worden dat alleen Groningen en Utrecht significant verschillen.