ONE-WAY ANOVA
Soort uitbreiding van de Student’s t-testen
vergelijking van meerdere onafhankelijke groepen
ongepaarde test – continue variabele → >2 groepen
ANOVA – ANalysis Of VAriance
• Variantie = kwadraat van standaarddeviatie (in welke mate wijken waarden gemiddeld af van
het gemiddelde)
We werken met 3 soorten varianties
• Tussen groep: van mediaan tot mediaan
H0: groepsgemiddelden zijn gelijk [between-group variantie = within-group variantie]
→ test gebaseerd op F-test
VOORWAARDE: (zelfde als bij Student’s T)
• continue variabele EN
• GAUSSIAANS verdeeld
• én varianties in de groepen zijn gelijk
Significant → posthoc: Student’s t-test MET correctie (aanpassing voor meervoudige
hypothesetesten)
, Voorbeeldvraag: Is er een verschil in geboortegewicht tussen de verschillende leeftijdsgroepen
(<25j, 25-30j, >=30j).
• STAP 1: ALTIJD EERST CLEANEN!
• STAP 2: groepen maken! ➔ hier voor leeftijd moeder
o frequentietabel
o Recode into different: groepen maken
▪ Sysmis blijft sysmis ➔ anders kan dit voor problemen zorgen!
o Variable labels
o Value labels
o Formats
o Controle frequentietabel
• Eventueel cases selecteren (data – select cases – if condition is satisfied)
o Zie codeboek
o Controle met frequencietabel
• STAP 3: Voorwaarde 1: normaliteit nagaan ➔ shapiro wilk
o Analyze
o Descriptive explore:
▪ Dependent list = geboortegewicht
▪ Factor list = leeftijd moeder groepen
▪ Statistics afblijven
▪ Plots = normality with test
▪ Continue
▪ Paste
▪ Uitvoeren
o Interpretatie:
▪ Sig = p-waarde
▪ Normaalverdeeld wnr p-waarde > 0,05 ➔ nulhypothese aanvaarden
▪ Scheefverdeeld wnr p-waarde < 0,05 ➔ nulhypothese verwerpen +
alternatieve hypothese aanvaarden
o Centraal Limiet Theorema CLT = n moet groot genoeg zijn ➔ vanaf n=30 kunnen we
Gaussiaanse verdeling gaan inroepen = parametrisch
o ➔ wnr niet voldaan Kruskal-Wallis test!
• ANOVA
o Analyze
o Compare means
o One-way ANOVA
o Dependent list = geboortegewicht
o Factor = leeftijd moeder groepen
o Contrasts afblijven
o Options
▪ Descriptive
▪ Homogeneity of variance test ➔ om 2e voorwaarde te controleren: gelijke
varianties
• Levene test bekijken in output: based on mean
• Ongelijk = sig < 0,05 ➔ ANOVA NIET INTERPRETEREN
o Dan post hoc zoeken waar het verschil zit
• Gelijk = sig > 0,05
▪ Welch test OF Brown-Forsythe test WNR VARIANTIES NIET GELIJK
• Aangeven in methode welke je kiest
o Post hoc
▪ Wnr gelijke varianties: Scheffe OF Tukey
Soort uitbreiding van de Student’s t-testen
vergelijking van meerdere onafhankelijke groepen
ongepaarde test – continue variabele → >2 groepen
ANOVA – ANalysis Of VAriance
• Variantie = kwadraat van standaarddeviatie (in welke mate wijken waarden gemiddeld af van
het gemiddelde)
We werken met 3 soorten varianties
• Tussen groep: van mediaan tot mediaan
H0: groepsgemiddelden zijn gelijk [between-group variantie = within-group variantie]
→ test gebaseerd op F-test
VOORWAARDE: (zelfde als bij Student’s T)
• continue variabele EN
• GAUSSIAANS verdeeld
• én varianties in de groepen zijn gelijk
Significant → posthoc: Student’s t-test MET correctie (aanpassing voor meervoudige
hypothesetesten)
, Voorbeeldvraag: Is er een verschil in geboortegewicht tussen de verschillende leeftijdsgroepen
(<25j, 25-30j, >=30j).
• STAP 1: ALTIJD EERST CLEANEN!
• STAP 2: groepen maken! ➔ hier voor leeftijd moeder
o frequentietabel
o Recode into different: groepen maken
▪ Sysmis blijft sysmis ➔ anders kan dit voor problemen zorgen!
o Variable labels
o Value labels
o Formats
o Controle frequentietabel
• Eventueel cases selecteren (data – select cases – if condition is satisfied)
o Zie codeboek
o Controle met frequencietabel
• STAP 3: Voorwaarde 1: normaliteit nagaan ➔ shapiro wilk
o Analyze
o Descriptive explore:
▪ Dependent list = geboortegewicht
▪ Factor list = leeftijd moeder groepen
▪ Statistics afblijven
▪ Plots = normality with test
▪ Continue
▪ Paste
▪ Uitvoeren
o Interpretatie:
▪ Sig = p-waarde
▪ Normaalverdeeld wnr p-waarde > 0,05 ➔ nulhypothese aanvaarden
▪ Scheefverdeeld wnr p-waarde < 0,05 ➔ nulhypothese verwerpen +
alternatieve hypothese aanvaarden
o Centraal Limiet Theorema CLT = n moet groot genoeg zijn ➔ vanaf n=30 kunnen we
Gaussiaanse verdeling gaan inroepen = parametrisch
o ➔ wnr niet voldaan Kruskal-Wallis test!
• ANOVA
o Analyze
o Compare means
o One-way ANOVA
o Dependent list = geboortegewicht
o Factor = leeftijd moeder groepen
o Contrasts afblijven
o Options
▪ Descriptive
▪ Homogeneity of variance test ➔ om 2e voorwaarde te controleren: gelijke
varianties
• Levene test bekijken in output: based on mean
• Ongelijk = sig < 0,05 ➔ ANOVA NIET INTERPRETEREN
o Dan post hoc zoeken waar het verschil zit
• Gelijk = sig > 0,05
▪ Welch test OF Brown-Forsythe test WNR VARIANTIES NIET GELIJK
• Aangeven in methode welke je kiest
o Post hoc
▪ Wnr gelijke varianties: Scheffe OF Tukey