VARIANTIEANALYSE &
KRUISTABELLEN (OEFENSESSIES
6)
2 groepen kwantitatieve gegevens met elkaar vergelijken: relatief eenvoudig met behulp
van T-test
Maar wat te doen:
- als we meerdere groepen met elkaar moeten vergelijken
- of gegevens zijn kwalitatief?
In onderstaande oefeningen: zien 2 bijkomende procedures om deze problemen
te ontmijnen
1 ONDERSTEUNENDE OEFENING – VERKOOPCIJFERS
1.1 ACHTERGROND: ONE-WAY ANOVA
t-test: behoorlijk beperkt om meerdere groepsgemiddelden met elkaar te vergelijken
• Om meerdere groepen onderling met elkaar te vergelijken gebruiken
analysetechniek die kijkt naar de variantie
= ANOVA: ANalysis Of VAriance
Kort samengevat:
1. interne of errorvariatie ( S E) per groep berekend
= afwijking van individuele metingen ten opzichte van hun groepsgemiddelde
→ Deze variatie: te wijten aan toevalligheden en/of kleine meetfouten
(observational error)
2. berekenen effect-of treatmentvariatie ( S BEH )
= afwijking van elk groepsgemiddelde ten opzichte van het totaal gemiddelde
→ deze variatie: valt te verklaren door effectieve systematische verschillen tussen
groepen:
, In bovenstaand voorbeeld:
• zien 3 groepen metingen vergeleken worden ten opzichte van totaal
o Groepen 1 en 2: hebben vrij lage effectvariatie in vergelijking met hun
interne variatie
→ ze wijken niet veel af van het totale gemiddelde
o Groep 3: lijkt echter bijzonder ver te liggen van het totale
gemiddelde (en dus ook groepen 1 & 2)
→ Op zicht: lijkt groep 3 significant te verschillen van rest
1.2 ONE-WAY ANOVA OP VERKOOPCIJFERS PER GEMEENTE
eerder al gezien: dat er tussen Deloof & Stevens behoorlijk verschil zit qua
verkoopcijfers
NU: controleren of er eventueel effect zou zijn van locatie
* Anders gesteld: zit er een verschil in gemiddelde verkoopprijs per gemeente?
kijken eerst even op rainclouds:
Op eerste zicht: lijkt niet dat verkoopprijs afhankelijk is van localiteit (of gemeente)
• groepsgemiddelden (plusminus foutenmarge): lijken met elkaar te overlappen
KRUISTABELLEN (OEFENSESSIES
6)
2 groepen kwantitatieve gegevens met elkaar vergelijken: relatief eenvoudig met behulp
van T-test
Maar wat te doen:
- als we meerdere groepen met elkaar moeten vergelijken
- of gegevens zijn kwalitatief?
In onderstaande oefeningen: zien 2 bijkomende procedures om deze problemen
te ontmijnen
1 ONDERSTEUNENDE OEFENING – VERKOOPCIJFERS
1.1 ACHTERGROND: ONE-WAY ANOVA
t-test: behoorlijk beperkt om meerdere groepsgemiddelden met elkaar te vergelijken
• Om meerdere groepen onderling met elkaar te vergelijken gebruiken
analysetechniek die kijkt naar de variantie
= ANOVA: ANalysis Of VAriance
Kort samengevat:
1. interne of errorvariatie ( S E) per groep berekend
= afwijking van individuele metingen ten opzichte van hun groepsgemiddelde
→ Deze variatie: te wijten aan toevalligheden en/of kleine meetfouten
(observational error)
2. berekenen effect-of treatmentvariatie ( S BEH )
= afwijking van elk groepsgemiddelde ten opzichte van het totaal gemiddelde
→ deze variatie: valt te verklaren door effectieve systematische verschillen tussen
groepen:
, In bovenstaand voorbeeld:
• zien 3 groepen metingen vergeleken worden ten opzichte van totaal
o Groepen 1 en 2: hebben vrij lage effectvariatie in vergelijking met hun
interne variatie
→ ze wijken niet veel af van het totale gemiddelde
o Groep 3: lijkt echter bijzonder ver te liggen van het totale
gemiddelde (en dus ook groepen 1 & 2)
→ Op zicht: lijkt groep 3 significant te verschillen van rest
1.2 ONE-WAY ANOVA OP VERKOOPCIJFERS PER GEMEENTE
eerder al gezien: dat er tussen Deloof & Stevens behoorlijk verschil zit qua
verkoopcijfers
NU: controleren of er eventueel effect zou zijn van locatie
* Anders gesteld: zit er een verschil in gemiddelde verkoopprijs per gemeente?
kijken eerst even op rainclouds:
Op eerste zicht: lijkt niet dat verkoopprijs afhankelijk is van localiteit (of gemeente)
• groepsgemiddelden (plusminus foutenmarge): lijken met elkaar te overlappen