Samenvatting Statistiek 3
Week 1: Generalized Lineair Models
Algemeen
Eenweg-ANOVA, tweeweg-ANOVA, ANCOVA en moderatieanalyses zijn
allemaal technieken voor de analyse van een regressiemodel. Het
regressiemodel is bij deze modellen dus telkens de basis. Het
enkelvoudige, logistische en ordinale regressiemodel zijn specifieke
analysemethoden van de Generalized Lineair Regression.
Anova-modelvergelijking
R2 verklaarde variantie in y door x óf proportie afname fouten in
geschatte y – voorspelde y.
ANOVA heeft als doel de variantie te splitsen in 2 delen; de verklaarde &
onverklaarde variantie.
De ANOVA F-toetsen die hierbij horen zijn als volgt;
2 2
H 0 ; p =0 en H a ; p >0
H 0 ; β1 =β 2=β 3=0 en H a ; niet alle β zijn gelijk aan 0
MSreg R 2 /k
F= =
MSE ( 1−R2 ) /(n−k−1)
Groepsgemiddelden vergelijken
ANOVA is een techniek om vergelijkingen te maken tussen 2 groepen.
Wanneer je een dummyvariabele hebt, vergelijkt de F-toets de twee
gemiddelden.
Week 2: Groepen vergelijken – Eenweg ANOVA
Dummyvariabelen
Van categorische variabelen kun je een aantal dummyvariabelen maken.
Altijd één minder dan het aantal groepen; g – 1.
De intercept is het gemiddelde van één van de groepen en is vaak de
referentiegroep. De hellingen geven het verschil tussen de overige
groepen en de referentiegroep aan. De dummy’s zijn onafhankelijk van
elkaar, je kunt dus maar in één groep tegelijk zitten = mutually exclusive.
Samen vormen de dummy’s één onafhankelijke categorische variabele.
H 0 ; μ 1=μ2=…=μ g H a ; tenminste twee gemiddelden verschillen
Groot verschil tussen groepen = tussengroepsvariantie groot
, Weinig verschil binnen groepen = binnengroepsvariantie klein
Als uit de toets komt dat de F-toets significant is, is er dus één groep die
signifcant verschilt van de rest. Maar welke is dit? Hiervoor heb je een
follow-up nodig.
- Je gaat de verschillen tussen alle paren van gemiddelden toetsen,
dus tussen alle groepen. = post-hoctoets
Gevaar hierbij is kanskapitalisatie, je maakt teveel type I fouten en
verwerpt dus te vaak de nulhypothese
onterecht.
Correctieprocedures
o Least-significant differences (LSD)
- Geen correctie; gebruik t-toets
met n-g dfs en vaste α per toets.
- De toetsen zijn ‘beschermd’ door een significante ANOVA.
o Bonferroni procedure
- Als LSD, maar gebruikt niet α maar α/k per toets.
- Gebasseerd op Bonferroni ongelijkheid
o Tukey procedure
- Geen aanpassing van α, maar van de gebruikte verdeling; gebruikt
studentized range verdeling
Follow-up 2; contrasten
Hypotheses die je vooraf opstelt om een onderzoeksvraag te beantwoord.
Contrasten worden daarom ook wel geplande vergelijkingen genoemd.
Worden gedefinieerd in termen van gemiddelden; het zijn verschillen
(contrasten) tussen gemiddelden.
Week 1: Generalized Lineair Models
Algemeen
Eenweg-ANOVA, tweeweg-ANOVA, ANCOVA en moderatieanalyses zijn
allemaal technieken voor de analyse van een regressiemodel. Het
regressiemodel is bij deze modellen dus telkens de basis. Het
enkelvoudige, logistische en ordinale regressiemodel zijn specifieke
analysemethoden van de Generalized Lineair Regression.
Anova-modelvergelijking
R2 verklaarde variantie in y door x óf proportie afname fouten in
geschatte y – voorspelde y.
ANOVA heeft als doel de variantie te splitsen in 2 delen; de verklaarde &
onverklaarde variantie.
De ANOVA F-toetsen die hierbij horen zijn als volgt;
2 2
H 0 ; p =0 en H a ; p >0
H 0 ; β1 =β 2=β 3=0 en H a ; niet alle β zijn gelijk aan 0
MSreg R 2 /k
F= =
MSE ( 1−R2 ) /(n−k−1)
Groepsgemiddelden vergelijken
ANOVA is een techniek om vergelijkingen te maken tussen 2 groepen.
Wanneer je een dummyvariabele hebt, vergelijkt de F-toets de twee
gemiddelden.
Week 2: Groepen vergelijken – Eenweg ANOVA
Dummyvariabelen
Van categorische variabelen kun je een aantal dummyvariabelen maken.
Altijd één minder dan het aantal groepen; g – 1.
De intercept is het gemiddelde van één van de groepen en is vaak de
referentiegroep. De hellingen geven het verschil tussen de overige
groepen en de referentiegroep aan. De dummy’s zijn onafhankelijk van
elkaar, je kunt dus maar in één groep tegelijk zitten = mutually exclusive.
Samen vormen de dummy’s één onafhankelijke categorische variabele.
H 0 ; μ 1=μ2=…=μ g H a ; tenminste twee gemiddelden verschillen
Groot verschil tussen groepen = tussengroepsvariantie groot
, Weinig verschil binnen groepen = binnengroepsvariantie klein
Als uit de toets komt dat de F-toets significant is, is er dus één groep die
signifcant verschilt van de rest. Maar welke is dit? Hiervoor heb je een
follow-up nodig.
- Je gaat de verschillen tussen alle paren van gemiddelden toetsen,
dus tussen alle groepen. = post-hoctoets
Gevaar hierbij is kanskapitalisatie, je maakt teveel type I fouten en
verwerpt dus te vaak de nulhypothese
onterecht.
Correctieprocedures
o Least-significant differences (LSD)
- Geen correctie; gebruik t-toets
met n-g dfs en vaste α per toets.
- De toetsen zijn ‘beschermd’ door een significante ANOVA.
o Bonferroni procedure
- Als LSD, maar gebruikt niet α maar α/k per toets.
- Gebasseerd op Bonferroni ongelijkheid
o Tukey procedure
- Geen aanpassing van α, maar van de gebruikte verdeling; gebruikt
studentized range verdeling
Follow-up 2; contrasten
Hypotheses die je vooraf opstelt om een onderzoeksvraag te beantwoord.
Contrasten worden daarom ook wel geplande vergelijkingen genoemd.
Worden gedefinieerd in termen van gemiddelden; het zijn verschillen
(contrasten) tussen gemiddelden.