HOOFDSTUK 13: TWEE-FACTOR VARIANTIE-ANALYSE
INLEIDING
Doel: vergelijken van de verwachting van populaties die op twee manieren zijn geclassificeerd OF de
verwachte reacties in experimenten met twee factoren
Sleutelbegrippen analoog aan één-factor ANOVA
o Data is normaal verdeeld
o De groepen hebben mogelijk verschillende verwachtingen
o De groepen hebben dezelfde standaardafwijkingen
o We gebruiken pooling om de variantie te schatten
o We gebruiken de F-grootheid voor significantietoetsen
13.1 HET TWEE-FACTOR ANOVA MODEL
13.1.1 VOORDELEN VAN DE TWEE-FACTOR ANOVA
Één-factor populaties geclassificeerd volgens één kwalitatieve variabele of factor
Twee-factor twee factoren, elk met zijn eigen aantal niveaus
VOORDELEN VAN TWEE-FACTOR ANOVA
Het is efficiënter om twee factoren tegelijk te bestuderen, in plaats van afzonderlijk
De residuele variatie in een model kan worden verminderd door een tweede factor op te nemen waarvan
men vermoedt dat die de te verklaren variabele beïnvloedt
De interactie tussen factoren kan bestudeerd worden
13.1.2 HET MODEL VORO DE TWEE-FACTOR ANOVA
I = aantal niveaus van de eerste factor
J = aantal niveaus van de tweede factor
I x J ANOVA = algemene twee-factor-probleem
nij = steekproefomvang voor het niveau i van factor A en het niveau j van factor B
N = ∑𝑛𝑖𝑗 = totale aantal waarnemingen
FIT = de verwachtingen µij
RESIDU = de afwijkingen ϵijk tussen de individuele waarnemingen en hun
groepsverwachtingen
1
𝑥̅𝑖𝑗̇ = 𝑛 ∑𝑘 𝑥𝑖𝑗𝑘 = steekproefgemiddelden van de waarnemingen van elke SP = om µij te schatten
𝑖𝑗
2
∑(𝑛𝑖𝑗 −1)𝑠𝑖𝑗
𝑠𝑝2 = = de som van alle steekproefvarianties = schatter van σ² (deel van residu)
∑(𝑛𝑖𝑗−1 )
𝑆𝑆𝐸 𝑆𝑆𝐸
= 𝐷𝐹𝐸 = 𝑁−𝐼 𝑥 𝐽
AANNAMES VOOR TWEE-FACTOR ANOVA
We hebben onafhankelijke EAS-en van omvang nij, één uit elk van I x J normaal verdeelde populaties. De
populatieverwachtingen µij mogen verschillen, maar alle populaties hebben dezelfde standaardafwijking σ. De
µij’s en σ zijn onbekende parameters.
Stel dat xijk de k-de waarneming uit de populatie is met factor A op niveau i en factor B op niveau j.
Het statistische model is:
Xijk = µij + ϵijk
voor i = 1, …, I, j = 1, … ,J en k = 1, …, nij. Hierbij vormen de afwijkingen ϵijk een EAS uit een N(0, σ)-verdeling.
1
INLEIDING
Doel: vergelijken van de verwachting van populaties die op twee manieren zijn geclassificeerd OF de
verwachte reacties in experimenten met twee factoren
Sleutelbegrippen analoog aan één-factor ANOVA
o Data is normaal verdeeld
o De groepen hebben mogelijk verschillende verwachtingen
o De groepen hebben dezelfde standaardafwijkingen
o We gebruiken pooling om de variantie te schatten
o We gebruiken de F-grootheid voor significantietoetsen
13.1 HET TWEE-FACTOR ANOVA MODEL
13.1.1 VOORDELEN VAN DE TWEE-FACTOR ANOVA
Één-factor populaties geclassificeerd volgens één kwalitatieve variabele of factor
Twee-factor twee factoren, elk met zijn eigen aantal niveaus
VOORDELEN VAN TWEE-FACTOR ANOVA
Het is efficiënter om twee factoren tegelijk te bestuderen, in plaats van afzonderlijk
De residuele variatie in een model kan worden verminderd door een tweede factor op te nemen waarvan
men vermoedt dat die de te verklaren variabele beïnvloedt
De interactie tussen factoren kan bestudeerd worden
13.1.2 HET MODEL VORO DE TWEE-FACTOR ANOVA
I = aantal niveaus van de eerste factor
J = aantal niveaus van de tweede factor
I x J ANOVA = algemene twee-factor-probleem
nij = steekproefomvang voor het niveau i van factor A en het niveau j van factor B
N = ∑𝑛𝑖𝑗 = totale aantal waarnemingen
FIT = de verwachtingen µij
RESIDU = de afwijkingen ϵijk tussen de individuele waarnemingen en hun
groepsverwachtingen
1
𝑥̅𝑖𝑗̇ = 𝑛 ∑𝑘 𝑥𝑖𝑗𝑘 = steekproefgemiddelden van de waarnemingen van elke SP = om µij te schatten
𝑖𝑗
2
∑(𝑛𝑖𝑗 −1)𝑠𝑖𝑗
𝑠𝑝2 = = de som van alle steekproefvarianties = schatter van σ² (deel van residu)
∑(𝑛𝑖𝑗−1 )
𝑆𝑆𝐸 𝑆𝑆𝐸
= 𝐷𝐹𝐸 = 𝑁−𝐼 𝑥 𝐽
AANNAMES VOOR TWEE-FACTOR ANOVA
We hebben onafhankelijke EAS-en van omvang nij, één uit elk van I x J normaal verdeelde populaties. De
populatieverwachtingen µij mogen verschillen, maar alle populaties hebben dezelfde standaardafwijking σ. De
µij’s en σ zijn onbekende parameters.
Stel dat xijk de k-de waarneming uit de populatie is met factor A op niveau i en factor B op niveau j.
Het statistische model is:
Xijk = µij + ϵijk
voor i = 1, …, I, j = 1, … ,J en k = 1, …, nij. Hierbij vormen de afwijkingen ϵijk een EAS uit een N(0, σ)-verdeling.
1