7,2 vergelijking van twee gemiddelden
T-toets voor onafhankelijke steekproeven
Twee steekproevenproblemen:
- Reactie van twee groepen vergelijken
o Experiment groep en controle groep
o Onafhankelijke steekproeven uit één populatie
o Onafhankelijke steekproeven uit twee populaties
- Beide groepen zijn aselecte steekproeven uit bepaalde populaties
- Gemiddelde hoeven niet gelijk te zijn aan elkaar
- Scoren zijn onafhankelijk van elkaar
t-toets gebruiken als σ2 is.
Steekproevengrootheid z
De schatter voor het verschil tussen het populatiegemiddelde is gelijk aan het verschil tussen het
steekproefgemiddelde -> steekproeven zijn onafhankelijk;
Bij de nulhypothese gaan we er vanuit dat µ1 −µ2 = 0 populatiegemiddelde gelijk zijn.
Daarom gebruik maken van:
(met df = n1 + n2 - 2)
Stap 1:
Opstellen van nulhypothese:
,Stap 2
Standaardfout:
1. Varianties zijn niet gelijk aan elkaar = equal variances not assumed
σ1≠σ2
Als assumptie van gelijke varianties is geschonden (σ1 ≠ σ2) Dus als s21 en s22 significant van
elkaar verschillen
Aantal vrijheidsgraden: df = min (n1-1 , n2-1) -> conservatief
Uit een twee-steekproevengrootheid t volgt niet automatisch in een steekproefgrootheid met een t-
verdeling daarom benadering met T(df). df = aantal vrijheidsgraden:
1. Gebruik de gegeven aantal df -> vanuit de gegevens berekend
2. Gebruik een df die gelijk is aan de kleinste waarde van (n 1-1 en n2-1)
Omdat we conservatief kijken -> gebruiken we de N met de kleinste (minimale)
vrijheidsgraden.
Daarna in de formule zetten en kijken welke kritieke waarde eruit
komt t*, en of het significant is.
Stap 4: kritieke waarde bepalen -> wel of niet significant.
, 2. Varianties zijn gelijk aan elkaar = equal variances assumed σ1 = σ2
Alleen bij twee dezelfde standaardafwijkingen heeft een t-grootheid een t-verdeling !!
Pooled variance: methode om gemeenschappelijke populatievariantie te schatten -> wss
verschillende gemiddelde, maar met dezelfde variantie.
Als s21 en s22 niet significant van elkaar verschillen gecombineerde schatter (pooled
estimator) voor de variantie
Pooled variance estimator:
Het aantal vrijheidsgraden is df = n1 – 1 + n2 – 1 = n1 + n2 – 2
Beide steekproefvarianties zijn de schatter voor σ2 daarom gewogen gemiddelde nemen met het
aantal vrijheidsgraden als gewichten.
= samengestelde schatter van σ2 = pooled estimator of variance
Sp is een schatter voor de onbekende σ -> !
Assumpties bij independent samples t-toets
- De twee steekproeven zijn onafhankelijk van elkaar getrokken (of de steekproef is willekeurig
verdeeld over de twee groepen) de scores van de ene steekproef mogen de andere
scores niet beïnvloeden.
- De varianties van de twee populaties waaruit de steekproeven komen, zijn gelijk:
homogeniteit van variantie (homogeneity of variance) equal variances assumed =
homogene (pooled) varianties
, Betrouwbaarheidsinterval
- Een steekproef:
- Twee-steekproeven:
o Ongelijke varianties: equal variances not assumed
Vrijheidgraden = df = min (n1-1 , n2-1)
o Gelijke variantie: equal variances assumed
Vrijheidgraden = df = n1 – 1 + n2 – 1 = n1 + n 2 – 2
Robuustheid van de twee-steekproefprocedures
Twee-steekproef t-procedure robuuster dan de t-methode voor enkelvoudige steekproeven:
- Kansen zijn nauwkeuriger -> als populatieverdelingen dezelfde vorm hebben
- Meest robuust tegen niet-normaalheid bij conservatieve kanswaarden
- Als de steekproeven in omvang verschillen -> t-procedure gevoeliger voor ongelijke
standaardafwijkingen
Bij twee-steekproef onderzoek -> gelijke steekproefomvang, som van de steekproefgrootten (n 1 + n2)
Als de verdeling niet normaal verdeeld is -> vertrouwen op dat het steekproefgemiddelde bij
benadering normaal verdeeld is zeer robuust.
Bij grote steekproeven -> t-procedure met vertrouwen toepassen, ook al kan je niet controleren of
de gegevens normaal verdeeld zijn.
Inferentie voor kleine steekproeven
- Onderscheidingsvermogen van significantie toetsen is laag
- Foutmarge betrouwbaarheidsinterval groot
T-toets voor onafhankelijke steekproeven
Twee steekproevenproblemen:
- Reactie van twee groepen vergelijken
o Experiment groep en controle groep
o Onafhankelijke steekproeven uit één populatie
o Onafhankelijke steekproeven uit twee populaties
- Beide groepen zijn aselecte steekproeven uit bepaalde populaties
- Gemiddelde hoeven niet gelijk te zijn aan elkaar
- Scoren zijn onafhankelijk van elkaar
t-toets gebruiken als σ2 is.
Steekproevengrootheid z
De schatter voor het verschil tussen het populatiegemiddelde is gelijk aan het verschil tussen het
steekproefgemiddelde -> steekproeven zijn onafhankelijk;
Bij de nulhypothese gaan we er vanuit dat µ1 −µ2 = 0 populatiegemiddelde gelijk zijn.
Daarom gebruik maken van:
(met df = n1 + n2 - 2)
Stap 1:
Opstellen van nulhypothese:
,Stap 2
Standaardfout:
1. Varianties zijn niet gelijk aan elkaar = equal variances not assumed
σ1≠σ2
Als assumptie van gelijke varianties is geschonden (σ1 ≠ σ2) Dus als s21 en s22 significant van
elkaar verschillen
Aantal vrijheidsgraden: df = min (n1-1 , n2-1) -> conservatief
Uit een twee-steekproevengrootheid t volgt niet automatisch in een steekproefgrootheid met een t-
verdeling daarom benadering met T(df). df = aantal vrijheidsgraden:
1. Gebruik de gegeven aantal df -> vanuit de gegevens berekend
2. Gebruik een df die gelijk is aan de kleinste waarde van (n 1-1 en n2-1)
Omdat we conservatief kijken -> gebruiken we de N met de kleinste (minimale)
vrijheidsgraden.
Daarna in de formule zetten en kijken welke kritieke waarde eruit
komt t*, en of het significant is.
Stap 4: kritieke waarde bepalen -> wel of niet significant.
, 2. Varianties zijn gelijk aan elkaar = equal variances assumed σ1 = σ2
Alleen bij twee dezelfde standaardafwijkingen heeft een t-grootheid een t-verdeling !!
Pooled variance: methode om gemeenschappelijke populatievariantie te schatten -> wss
verschillende gemiddelde, maar met dezelfde variantie.
Als s21 en s22 niet significant van elkaar verschillen gecombineerde schatter (pooled
estimator) voor de variantie
Pooled variance estimator:
Het aantal vrijheidsgraden is df = n1 – 1 + n2 – 1 = n1 + n2 – 2
Beide steekproefvarianties zijn de schatter voor σ2 daarom gewogen gemiddelde nemen met het
aantal vrijheidsgraden als gewichten.
= samengestelde schatter van σ2 = pooled estimator of variance
Sp is een schatter voor de onbekende σ -> !
Assumpties bij independent samples t-toets
- De twee steekproeven zijn onafhankelijk van elkaar getrokken (of de steekproef is willekeurig
verdeeld over de twee groepen) de scores van de ene steekproef mogen de andere
scores niet beïnvloeden.
- De varianties van de twee populaties waaruit de steekproeven komen, zijn gelijk:
homogeniteit van variantie (homogeneity of variance) equal variances assumed =
homogene (pooled) varianties
, Betrouwbaarheidsinterval
- Een steekproef:
- Twee-steekproeven:
o Ongelijke varianties: equal variances not assumed
Vrijheidgraden = df = min (n1-1 , n2-1)
o Gelijke variantie: equal variances assumed
Vrijheidgraden = df = n1 – 1 + n2 – 1 = n1 + n 2 – 2
Robuustheid van de twee-steekproefprocedures
Twee-steekproef t-procedure robuuster dan de t-methode voor enkelvoudige steekproeven:
- Kansen zijn nauwkeuriger -> als populatieverdelingen dezelfde vorm hebben
- Meest robuust tegen niet-normaalheid bij conservatieve kanswaarden
- Als de steekproeven in omvang verschillen -> t-procedure gevoeliger voor ongelijke
standaardafwijkingen
Bij twee-steekproef onderzoek -> gelijke steekproefomvang, som van de steekproefgrootten (n 1 + n2)
Als de verdeling niet normaal verdeeld is -> vertrouwen op dat het steekproefgemiddelde bij
benadering normaal verdeeld is zeer robuust.
Bij grote steekproeven -> t-procedure met vertrouwen toepassen, ook al kan je niet controleren of
de gegevens normaal verdeeld zijn.
Inferentie voor kleine steekproeven
- Onderscheidingsvermogen van significantie toetsen is laag
- Foutmarge betrouwbaarheidsinterval groot