Analyse 2
HC 1 (28-01-2025) T-toets voor 1 gemiddelde
Onderzoek naar de lees- en spellingbeleving van kinderen in groep 5 t/m 8 in het basisonderwijs
Date set met 151 kinderen die zowel de lees- als de spellingbelevingsschaal hebben ingevuld +
gegevens over: leeftijd, meertaligheid, diagnose(s).
Scores op de schaal plezier in spelling kunnen lopen van 4 tot 16. Het gemiddelde in de
normeringsgroep is 10.6.
• Wijkt de gemiddelde score op plezier in spelling in de steekproef af van de gemiddelde
normscore?
• Van de 151 kinderen blijkt het gemiddelde op plezier in spelling 9.81 te zijn, de
standaarddeviatie in deze steekproef is 2.839.
Ordinale variabele veranderen naar interval variabele (quasi interval) door waarden te koppelen
aan de woorden.
Toets voor 1 gemiddelde
• Statistische hypothesen tweezijdige toets:
H0: µ = µ0; H1: µ ≠ µ 0
H0: µ = 10.6; H1: µ ≠ 10.6
µ: gemiddelde score van kinderen in groep 5 t/m 8 in het reguliere basisonderwijs op de schaal
plezier in spelling van de LSBS
𝑋̅= 9.81 → Mag je de nulhypothese verwerpen?
Z-toets voor 1 gemiddelde
Assumpties z-toets voor 1 gemiddelde:
• Scores zijn onderling onafhankelijk
• De scores zijn afkomstig uit een normaal verdeelde populatie, indien de scores niet
normaal verdeeld zijn dan moet de steekproefgrootte n > 30 zijn
• De populatiestandaarddeviatie is bekend
Probleem: De populatiestandaarddeviatie niet bekend
Oplossing: (populatiestandaarddeviatie) schatten met s (steekproefstandaarddeviatie)
, ∑(𝑋−𝑋̄)2 𝑘𝑤𝑎𝑑𝑟𝑎𝑡𝑒𝑛𝑠𝑜𝑚 𝑣𝑎𝑛 𝑎𝑓𝑤𝑖𝑗𝑘𝑖𝑛𝑔𝑒𝑛
- 𝑠𝑥 2 = 𝑛−1
= 𝑎𝑎𝑛𝑡𝑎𝑙 𝑠𝑐𝑜𝑟𝑒𝑠 − 1
- sx = √sx2
- Ongeveer de gemiddelde afstand tot het gemiddelde
- Aantal vrijheidsgraden (degrees of freedom) gebruikt om de variantie te schatten: df = n – 1.
- De standaardfout (SE𝑋̅), de geschatte standaarddeviatie van
𝒔𝒙
steekproefgemiddelden: 𝑺𝑬𝑿 =
√𝒏
Elke steekproef geeft andere SD dus ook ander SE.
Dubbele onzekerheid: over het gemiddelde én over de standaarddeviatie in de populatie.
De steekproevenverdeling van 𝑋̅ van alle mogelijke steekproeven met gelijke grootte N volgt nu
NIET meer
een normale verdeling!
T-verdeling
• Steekproevenverdeling van 𝑋̅ volgt een t-verdeling
met df = N – 1 (Student’s t-distribution)
• df = degrees of freedom = aantal vrijheidsgraden voor schatten van σ.
T-verdeling vs standaardnormale verdeling
• Voor elke df is er een andere t-verdeling
• t-verdeling is symmetrisch rond t = 0
• Platter en dikkere staarten dan de standaardnormale verdeling
• t-verdeling lijkt meer op de standaardnormale verdeling naarmate df (dus n) groter is.
• Het punt waar bijv. de hoogste 2.5% begint, ligt wat verder naar rechts dan in een
normale verdeling.
Kritieke t-waarden
• Met de kritieke t-waarden bepaal je vanaf welk steekproefgemiddelde de nulhypothese
wordt verworpen en construeer je een betrouwbaarheidsinterval.
• Tweezijdige toetsing met a = .05:
df = 15 → kritieke t = ± 2.131
df = 25 → kritieke t = ± 2.060
, df = 100 → kritieke t = ± 1.984
df = 250 → kritieke t = ± 1.969
df > 250 → kritieke t = ± 1.960 (gelijk aan zk).
• Kritieke t-waarden vind je in Field in tabel Appendix A.2 blz. 1037-1038 (6e editie) / blz.
999-1000 (5e editie)
• Field gaat bij df >100 uit van benadering met z-verdeling
• Staat het juiste aantal vrijheidsgraden niet in de tabel? Kies dan behoudend → voor een
kleiner aantal vrijheidsgraden
• a=0.05 N=10 dus df=9 in de appendix t=2.262
• Eenzijdig 0.05 komt overeen met tweezijdig 0.10
Toetsingssituatie
Vraagstelling:
Wijkt het steekproefgemiddelde voor plezier in spelling gemeten met de LSBS af van de
gemiddelde normscore van 10.6?
Vraag gaat over één gemiddelde.
Steekproef: Aselecte steekproef van n = 151 kinderen; descriptieve statistieken: 𝑋̅ = 9.81, sx =
2.839
T-toets voor een gemiddelde → Controleer eerst de assumpties
Assumpties t-toets voor één gemiddelde
1. Scores zijn onderling afhankelijk (steekproef aselect)
2. De scores zijn afkomstig uit een normaal verdeelde populatie
Indien de scores niet normaal verdeeld zijn, is dat geen probleem als de steekproefgrootte n
> 30.
Assumpties controleren
1. Onafhankelijkheid kun je niet aan de data zien, wel aan het onderzoeksdesign (bijv.
aselecte steekproef, randomisering). Er mag geen onderlinge afhankelijkheid zijn van
cases.
2. Kijk voor een indruk van normaliteit naar een histogram of boxplot van de verdeling van
de variabele in de steekproef; let vooral op outliers.
Robuustheid (foutbestendig)
1. Kleine schendingen van onafhankelijkheid kunnen al grote fouten geven.
2. Normaliteit is minder belangrijk naarmate n groter is (n > 30), als de verdeling unimodaal
is, meer symmetrisch, en geen outliers heeft.
, Stappen t-toets 1 gemiddelde
1. Stel statistische hypothesen op
2. Leid de steekproevenverdeling van 𝑋̅ af en kies a
3. Bereken toetsingsgrootheid t
4. Neem een besluit over de nulhypothese
a. Met kritieke t-waarde(n)
b. Met overschrijdingskans p
5. Formuleer je conclusie
- Met betrouwbaarheidsinterval
- Met effectgrootte
1. Statistische hypothese
H0: µ = 10.6
H1: µ ≠ 10.6 (ongerichte hypothese, tweezijdige toets)
µ: gemiddelde score van kinderen in groep 5 t/m 8 in het reguliere basisonderwijs op de schaal
plezier in spelling van de LSBS
Let op dat bij de formulering van de statistische hypothesen altijd moet worden aangegeven
waarvoor µ staat!
2. Steekproevenverdeling
• Als H0 juist is, is het gemiddelde van de gemiddelden van alle mogelijke steekproeven
met gelijke n: µ0 = 10.6.
HC 1 (28-01-2025) T-toets voor 1 gemiddelde
Onderzoek naar de lees- en spellingbeleving van kinderen in groep 5 t/m 8 in het basisonderwijs
Date set met 151 kinderen die zowel de lees- als de spellingbelevingsschaal hebben ingevuld +
gegevens over: leeftijd, meertaligheid, diagnose(s).
Scores op de schaal plezier in spelling kunnen lopen van 4 tot 16. Het gemiddelde in de
normeringsgroep is 10.6.
• Wijkt de gemiddelde score op plezier in spelling in de steekproef af van de gemiddelde
normscore?
• Van de 151 kinderen blijkt het gemiddelde op plezier in spelling 9.81 te zijn, de
standaarddeviatie in deze steekproef is 2.839.
Ordinale variabele veranderen naar interval variabele (quasi interval) door waarden te koppelen
aan de woorden.
Toets voor 1 gemiddelde
• Statistische hypothesen tweezijdige toets:
H0: µ = µ0; H1: µ ≠ µ 0
H0: µ = 10.6; H1: µ ≠ 10.6
µ: gemiddelde score van kinderen in groep 5 t/m 8 in het reguliere basisonderwijs op de schaal
plezier in spelling van de LSBS
𝑋̅= 9.81 → Mag je de nulhypothese verwerpen?
Z-toets voor 1 gemiddelde
Assumpties z-toets voor 1 gemiddelde:
• Scores zijn onderling onafhankelijk
• De scores zijn afkomstig uit een normaal verdeelde populatie, indien de scores niet
normaal verdeeld zijn dan moet de steekproefgrootte n > 30 zijn
• De populatiestandaarddeviatie is bekend
Probleem: De populatiestandaarddeviatie niet bekend
Oplossing: (populatiestandaarddeviatie) schatten met s (steekproefstandaarddeviatie)
, ∑(𝑋−𝑋̄)2 𝑘𝑤𝑎𝑑𝑟𝑎𝑡𝑒𝑛𝑠𝑜𝑚 𝑣𝑎𝑛 𝑎𝑓𝑤𝑖𝑗𝑘𝑖𝑛𝑔𝑒𝑛
- 𝑠𝑥 2 = 𝑛−1
= 𝑎𝑎𝑛𝑡𝑎𝑙 𝑠𝑐𝑜𝑟𝑒𝑠 − 1
- sx = √sx2
- Ongeveer de gemiddelde afstand tot het gemiddelde
- Aantal vrijheidsgraden (degrees of freedom) gebruikt om de variantie te schatten: df = n – 1.
- De standaardfout (SE𝑋̅), de geschatte standaarddeviatie van
𝒔𝒙
steekproefgemiddelden: 𝑺𝑬𝑿 =
√𝒏
Elke steekproef geeft andere SD dus ook ander SE.
Dubbele onzekerheid: over het gemiddelde én over de standaarddeviatie in de populatie.
De steekproevenverdeling van 𝑋̅ van alle mogelijke steekproeven met gelijke grootte N volgt nu
NIET meer
een normale verdeling!
T-verdeling
• Steekproevenverdeling van 𝑋̅ volgt een t-verdeling
met df = N – 1 (Student’s t-distribution)
• df = degrees of freedom = aantal vrijheidsgraden voor schatten van σ.
T-verdeling vs standaardnormale verdeling
• Voor elke df is er een andere t-verdeling
• t-verdeling is symmetrisch rond t = 0
• Platter en dikkere staarten dan de standaardnormale verdeling
• t-verdeling lijkt meer op de standaardnormale verdeling naarmate df (dus n) groter is.
• Het punt waar bijv. de hoogste 2.5% begint, ligt wat verder naar rechts dan in een
normale verdeling.
Kritieke t-waarden
• Met de kritieke t-waarden bepaal je vanaf welk steekproefgemiddelde de nulhypothese
wordt verworpen en construeer je een betrouwbaarheidsinterval.
• Tweezijdige toetsing met a = .05:
df = 15 → kritieke t = ± 2.131
df = 25 → kritieke t = ± 2.060
, df = 100 → kritieke t = ± 1.984
df = 250 → kritieke t = ± 1.969
df > 250 → kritieke t = ± 1.960 (gelijk aan zk).
• Kritieke t-waarden vind je in Field in tabel Appendix A.2 blz. 1037-1038 (6e editie) / blz.
999-1000 (5e editie)
• Field gaat bij df >100 uit van benadering met z-verdeling
• Staat het juiste aantal vrijheidsgraden niet in de tabel? Kies dan behoudend → voor een
kleiner aantal vrijheidsgraden
• a=0.05 N=10 dus df=9 in de appendix t=2.262
• Eenzijdig 0.05 komt overeen met tweezijdig 0.10
Toetsingssituatie
Vraagstelling:
Wijkt het steekproefgemiddelde voor plezier in spelling gemeten met de LSBS af van de
gemiddelde normscore van 10.6?
Vraag gaat over één gemiddelde.
Steekproef: Aselecte steekproef van n = 151 kinderen; descriptieve statistieken: 𝑋̅ = 9.81, sx =
2.839
T-toets voor een gemiddelde → Controleer eerst de assumpties
Assumpties t-toets voor één gemiddelde
1. Scores zijn onderling afhankelijk (steekproef aselect)
2. De scores zijn afkomstig uit een normaal verdeelde populatie
Indien de scores niet normaal verdeeld zijn, is dat geen probleem als de steekproefgrootte n
> 30.
Assumpties controleren
1. Onafhankelijkheid kun je niet aan de data zien, wel aan het onderzoeksdesign (bijv.
aselecte steekproef, randomisering). Er mag geen onderlinge afhankelijkheid zijn van
cases.
2. Kijk voor een indruk van normaliteit naar een histogram of boxplot van de verdeling van
de variabele in de steekproef; let vooral op outliers.
Robuustheid (foutbestendig)
1. Kleine schendingen van onafhankelijkheid kunnen al grote fouten geven.
2. Normaliteit is minder belangrijk naarmate n groter is (n > 30), als de verdeling unimodaal
is, meer symmetrisch, en geen outliers heeft.
, Stappen t-toets 1 gemiddelde
1. Stel statistische hypothesen op
2. Leid de steekproevenverdeling van 𝑋̅ af en kies a
3. Bereken toetsingsgrootheid t
4. Neem een besluit over de nulhypothese
a. Met kritieke t-waarde(n)
b. Met overschrijdingskans p
5. Formuleer je conclusie
- Met betrouwbaarheidsinterval
- Met effectgrootte
1. Statistische hypothese
H0: µ = 10.6
H1: µ ≠ 10.6 (ongerichte hypothese, tweezijdige toets)
µ: gemiddelde score van kinderen in groep 5 t/m 8 in het reguliere basisonderwijs op de schaal
plezier in spelling van de LSBS
Let op dat bij de formulering van de statistische hypothesen altijd moet worden aangegeven
waarvoor µ staat!
2. Steekproevenverdeling
• Als H0 juist is, is het gemiddelde van de gemiddelden van alle mogelijke steekproeven
met gelijke n: µ0 = 10.6.