0. Inleiding ........................................................................................................................................... 1
1. Statistische begrippen (herhaling) ...................................................................................................... 2
1.1. Normale verdeling ........................................................................................................................ 2
1.2. Parameters en steekproefresultaten ........................................................................................... 2
1.3. Eigenschappen van schatters ....................................................................................................... 3
1.4. Eigenschappen van schatters ....................................................................................................... 3
1.5. Hypothesetoesten ........................................................................................................................ 3
1.5.1. BI of p-waarde ....................................................................................................................... 4
1.5.2. Toetsen van 𝝁 (met 𝝈 gekend) - De z-toets .......................................................................... 4
1.5.3. Toetsen van 𝝁 (met 𝝈 NIET gekend) - De t-verdeling............................................................ 5
1.6. Niet-parametrische toetsen ......................................................................................................... 5
2. Toetsen voor gemiddelden en proporties ........................................................................................... 6
2.1. Toets voor één gemiddelde: de t-test .......................................................................................... 6
2.2. Toets voor gepaarde steekproeven.............................................................................................. 6
2.3. De t-test voor onafhankelijke steekproeven ................................................................................ 7
2.4. Toets voor één proportie: binomiaaltest ..................................................................................... 7
2.5. Toets voor 2 proporties: de chi²-test............................................................................................ 8
2.5.1. Oefening ................................................................................................................................ 9
3. Niet-parametrische toetsen van Wilcoxon ....................................................................................... 10
3.1. De tekentoets ............................................................................................................................. 10
3.2. De rangtekentoets ...................................................................................................................... 11
3.3. Gepaarde steekproeven ............................................................................................................. 12
3.3.1. Tekentoets ........................................................................................................................... 12
3.3.2. Rangtekentoets ................................................................................................................... 12
3.3.3. Oefening .............................................................................................................................. 13
3.4. Mann-Whitney-Wilcoxon-test (MWW) ...................................................................................... 14
3.4.1. Oefening .............................................................................................................................. 16
4. “Goodness of fit” – toetsen ............................................................................................................... 17
4.1. Chikwadraat goodness-of-fit toets ............................................................................................. 17
4.2. Kolmogorov-Smirnov: inleiding .................................................................................................. 18
4.3. De Shapiro-Wilk toets................................................................................................................. 20
4.3.1. Oefening 1 ........................................................................................................................... 20
4.3.2. Oefening 2 ........................................................................................................................... 21
5. Toetsen voor meerdere onafhankelijke steekproeven - ANOVA ...................................................... 22
1
, Samenvatting – STATM – Deel 1: Significantietoetsen
5.1. Post-hoc toetsen van Bonferroni ............................................................................................... 24
5.2. Verband met de 2-sample t-test ................................................................................................ 24
6. Toetsen van samenhang.................................................................................................................... 25
6.1. De chi²-toets voor onafhankelijkheid ......................................................................................... 25
6.2. De Pearson-correlatie-toets ....................................................................................................... 27
6.3. Herhaling: Hoe verbanden toetsen? .......................................................................................... 28
6.4. Oefening ..................................................................................................................................... 29
Samenvatting SPSS ................................................................................................................................ 30
2
, Samenvatting – STATM – Deel 1: Significantietoetsen
0. Inleiding
• Het OPO ‘Onderzoeksmethoden 3’ (6 SP) omvat twee OLA’s:
o Statistische Modellen (4 SP): eerste semester
• Theorie (14 punten)
• SPSS (6 punten)
o Kwantitatief Onderzoeksproject (2 SP): tweede semester
• Inhoud van het OLA ‘Statistische Modellen’
o Deel I: Significantietoetsen
o Deel II: Econometrie (OLS-regressie + tijdreeksen)
Dit icoontje betekent dat je de oefeningen ook met pen en papier moet kunnen maken op het
schriftelijk examen (niet enkel in SPSS)
1
, Samenvatting – STATM – Deel 1: Significantietoetsen
1. Statistische begrippen (herhaling)
1.1. Normale verdeling
• 𝑋~𝑁(𝜇, 𝜎)
• “de variabele 𝑋 is normaal verdeeld met gemiddelde μ en standaardafwijking σ.
• σ is de afstand van μ tot het buigpunt: hoe groter de standaardafwijking, hoe groter de spreiding
van waarden rond het gemiddelde
1.2. Parameters en steekproefresultaten
• Populatie-parameters
o Getallen
o Griekse letters
• Steekproefgrootheid
o Toevalsvariabelen
o Romeinse letters
• Schatters → grote letters
• Waarden → kleine letters
2
, Samenvatting – STATM – Deel 1: Significantietoetsen
1.3. Eigenschappen van schatters
• Vertekening = ver van midden
o Vertekening vermeiden = EAS
• Variabiliteit = spreiding
o Variabiliteit verminderen = grotere steekproef
(a) VB: alleen studenten bevraagd
(b) VB: te kleine steekproef
(c) VB: te kleine steekproef + meetfouten
(d) Goed
1.4. Eigenschappen van schatters
Als een populatie parameters 𝜇 en 𝜎 heeft, dan geldt:
1) 𝐸(𝑋̅) = 𝜇.
→ Het gem van steekproefgemiddelde 𝑋̅ = populatiegemiddelde
→ 𝑋̅ = zuivere/onvertekende schatter voor 𝜇
𝜎
2) 𝜎𝑋̅ = .
√𝑛
→ Hoe groter de steekproef, hoe beter deze de populatie benadert.
CLS
3) N ≥ 30 → 𝑋 ~ 𝑁
1.5. Hypothesetoesten
• De nulhypothese: die hypothese die we willen verwerpen
o VB: μ = 50
• De alternatieve hypothese: die hypothese die we willen aantonen
o VB: μ < 50 (eenzijdig links)
o VB: μ ≠ 50 (tweezijdig)
• Het significantieniveau α = de kans om onterecht een correcte nulhypothese te verwerpen (type I
fout).
• β is de kans dat een valse nulhypothese niet verworpen wordt
(type II fout). De “power” of het onderscheidingsvermogen van een test (1 – β ) is de kans om te
ontdekken dat de alternatieve hypothese juist is, als ze effectief juist is.
• Maar: hoe kleiner α, hoe groter β.
• Samengevat:
• H0 juist, H0 verwerpen → α% van de steekproeven → type I fout
• H0 fout, H0 niet verwerpen → β% van de steekproeven → type II fout
3
, Samenvatting – STATM – Deel 1: Significantietoetsen
1.5.1. BI of p-waarde
Tweezijdig Eenzijdig
H0: μ = 50 H0: μ = 50
Ha: μ ≠ 50 Ha: μ ≤ 50
𝜎 𝜎
[𝜇 − 2 ,𝜇 + 2 ]
√𝑛 √𝑛
𝜎 𝜎 𝜎 𝜎
𝑃 (𝑋̅ ≤ 𝜇 − 2 ) + 𝑃 (𝑋̅ ≥ 𝜇 + 2 ) = 2𝑃 (𝑋̅ ≤ 𝜇 + 2 ) 𝑃 (𝑋̅ ≤ 𝜇 − 2 )
√𝑛 √𝑛 √𝑛 √𝑛
Als p-waarde < α → H0 verwerpen
Als p-waarde > α → H0 niet verwerpen
Hoe groter de steekproef, hoe groter het onderscheidingsvermogen
1.5.2. Toetsen van 𝝁 (met 𝝈 gekend) - De z-toets
𝐻0 : 𝜇 = 𝜇0
𝐻𝑎 : 𝜇 ≠ 𝜇0
𝑥̅ − 𝜇
𝑧=
𝜎/√𝑛
VOORBEELD
X ~ N(μ,3) n = 10 𝑥̅ = 67 α = 5%
H0: μ = 65 Ha: μ ≠ 65
𝑥̅ − 𝜇 67 − 65
𝑧= = = 2,108
𝜎/√𝑛 3/√10
→ het steekproefgemiddelde is meer dan 2 standaardafwijkingen
verwijderd van het veronderstelde populatiegemiddelde
p-waarde = 2 𝑛𝑜𝑟𝑚𝑎𝑙𝑐𝑑𝑓(2,108; 1099 ) = 0,035 < 5%
We verwerpen H0 met 95% betrouwbaarheid
4
, Samenvatting – STATM – Deel 1: Significantietoetsen
1.5.3. Toetsen van 𝝁 (met 𝝈 NIET gekend) - De t-verdeling
→ meer kans in de staarten
𝐻0 : 𝜇 = 𝜇0
𝐻𝑎 : 𝜇 ≠ 𝜇0
𝑥̅ − 𝜇
𝑡= ~ 𝑡𝑛−1
𝑆/√𝑛
VOORBEELD
X ~ N(μ,σ) S=3 n = 10 𝑥̅ = 67 α = 5%
𝐻0 : 𝜇 = 65
𝐻𝑎 : 𝜇 ≠ 65
𝑥̅ − 𝜇 67 − 65
𝑡= = = 2,108 ~ 𝑡9
𝑆/√𝑛 3/√10
p-waarde = 2 𝑡𝑐𝑑𝑓(2,108; 1099 ; 9) = 0,064 > 5%
We verwerpen H0 niet
1.6. Niet-parametrische toetsen
• Maken weinig/geen veronderstelling met betrekking tot de verdeling
• Zijn minder nauwkeurig
5