Statistiek 3: Alle uitgewerkte oefeningen software SPSS en volledige
notities van de WPO’s
WPO 1
T-toetsen en Wilcoxon
One sample t-toetsen
Oefening 1
Ga na of de gemiddelde leeftijd van werknemers in de farmaceutische sector verschilt van 36
jaar ( = 5%).
1. Wat meet je?
Je meet een verschilscore van de aandacht van hun werknemers
2. Meetniveau?
Gemiddelde leeftijd → ratio
3. Hoeveel steekproeven zijn er?
1 steekproef (leeftijd van de 300 werknemers in de farmaceutische sector)
4. Gaat het over een verband of een associatie?
Nee
5. Gaat het over een voorspelling?
Nee
6. Een- of tweezijdig?
Tweezijdig, want "verschilt van”
A. Maak een grafische voorstelling van de gegevens en bereken je gemiddelde en je
mediaan.
- Als we een continue variabele hebben, gebruiken we:
→ Ofwel een histogram (-> geeft een genuanceerder beeld over de verdeling)
→ Ofwel een boxplot (-> geeft idee over spreiding van je data)
We gebruiken een histogram, want leeftijd is ratio en dus een continue variabele.
Stappen SPSS:
(1) “Analyze”
(2) “Descriptive statistics”
(3) “Frequencies…”
(4) Vul de variabele in die je wilt onderzoeken (hier: “leeftijd”)
(5) “Statistics” → vink gemiddelde (= “Mean") en de mediaan (= “Median”) aan ;
“Continue”
(6) “Charts” → “Histograms” → “Continue”
1
, Gemaakt door Joke Vrijders
(7) Druk NIET op “OK” maar op “PASTE” (zodat het in de syntax komt)!
(8) Syntax runnen!
OF (andere manier):
(1) “Graphs”
(2) “Boxplot…”
(3) “Simple” (want je wilt maar 1 stuk) → “Summaries of seperate variables” → Define
(5) “Boxes Represent:”
Vul de gevraagde variabele in (hier: “leeftijd”)
(6) “Paste”
(7) Syntax runnen!
Antwoord: gemiddelde = 36,06 en mediaan = 36,0
B. Geef aan welke statistische toets je gaat gebruiken en waarom. Ga ook na of de
voorwaarden voor deze toets voldaan zijn.
- 1 steekproef (leeftijd van de 300 werknemers in de farmaceutische sector)
- Ratio (leeftijd)
⇒ t-test voor 1 steekproef
- Voorwaarden:
n ≥ 30 → n = 300 dus OK
Opmerkingen:
Bij meer dan 30 observaties zorgt de centrale limietstelling ervoor dat de
steekproefgemiddelden zich normaal gedragen, zelfs als de data zelf niet normaal
verdeeld zijn. Dit maakt t-toetsen betrouwbaar.
Bij minder dan 30 observaties is deze werking minder sterk, en wordt het belangrijk dat
de oorspronkelijke data zelf normaal verdeeld zijn. Een t-toets vergelijkt gemiddelden en
werkt het beste als de gemiddelden normaal verdeeld zijn. (zie normaliteitscontrole en
steekproefgrootte (SPSS) hieronder)
Antwoord: Er is 1 steekproef (alle werknemers) en leeftijd is ratio, dus T-toets voor 1
steekproef. De voorwaarden zijn ook oke want n = 300 en dit is groter dan 30.
Normaliteitscontrole en steekproefgrootte (SPSS)
1. Bij n ≥ 30:
○ De centrale limietstelling zorgt ervoor dat de steekproefgemiddelden normaal
verdeeld zijn.
○ Je hoeft de normaliteit van de oorspronkelijke data niet te controleren.
2. Bij n < 30:
○ Controleer of de variabele zelf normaal verdeeld is:
2
, Gemaakt door Joke Vrijders
■ Gebruik Analyze > Descriptive Statistics > Explore.
■ Kijk naar de of Shapiro-Wilk test (p > 0.05 = normaal verdeeld).
■ Controleer visueel via een histogram of Q-Q plot.
3. Voor een t-toets:
○ Vergelijk altijd gemiddelden (één steekproef of twee steekproeven).
○ Zorg dat de aanname van normaliteit geldt:
■ Bij n≥30: Normaliteit van de steekproefgemiddelden is vanzelf oké.
■ Bij n<30: Normaliteit van de oorspronkelijke data is vereist.
C. Geef je hypothesen en voer de statistische toets uit. Rapporteer je antwoord in APA
stijl.
Stappen SPSS:
(1) “Analyze”
(2) “Compare Means and Proportions”
(3) “One-sample T Test…”
(4) Vul de gevraagde variabele in bij “Test Variable(s)” (hier: leeftijd)
(5) Vul bij “Test value” 36 in (want H0 : μ = 36)
(6) Bij options zie je dat je enkel je betrouwbaarheidsniveau kan ingeven (alpha is 5%
dus BI 95%) → “exclude cases analysis by analysis” → “Continue”
(7) “Paste”
(8) Syntax runnen!
3
, Gemaakt door Joke Vrijders
Aflezen uit tabel SPSS:
t = 0,112
df = 299
Tweezijdige p = 0,911
Verschil gemiddelden = 0,060
BI 95% = [-0,9947 ; 1,1147]
Antwoord:
H0 : 𝜇 = 36
HA : 𝜇 ≠ 36
p > 0,05 dus H0 niet verwerpen
Conclusie:
Het uitvoeren van een t-toets voor één steekproef toonde aan dat de gemiddelde leeftijd bij
werknemers (𝑥̅= 36,06; 𝑛 = 300) uit de farmaceutische sector niet significant verschilt van 36
(𝑡(299) = 0,11; 𝑝 = 0,911; 𝑡𝑤𝑒𝑒𝑧𝑖𝑗𝑑𝑖𝑔).
D. Geef een intervalschatting voor het populatiegemiddelde (α = 5%).
4