WPO 1
nominaal
nominaal
ratio (scale)
nominaal
ordinaal
nominaal
nom
ratio (scale)
ratio (scale)
interval (scale)
interval (scale)
1
,t-toetsen en Wilcoxon
One sample t-toetsen
Oefening 1
Ga na of de gemiddelde leeftijd van werknemers in de farmaceutische sector verschilt van 36 jaar (= 5%).
1. Wat meet je?
Je meet een verschilscore van de aandacht van hun werknemers
2. Meetniveau?
Gemiddelde leeftijd → ratio
3. Hoeveel steekproeven zijn er?
1 steekproef (leeftijd van de 300 werknemers in de farmaceutische sector)
4. Gaat het over een verband of een associatie?
Nee
5. Gaat het over een voorspelling?
Nee
6. Een- of tweezijdig?
Tweezijdig, want “verschilt van”
A. Maak een grafische voorstelling van de gegevens en bereken je gemiddelde en je mediaan.
Als we een continue variabele hebben, gebruiken we:
" Ofwel een histogram (geeft een genuanceerder beeld over de verdeling)
" Ofwel een boxplot (geeft een idee over de spreiding van je data)
We gebruiken een histogram, want leeftijd is ratio en dus een continue variabele.
Stappen SPSS (histogram):
(1) “Analyze”
(2) “Descriptive statistics”
(3) “Frequencies…”
(4) Vul de variabele in die je wilt onderzoeken (hier: “leeftijd”)
(5) “Statistics” → vink gemiddelde (= “Mean") en de mediaan (= “Median”) aan ; “Continue”
(6) “Charts” → “Histograms” → “Continue”
(7) “PASTE” (zodat het in de syntax komt)!
(8) Syntax runnen!
OF (andere manier – boxplot):
(1) “Graphs”
(2) “Boxplot…”
(3) “Simple” (want je wilt maar 1 stuk) → “Summaries of seperate variables” → Define
(4) “Boxes Represent:” → Vul de gevraagde variabele in (hier: “leeftijd”)
(5) “Paste”
(6) Syntax runnen!
2
,Antwoord: gemiddelde = 36,06 en mediaan = 36,0
Output:
B. Geef aan welke statistische toets je gaat gebruiken en waarom.
Ga ook na of de voorwaarden voor deze toets voldaan zijn.
• 1 steekproef (leeftijd van de 300 werknemers in de farmaceutische sector)
• Ratio (leeftijd)
⇒ t-test voor 1 steekproef (one-sample t-toets)
9 VOORWAARDEN:
n ≥ 30 → n = 300 dus OK
Opmerkingen:
• (n ≥ 30); Bij meer dan 30 observaties zorgt de centrale limietstelling ervoor dat de steekproefgemiddelden zich
normaal gedragen, zelfs als de data zelf niet normaal verdeeld zijn. Dit maakt t-toetsen betrouwbaar.
• (n < 30); Bij minder dan 30 observaties is deze werking minder sterk, en wordt het belangrijk dat de
oorspronkelijke data zelf normaal verdeeld zijn. Een t-toets vergelijkt gemiddelden en werkt het beste als de
gemiddelden normaal verdeeld zijn. (zie normaliteitscontrole en steekproefgrootte (SPSS) hieronder)
Antwoord: Er is 1 steekproef (alle werknemers) en leeftijd is ratio, dus t-toets voor 1 steekproef. De voorwaarden zijn
ook oke want n = 300 en dit is groter dan 30.
Normaliteitscontrole en steekproefgrootte (SPSS)
1. Bij n ≥ 30:
• De centrale limietstelling zorgt ervoor dat de steekproefgemiddelden normaal verdeeld zijn.
• Je hoeft de normaliteit van de oorspronkelijke data niet te controleren.
2. Bij n < 30: Controleer of de variabele zelf normaal verdeeld is:
• Gebruik Analyze > Descriptive Statistics > Explore.
• Kijk naar de Shapiro-Wilk test (p > 0.05 = normaal verdeeld).
• Controleer visueel via een histogram of Q-Q plot.
3. Voor een t-toets:
• Vergelijk altijd gemiddelden (één steekproef of twee steekproeven).
• Zorg dat de aanname van normaliteit geldt:
o Bij n ≥ 30: Normaliteit van de steekproefgemiddelden is vanzelf oké.
o Bij n < 30: Normaliteit van de oorspronkelijke data is vereist.
3
,C. Geef je hypothesen en voer de statistische toets uit. Rapporteer je antwoord in APA stijl.
H0 : 𝜇 = 36
HA : 𝜇 ≠ 36 → tweezijdig
Stappen SPSS:
(1) “Analyze”
(2) “Compare Means and Proportions”
(3) “One-sample T Test…”
(4) Vul de gevraagde variabele in bij “Test Variable(s)” (hier: leeftijd)
(5) Vul bij “Test value” 36 in (want H0 : μ = 36)
(6) Bij options zie je dat je enkel je betrouwbaarheidsniveau kan ingeven (alpha is 5% dus BI 95%)
→ “exclude cases analysis by analysis” → “Continue”
(7) “Paste”
(8) Syntax runnen!
Output:
9 Aflezen uit tabel SPSS: t = 0.112, df = 299, tweezijdige p = 0.911, verschil gemiddelden = 0.060
BI 95% = [-0.9947 ; 1.1147]
Antwoord:
p > 0,05 dus H0 niet verwerpen
4
,Conclusie:
Het uitvoeren van een t-toets voor één steekproef toonde aan dat de gemiddelde leeftijd bij werknemers (𝑥̅ = 36,06;
𝑛 = 300) uit de farmaceutische sector niet significant verschilt van 36 (𝑡(299) = 0,11; 𝑝 = 0,911; tweezijdig).
D. Geef een intervalschatting voor het populatiegemiddelde (α = 5%).
9 We gaan het steekproefgemiddelde afleiden uit de output (Mean = 36.0600)
• “Lower” (= 0.9947) trek je ervan af voor de ONDERGRENS (dus 36.0600 – 0.9947);
• “Upper” (= 1.1147) tel je erbij op voor de BOVENGRENS (dus 36.0600 + 1.1147).
⇒ Antwoord: 95% BI = [35.0653 ; 37.1747]
!!! Andere (betere) manier:
Stappen SPSS:
(1) “Analyze”
(2) “Descriptive statistics”
(3) “Explore…”
(4) Variabele bij dependent list zetten (hier: leeftijd)
(5) “Statistics…” → confidence interval for mean (hier: 95%) → Continue
(6) “Paste”
(7) Syntax runnen
Antwoord:
EXAMINE VARIABLES=leeftijd
/PLOT BOXPLOT STEMLEAF
/COMPARE GROUPS
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.
De gemiddelde leeftijd voor werknemers in de farmaceutische sector ligt tussen 35,01 en 37,11 (𝑥̅ = 36,06; 𝑛 = 300;
95% BI [35,0653; 37,1747]).
Output:
5
,Oefening 2
(zelfstandig maken)
Ga na of de reisduur van werknemers in de farmaceutische sector kleiner is dan 25 dagen (𝛼 = 2%).
1. Wat meet je?
De reisduur van de werknemers in de sector
2. Meetniveau?
Reisduur → ratio
3. Hoeveel steekproeven zijn er?
1 steekproef (reisduur van de 300 werknemers in de farmaceutische sector)
4. Gaat het over een verband of een associatie?
Nee
5. Gaat het over een voorspelling?
Nee
6. Een- of tweezijdig?
Eenzijdig, want "kleiner dan”
A. Geef aan welke statistische toets je gaat gebruiken en waarom. Ga ook na of de voorwaarden voor deze toets
voldaan zijn.
Antwoord: Ik heb een t-test voor één steekproef gebruikt omdat het gaat over 1 steekproef en omdat “het aantal
dagen” ratio is.
9 VOORWAARDEN:
n ≥ 30 → n = 300 dus OK!
B. Geef je hypothesen en voer de statistische toets uit. Rapporteer je antwoord in APA stijl.
Antwoord:
H0 : 𝜇 = 25
HA : 𝜇 < 25 → eenzijdig
Stappen SPSS:
(1) “Analyze”
(2) “Compare Means and Proportions”
(3) “One-sample T Test…”
(4) Vul de gevraagde variabele in bij “Test Variable(s)” (hier: dagen)
(5) Vul bij “Test value” 25 in (want H0 : μ = 25)
(6) Bij options zie je dat je enkel je betrouwbaarheidsniveau kan ingeven (alpha is 5% dus BI 95%) → “exclude cases
analysis by analysis” → “Continue”
(7) “Paste”
(8) Syntax runnen!
6
, Output:
𝑥̅ = 18,8767
t = -13,103
df = 299
Eenzijdige p < 0,001
Verschil gemiddelden = -6,12333
-7,0430 ← 𝑥̅ = 18,8767 → -5,2037
BI bereken:
Stappen SPSS:
(1) “Analyze”
(2) “Descriptive statistics”
(3) “Explore…”
(4) Variabele bij dependent list zetten (hier: dagen)
(5) “Statistics” → confidence interval for mean → Continue
(6) “Paste”
(7) Syntax runnen
Output:
95% BI = [17,9570 ; 19,7963]
Conclusie: Het uitvoeren van een t-toets voor één steekproef toonde aan dat de gemiddelde reisduur bij werknemers
(𝑥̅ = 18,88; 𝑛 = 300) uit de farmaceutische sector significant kleiner is dan 25 dagen (𝑡(299) = -13,10; 𝑝 < 0,001; eenzijdig).
Oplossingsbundel: De reisduur van werknemers uit de farmaceutische sector (𝑥̅= 18,88) is significant kleiner dan 25
dagen (𝑡 − 𝑡𝑜𝑒𝑡𝑠 𝑣𝑜𝑜𝑟 éé𝑛 𝑠𝑡𝑒𝑒𝑘𝑝𝑟𝑜𝑒𝑓; 𝑡(299) = −13,10; 𝑝 < 0,001; 𝑒𝑒𝑛𝑧𝑖𝑗𝑑𝑖𝑔).
7