WETENSCHAPPEN
Didactisch Team
Prof. Dr. E. Ceulemans
B. Geusens
Data-Opdracht
P0L17B – Statistiek voor Pedagogen, Deel 3
Academiejaar 2021-2022
,DEEL 1
Om een antwoord te bieden op de verkregen onderzoeksvragen zijn we begonnen met de z-scores
onder de z_TALQ variabele, te verdelen in drie groepen. Een z-score van hoogstens -0,2 vormde de
groep met het label ‘laag’, een z-score vanaf 0,2 vormde de groep met het label ‘hoog’ en alle scores
die tussen deze z-scores lagen, vormden de groep met het label ‘gemiddeld’. Deze onderverdeling in
groepen vormt samen de nieuwe variabele kwaliteit_leeromgeving.
1 Onderzoeksvraag 1
1.1 Exploratieve data-analyse
Figuur 1 Boxplot 1
Om de spreiding binnen elke groep in kaart te brengen, werkten we met een boxplot. Hieruit
constateren we dat studenten uit de groep ‘laag’ de grootste spreiding hebben. Studenten uit de groep
‘gemiddeld’ hebben de kleinste spreiding. Wanneer we deze boxplots afzetten op de y-as, zien we dat
deze grotendeels overlappen. Hierdoor vermoeden we dat er geen significant verschil is tussen de
groepen wat betreft hun eindscore op de taaltest.
Tabel 1 Kengetallen
Uit tabel 1 kunnen we afleiden dat de groepsgemiddeldes dicht bij elkaar liggen. Wanneer we de
standaardafwijkingen hiernaast leggen, wordt dit bevestigd. Uit deze gegevens kunnen we vermoeden
dat er geen significant verschil is tussen de drie groepen. Verder spreken we hier ook van een
ongebalanceerd design, aangezien het aantal deelnemers per groep verschilt van groepsgrootte.
, 1.2 Statistische inferentie
STAP 1: Hypothesen en modellen
H0: µlaag = µgemiddeld = µhoog
𝑖𝑖𝑑
Beperkt model: 𝑌𝑖𝑗 = 𝜇 + 𝜀𝑖𝑗 , 𝜀𝑖𝑗 ∼ 𝑁(0, 𝜎 2 )
H1: er is ergens een verschil tussen de 3 populatiegroepsgemiddelden
𝑖𝑖𝑑
Uitgebreid model: 𝑌𝑖𝑗 = 𝜇𝑗 + 𝜀𝑖𝑗 , 𝜀𝑖𝑗 ∼ 𝑁(0, 𝜎 2 )
STAP 2 & 3: Toetsstatistiek en p-waarde
Tabel 3 ANOVA-tabel met 1 factor
In de ANOVA-tabel vinden we een toetsstatistiek van F2,150 = 6.745. Hier zien we een significant
verschil tussen de drie groepen (p = 0.002). We kunnen de nulhypothese, die veronderstelt dat de
groepen gelijk zijn, verwerpen. Er is wel een discrepantie tussen wat we hier zien en hetgeen dat we
vermoedden op basis van onze exploratieve data-analyse.
STAP 4: Effectmaat en interpretatie
Tabel 4 Tests of Between-Subject Effects
Aan de hand van R² zien we een klein effect. Hieruit besluiten we dat 8.3% van de variantie in de
eindscores op de taaltest verklaard wordt door de opdeling in drie groepen.
STAP 5: Conclusie
Er is een significant verschil tussen de drie groepen wat betreft hun eindscores op de taaltest
(variantieanalyse met één factor, F2,150 = 6.745, p = 0.002, R² = 0.083).