Statistiek voor pedagogen deel 3 – P0L17B Prof. Eva Ceulemans
ILLUSTRATIE DATA-
ANALYTISCHE PROCES
Voorbeeld
- Motivatie en creativiteit (Amabile, 1985)
o Onderzoeksvraag: Wat is de invloed
van extrinsieke of intrinsieke
motivatie (OV) op creativiteit (AV)?
o Procedure experiment
47 studenten op toeval
ingedeeld in 2 groepen
Taak: Gedicht schrijven
Vooraleer taak: Lijst met
redenen om te schrijven
rangordenen
Groep 1: Lijst met intrinsieke
redenen (n = 24)
Groep 2: Lijst met extrinsieke
redenen (n = 23)
Gedichten beoordeeld door 12 dichters op 40-puntenschaal
Flowchart van het data-analytische proces
AJ 2021-2022 1
,Statistiek voor pedagogen deel 3 – P0L17B Prof. Eva Ceulemans
Voorbereidingen
- Onderzoeksvragen duidelijk?
- Evalueer proefopzet:
o Voor ons voorbeeld:
Experiment: Participanten op toeval toegewezen aan condities (causale
inferenties mogelijk)
o In de cursustekst:
Van quasi-experiment
- Controleer gegevens op fouten
o Voorbeeld: Decimaal punt vergeten of score hoger dan 40
Exploratieve data-analyse
- Gebruik tools beschrijvende statistiek om
o Vertrouwd te worden met gegevens
o Tentatief antwoord op onderzoeksvragen te zoeken
o Uitbijters te detecteren
o Interessante aspecten van gegevens aan het licht te brengen
Voorbeeld: Histogram of boxplot (voorkeur!)
Statistische inferentie
1. Formuleer modellen en hypothesen
2. Toetsstatistiek: Keuze en waarde Notatie
3. Leid steekproevenverdeling af, bepaal p-waarde en - Yij : Score van persoon i in
(optioneel) neem een beslissing groep j op de AV, met j gelijk
4. Bepaal effectgrootte aan 1 of 2
- nj : Aantal observaties in
Illustratie voor het voorbeeld: tweezijdige t-toets voor twee groep j
onafhankelijke groepen, onder assumptie dat variantie gelijk is - : Steekproefgemiddelde in
(samengestelde t-procedure) groep j
STAP 1: Formuleer modellen en hypothesen
H0 : µ1 = µ2 versus H1 = µ1 ≠ µ2
Beperkt model versus Uitgebreid
model
iid = independent and identically distributed: observaties zijn onafhankelijk en komen uit dezelfde
verdeling.
= Voorspellingsfout
Merk op: Uitgebreid model komt neer op beperkt model als µ1 = µ2
Beperkt model
AJ 2021-2022 2
,Statistiek voor pedagogen deel 3 – P0L17B Prof. Eva Ceulemans
Uitgebreid model
STAP 2: Toetsstatistiek: keuze en waarde
- Wat weten we over de verdeling van schatter over verschillende steekproeven heen?
o Normaal verdeeld
o Met gemiddelde waarde µ1 - µ2
o En standaardafwijking:
In ons voorbeeld is σ onbekend, dus schatten we op basis van de
steekproefvarianties.
Waarbij geldt:
= Standaardfout
= Samengestelde schatter S2p Pooled estimator of variance
En waarbij:
STAP 3: Leidt steekproevenverdeling af en bepaal p-waarde, en (optioneel) neem een beslissing
Gegeven H0 is waar:
Steekproevenverdeling = Herhaalde steekproeftrekkingen
Vergelijk de waarde van de toetsstatistiek (in het geval van het voorbeeld 2,92) met t-verdeling
met df = 45 (zie tabellen)
Interpretatie van de p-waarde Als een continuüm
AJ 2021-2022 3
, Statistiek voor pedagogen deel 3 – P0L17B Prof. Eva Ceulemans
Opgelet:
- NIET: de kans dat H0 fout is
- Hangt af van n (geen effectgrootte)
- Zeg NIET: ‘De p-waarde is significant’
Optioneel:
- Vergelijk met α om al dan niet te besluiten tot significantie
- Beslissing nemen (al dan niet verwerpen van H0
STAP 4: Bepaal effectgrootte
- 100 (1 – α)% BI voor verschil tussen twee gemiddelden:
met als kritieke t*
o BI = Verschil tussen µ1 en µ2 ligt daar waarschijnlijk tussen Waarschijnlijkheid = 100 (1
– α)%
o Staartkans p = α/2
- Voor ons voorbeeld: als α = 0.05 95% BI [1,2801 ; 6,9999]
- Effectgrootte helpt ‘praktische significantie’ evalueren
Presentatie
- Formuleer conclusie
o Geef antwoord op onderzoeksvragen
o Gebruik inhoudelijke terminologie
- Vat resultaten samen in een grafiek
- Geef grenzen van bevindingen aan
Voor ons voorbeeld:
- Formuleer conclusie
o Er is sterke evidentie dat een lagere creativiteitsscore voor een gedicht wordt behaald na
het invullen van de extrinsieke vragenlijst (M=16) in vergelijking met de intrinsieke
vragenlijst (M=20), (t(45)= 2,9 ; p<0,01, tweezijdig). Het geschatte verschil bedraagt 4
punten op een 40-puntenschaal. Het 95% betrouwbaarheidsinterval voor de daling in de
creativiteitsscore door de extrinsieke motivatie varieert van 1 tot 7 punten).
Sterke evidentie = lage p-waarde
M = Gemiddelde, volledig afgerond (in plaats van op 4 cijfers achter de komma).
- Vat resultaten samen in een grafiek
o Indien slechts twee groepen vergeleken worden is het niet noodzakelijk om de resultaten
ook in een figuur weer te geven (voorbeeld: met boxplots); bij meerdere groepen is dat
wel handig.
- Geef grenzen van bevindingen aan
o Randomisering (+): Causale inferentie is mogelijk
o Toevallige steekproeven (-): Assumptie twijfelachtig; strikt genomen geen inferentie naar
de populatie mogelijk.
AJ 2021-2022 4
ILLUSTRATIE DATA-
ANALYTISCHE PROCES
Voorbeeld
- Motivatie en creativiteit (Amabile, 1985)
o Onderzoeksvraag: Wat is de invloed
van extrinsieke of intrinsieke
motivatie (OV) op creativiteit (AV)?
o Procedure experiment
47 studenten op toeval
ingedeeld in 2 groepen
Taak: Gedicht schrijven
Vooraleer taak: Lijst met
redenen om te schrijven
rangordenen
Groep 1: Lijst met intrinsieke
redenen (n = 24)
Groep 2: Lijst met extrinsieke
redenen (n = 23)
Gedichten beoordeeld door 12 dichters op 40-puntenschaal
Flowchart van het data-analytische proces
AJ 2021-2022 1
,Statistiek voor pedagogen deel 3 – P0L17B Prof. Eva Ceulemans
Voorbereidingen
- Onderzoeksvragen duidelijk?
- Evalueer proefopzet:
o Voor ons voorbeeld:
Experiment: Participanten op toeval toegewezen aan condities (causale
inferenties mogelijk)
o In de cursustekst:
Van quasi-experiment
- Controleer gegevens op fouten
o Voorbeeld: Decimaal punt vergeten of score hoger dan 40
Exploratieve data-analyse
- Gebruik tools beschrijvende statistiek om
o Vertrouwd te worden met gegevens
o Tentatief antwoord op onderzoeksvragen te zoeken
o Uitbijters te detecteren
o Interessante aspecten van gegevens aan het licht te brengen
Voorbeeld: Histogram of boxplot (voorkeur!)
Statistische inferentie
1. Formuleer modellen en hypothesen
2. Toetsstatistiek: Keuze en waarde Notatie
3. Leid steekproevenverdeling af, bepaal p-waarde en - Yij : Score van persoon i in
(optioneel) neem een beslissing groep j op de AV, met j gelijk
4. Bepaal effectgrootte aan 1 of 2
- nj : Aantal observaties in
Illustratie voor het voorbeeld: tweezijdige t-toets voor twee groep j
onafhankelijke groepen, onder assumptie dat variantie gelijk is - : Steekproefgemiddelde in
(samengestelde t-procedure) groep j
STAP 1: Formuleer modellen en hypothesen
H0 : µ1 = µ2 versus H1 = µ1 ≠ µ2
Beperkt model versus Uitgebreid
model
iid = independent and identically distributed: observaties zijn onafhankelijk en komen uit dezelfde
verdeling.
= Voorspellingsfout
Merk op: Uitgebreid model komt neer op beperkt model als µ1 = µ2
Beperkt model
AJ 2021-2022 2
,Statistiek voor pedagogen deel 3 – P0L17B Prof. Eva Ceulemans
Uitgebreid model
STAP 2: Toetsstatistiek: keuze en waarde
- Wat weten we over de verdeling van schatter over verschillende steekproeven heen?
o Normaal verdeeld
o Met gemiddelde waarde µ1 - µ2
o En standaardafwijking:
In ons voorbeeld is σ onbekend, dus schatten we op basis van de
steekproefvarianties.
Waarbij geldt:
= Standaardfout
= Samengestelde schatter S2p Pooled estimator of variance
En waarbij:
STAP 3: Leidt steekproevenverdeling af en bepaal p-waarde, en (optioneel) neem een beslissing
Gegeven H0 is waar:
Steekproevenverdeling = Herhaalde steekproeftrekkingen
Vergelijk de waarde van de toetsstatistiek (in het geval van het voorbeeld 2,92) met t-verdeling
met df = 45 (zie tabellen)
Interpretatie van de p-waarde Als een continuüm
AJ 2021-2022 3
, Statistiek voor pedagogen deel 3 – P0L17B Prof. Eva Ceulemans
Opgelet:
- NIET: de kans dat H0 fout is
- Hangt af van n (geen effectgrootte)
- Zeg NIET: ‘De p-waarde is significant’
Optioneel:
- Vergelijk met α om al dan niet te besluiten tot significantie
- Beslissing nemen (al dan niet verwerpen van H0
STAP 4: Bepaal effectgrootte
- 100 (1 – α)% BI voor verschil tussen twee gemiddelden:
met als kritieke t*
o BI = Verschil tussen µ1 en µ2 ligt daar waarschijnlijk tussen Waarschijnlijkheid = 100 (1
– α)%
o Staartkans p = α/2
- Voor ons voorbeeld: als α = 0.05 95% BI [1,2801 ; 6,9999]
- Effectgrootte helpt ‘praktische significantie’ evalueren
Presentatie
- Formuleer conclusie
o Geef antwoord op onderzoeksvragen
o Gebruik inhoudelijke terminologie
- Vat resultaten samen in een grafiek
- Geef grenzen van bevindingen aan
Voor ons voorbeeld:
- Formuleer conclusie
o Er is sterke evidentie dat een lagere creativiteitsscore voor een gedicht wordt behaald na
het invullen van de extrinsieke vragenlijst (M=16) in vergelijking met de intrinsieke
vragenlijst (M=20), (t(45)= 2,9 ; p<0,01, tweezijdig). Het geschatte verschil bedraagt 4
punten op een 40-puntenschaal. Het 95% betrouwbaarheidsinterval voor de daling in de
creativiteitsscore door de extrinsieke motivatie varieert van 1 tot 7 punten).
Sterke evidentie = lage p-waarde
M = Gemiddelde, volledig afgerond (in plaats van op 4 cijfers achter de komma).
- Vat resultaten samen in een grafiek
o Indien slechts twee groepen vergeleken worden is het niet noodzakelijk om de resultaten
ook in een figuur weer te geven (voorbeeld: met boxplots); bij meerdere groepen is dat
wel handig.
- Geef grenzen van bevindingen aan
o Randomisering (+): Causale inferentie is mogelijk
o Toevallige steekproeven (-): Assumptie twijfelachtig; strikt genomen geen inferentie naar
de populatie mogelijk.
AJ 2021-2022 4