Verwachtingen: de juiste onderzoeksvraag vertalen in…
- Juiste hypothesen (H0 en H1) formuleren
- Correcte statistische toets kiezen (afhankelijk van bepaalde assumpties)
- Statistische toets correct uitvoeren (formularium, SPSS, …)
- Resultaat van statistische toets (VB: t-value, F-value, …) correct interpreteren (tov kritische waarde p-value)
- Je resultaat op een correcte wijze rapporteren
Module 1: Data analyse: power!
Leerdoelen
- Definiëren wat statistische inferentie is (herhaal Ch.23 – OM deel 1)
- Het belang van power en powerberekeningen in onderzoek uitleggen
- Definiëren wat Type I en Type II fouten zijn (herhaal Ch.23 – OM deel 1)
- Definiëren wat statistische power is (herhaal Ch.23 – OM deel 1)
- De begrippen central distribution, non-central distribution en non-centrality parameter binnen statistische
power correct plaatsen
- Het verschil duiden tussen een a priori en een post hoc power analyse (herhaal Ch.23 – OM deel 1)
- De verschillende determinanten van statistische power benoemen en hun invloed op elkaar nagaan
Inferentiële statistiek
Inferential statistics/inferentiële statistiek = statistiek waarin we op basis van steekproeven iets willen zeggen over
populatie parameters → inschatten van populatieparameters + hypothesetesten
Maken van veronderstellingen over hoe goed een steekproef de grotere populatie vertegenwoordigt adhv twee
belangrijke concepten van statistisch redeneren: Probability (probabiliteit, waarschijnlijkheid) en Sampling error
Probability = de waarschijnlijkheid dat een gebeurtenis plaatsvindt als we kijken naar alle mogelijke resultaten
p-waarde = sig. = significantieniveau = probabiliteit tussen 0 en 1
0 = het gaat niet gebeuren en 1 = het gaat zeker gebeuren
Hoe waarschijnlijk is het om dit resultaat te krijgen als H0 waar is...
Gebruik van probabiliteit in onderzoek: inschatten van populatieparameters, testen van hypotheses
Sampling distribution = steekproefverdeling → frequentie van statistiek als je met veel steekproeven werkt
Histogram waarin de gemiddelde waarden van verschillende steekproeven zitten
Hoe meer steekproeven je neemt, hoe meer het steekproefgemiddelde X naar het populatiegemiddelde µ
neigt (hoe meer dat de curve normaal verdeeld is)
VB: geboortegewichten van baby’s in een gemiddelde steekproef → Sample of n = 50 babies, with 𝑋 = 6.8 lbs, s = 1.5
, - Sampling error = neiging van steekproefwaarden om te veranderen van populatiewaarden
- Sampling error van het gemiddelde = 𝑋̅ − 𝜇
- Standard error of the mean (SEM) = standaarddeviatie van sampling distribution
o Schatting van de standaarddeviatie van de populatie: hoe groter onze steekproef bij dezelfde
standaarddeviatie (meer mensen = n), hoe kleiner de standaardfout van het gemiddelde
𝒔
o 𝒔𝑿̅ =
√𝒏
∙ SEM groot → meer sampling error
∙ SEM klein → minder sampling error
Als we een variabele X hebben die normaal verdeeld is met gemiddelde 𝜇 en standaardafwijking 𝜎 → 𝑋 ~ 𝑁(𝜇, 𝜎)
Dan is bij een steekproef van n waarnemingen het gemiddelde van X ook normaal verdeeld met gemiddelde 𝜇 en
𝜎 𝜎
standaardafwijking → 𝑋̅ ~ 𝑁 (𝜇, )
√𝑛 √𝑛
Naarmate de omvang van de steekproef toeneemt (n ), worden de steekproeven representatiever voor de
populatie → kans is groter dat gemiddelde dichtbij populatiegemiddelde ligt → sampling error wordt kleiner
Power Analyse
Bij null-hypothesis significance testing (NHST) toepassen van power analyse → als we een nulhypothese willen
verwerpen/toetsen, dan zijn we bezig met power
H0: er is geen effect
H1: er is wel een effect (dit is meestal de theorie)
NHST gaf een significant resultaat NHST gaf een niet-significant resultaat
H0 kon verworpen worden! H0 kon niet verworpen worden!
Studies waarin nulhypothese verworpen kan worden, Twee mogelijkheden: juist resultaat gevonden omdat er
hadden meer kans op publicatie (publicatie bias) in werkelijkheid ook geen verschil was OF er is toch een
Hierbij zal er niet gevraagd worden bij een post-hoc verschil in werkelijkheid dat je niet hebt kunnen
power analyse, terwijl dit bij een niet-significant aantonen door te weinig power
resultaat wel was Reviewers vragen voor een post-hoc power analyse
Type I en type II fouten
α: significantieniveau (domein waarin het kan voorkomen)
In rechter uiterste: er is wel een effect
→ nieuwe therapie is beter dan
In linker uiterste: er is wel een effect
→ nieuwe therapie is slechter dan
, Blauw: normale curve → er is geen verschil
in werkelijkheid
Oranje: abnormale curve → er is wel een
verschil in werkelijkheid
NCP = het verschil tussen beide curves
Confidence interval = betrouwbaarheidsinterval: een bereik van scores die, met een bepaalde betrouwbaarheid, het
populatie gemiddelde bevat
Grenzen van confidence interval: CI = Xbar ± z * sXbar
𝐶𝐼 = 𝑋̅ ± 𝑧 ∙ 𝑠𝑋̅
Betrouwbaarheidsinterval zegt iets over populatieparameters en niet over steekproefstatistieken
z90% z95% z99%
1,64 1,96 2,58
90% [𝜇 − 1,64 ∙ 𝜎 ; 𝜇 + 1,64 ∙ 𝜎] 90% BI 𝑠 𝑠 99% BI is breder dan 95% BI,
[𝑋̅ − 1,64 ∙ ; 𝑋̅ + 1,64 ∙ ] want interval moet breder zijn
√𝑛 √𝑛 om met meer zekerheid te
95% [𝜇 − 1,96 ∙ 𝜎 ; 𝜇 + 1,96 ∙ 𝜎] 95% BI 𝑠 𝑠
[𝑋̅ − 1,96 ∙ ; 𝑋̅ + 1,96 ∙ ] kunnen zeggen in welk interval
√𝑛 √𝑛 de populatieparameter ligt
99% [𝜇 − 2,58 ∙ 𝜎 ; 𝜇 + 2,58 ∙ 𝜎] 99% BI 𝑠 𝑠 smaller BI als minder
[𝑋̅ − 2,58 ∙ ; 𝑋̅ + 2,58 ∙ ]
√𝑛 √𝑛 zekerheid
Als we 100 steekproeven met dezelfde steekproefgrootte doen en we stellen telkens het 95% BI op, dan zullen
ongeveer 95% van die BI’s het echte populatiegemiddelde µ omvatten. De kans dat µ buiten het interval ligt is 5%.
VB: gemiddelde = 6.8, z-score van 95% = 1.96, standard error of the mean = 0.21
95% 𝐶𝐼 = 6.8 ± (1.96). (0.21) = 6.8 ± 0.41 = 𝑡𝑢𝑠𝑠𝑒𝑛 6.39 𝑒𝑛 7.21
→ we zijn 95% zeker dat het populatiegemiddelde in dit interval zit
→ er is 5% kans dat het populatiegemiddelde niet in dit interval zit
Eenzijdige T-test met 1 kritische waarde
Je wil als onderzoeker bij het gele sterretje zitten!
1- β: nulhypothese verwerpen, als er in werkelijkheid ook een verschil of effect is (juist besluit)
1-α: nulhypothese behouden, als er in werkelijkheid ook geen verschil of effect is (juist besluit)
Type I fout: we zeggen dat er een verschil/effect is, maar dat is er in werkelijkheid niet → H0 onterecht verwerpen
Type II fout: we zeggen dat er geen verschil/effect is, maar dat is er in werkelijkheid wel → H0 onterecht aannemen
, Kritische waarde bepaalt vanaf welke T-value de H0 verworpen wordt
Stukje voorbij kritische waarde = mogelijke fout
Zwart staafje = kritische waarde van toets (T-waarde)
Determinanten van power analyse
PANE:
- P = power (1- β)
o Onderscheidingsvermogen
- A = alfa level of significance
o Niet directioneel/directioneel
o Hoe lager het significantieniveau, hoe lager de kans op een type I fout, maar hoe groter de kans dat
een we een werkelijk bestaand verschil/effect missen
- N = number of subjects (sample size)
o Hoe groter de steekproef, hoe meer statistische power
o Kleinere steekproeven zijn minder goede representaties van de werkelijke populatie
- E = effect size (ES): een meeting van in welke mate de nulhypothese fout is
o De grootte van het effect van de onafhankelijke variabele