!Ook slides bekijken voor studies en berekeningen,…
Hoofdstuk 1: Data analyse: power!
1.1 Poweranalyse
Bij statistische significantie-toetsen: nul-hypothese significantie testing (NHST)
- H0: geen effect ; HA: wel effect
o HA kan je nooit bewijzen, je kan alleen H0 verwerpen of behouden
- NHST gaf significant resultaat -> H0 kan verworpen worden
OF
- NHST gaf niet-significant resultaat -> H0 kan niet verworpen worden
o Niet altijd slecht: er kan gewoon geen =/ zijn of slechte power analyse (bv te weinig
proefpersonen)
In werkelijkheid → H0 is waar H0 is vals
Ons besluit ↓
Verwerpen H0 Type I fout = α Power = 1-β
Behouden H0 Betrouwbaarheidsinterval = 1-α Type II fout = β
Type I fout:
- Kans dat we zeggen dat er een effect is, wanneer er in feite geen effect is
- Kans dat theorie ten onrechte bevestigd wordt
Betrouwbaarheidsinterval:
- Kans dat we zeggen dat er geen effect is, wanneer er in feite geen effect is
- Kans dat onze theorie CORRECT niet bevestigd wordt
- Bepaald door 1-α
Type II fout:
- Kans dat we zeggen dat er geen effect is, wanneer er in feite wel een effect is
- Kans dat onze theorie TEN ONRECHTE niet bevestigd wordt
- Er was wel een verschil maar dit hebben ze niet kunnen aantonen
- Neem je vaak groter dan type I
Power:
- Kans dat we zeggen dat er een effect is, wanneer er inderdaad een effect is
- Kans dat onze theorie CORRECT bevestigd wordt
- Bepaald door 1-β
- Als onderzoeker wil je je hier bevinden
1
,Sampling distributie:
Als H0 waar is: central distribution (blauw)
- Rond 0 zetten
Als H0 vals is: noncentral distribution (oranje)
- Verschoven tov blauwe (kan ook nr links)
NCP: geeft verschil tss 2 curves weer
α: ruimte boven kritische waarde maar boven sample distributie als H0 waar is
β: onder oranje curve + waarde onder kritische
waarde dus H0 kunnen we niet verwerpen
Power: ruimte onder oranje curve (dus er is een
verschil) en waarde hoger dan kritische waarde (dus
H0 verwerpen)
Op basis van test statistiek:
= type I fout
= betrouwbaarheidsinterval
= power
= type II fout
Determinanten
PANE
2
,Effect size = ES
“The degree to which a phenomenon exists”
Aanduiding vd praktische belangrijkheid v/e statistische significante bevinding
- Omvang v/e verschil tss groepen (= 0 als H0 juist is)
- Omvang v/e associatie (r)
- Omvang vd variantie vd AV, verklaard dr OV (r²)
= verschil tss waarde id H0 en waarde id HA
= klinisch gewenste verschil
P geeft aan of een bevinding statistisch (toeval of niet) significant is
ES: maatstaf vd praktische significantie
- ES↑ => 1- β ↑
- Oranje curve ligt verder weg (dus β kleiner)
Significantieniveau = A
α↑ => kritische waarde verschuift nr links => β↓ => 1-β↑
Eenzijdige vs tweezijdige toetsen
= directioneel vs non-directioneel
3
, Eenzijdig: aan 1 kant (zoals vorige vbn)
Tweezijdig: richting ongekend dus aan 2 kanten vd blauwe curve zetten
α α/2
Verwerpingsgebied kleiner => kritische waarde
verschuift => power ↓
Steekproefomvang = N en variantie
Standaardfout van sampling distributie gebruiken om betrouwbaarheidsintervallen te estimeren:
Kritische waarde ↓ => power ↑ bij:
- Kleinere s
- Homogene subjecten (statistisch voordeel maar nadeel om te veralgemenen)
- Within-subjects designs
- Grotere steekproefomvang (n)
Kritische waarde vr t-test: r,… lager vr grotere samples (groter # vrijheidsgraden)
N ↑ en/of ∂ ↓:
Curve smaller en variabiliteit kleiner
Andere factoren
- Normale verdeling id populatie?
- Welke statistische procedure? Power van parametrische toetsen >/= distributievrije toetsen
- Betrouwbaarheid vd meetwaardes
- Welk design? Power van within-subjects designs > between-subject designs
Onderzoek nr power analyse -> wat wil je weten? (samenhang tss power, alfa, sample size, effect size)
- Als onderzoeker te bepalen:
4
Hoofdstuk 1: Data analyse: power!
1.1 Poweranalyse
Bij statistische significantie-toetsen: nul-hypothese significantie testing (NHST)
- H0: geen effect ; HA: wel effect
o HA kan je nooit bewijzen, je kan alleen H0 verwerpen of behouden
- NHST gaf significant resultaat -> H0 kan verworpen worden
OF
- NHST gaf niet-significant resultaat -> H0 kan niet verworpen worden
o Niet altijd slecht: er kan gewoon geen =/ zijn of slechte power analyse (bv te weinig
proefpersonen)
In werkelijkheid → H0 is waar H0 is vals
Ons besluit ↓
Verwerpen H0 Type I fout = α Power = 1-β
Behouden H0 Betrouwbaarheidsinterval = 1-α Type II fout = β
Type I fout:
- Kans dat we zeggen dat er een effect is, wanneer er in feite geen effect is
- Kans dat theorie ten onrechte bevestigd wordt
Betrouwbaarheidsinterval:
- Kans dat we zeggen dat er geen effect is, wanneer er in feite geen effect is
- Kans dat onze theorie CORRECT niet bevestigd wordt
- Bepaald door 1-α
Type II fout:
- Kans dat we zeggen dat er geen effect is, wanneer er in feite wel een effect is
- Kans dat onze theorie TEN ONRECHTE niet bevestigd wordt
- Er was wel een verschil maar dit hebben ze niet kunnen aantonen
- Neem je vaak groter dan type I
Power:
- Kans dat we zeggen dat er een effect is, wanneer er inderdaad een effect is
- Kans dat onze theorie CORRECT bevestigd wordt
- Bepaald door 1-β
- Als onderzoeker wil je je hier bevinden
1
,Sampling distributie:
Als H0 waar is: central distribution (blauw)
- Rond 0 zetten
Als H0 vals is: noncentral distribution (oranje)
- Verschoven tov blauwe (kan ook nr links)
NCP: geeft verschil tss 2 curves weer
α: ruimte boven kritische waarde maar boven sample distributie als H0 waar is
β: onder oranje curve + waarde onder kritische
waarde dus H0 kunnen we niet verwerpen
Power: ruimte onder oranje curve (dus er is een
verschil) en waarde hoger dan kritische waarde (dus
H0 verwerpen)
Op basis van test statistiek:
= type I fout
= betrouwbaarheidsinterval
= power
= type II fout
Determinanten
PANE
2
,Effect size = ES
“The degree to which a phenomenon exists”
Aanduiding vd praktische belangrijkheid v/e statistische significante bevinding
- Omvang v/e verschil tss groepen (= 0 als H0 juist is)
- Omvang v/e associatie (r)
- Omvang vd variantie vd AV, verklaard dr OV (r²)
= verschil tss waarde id H0 en waarde id HA
= klinisch gewenste verschil
P geeft aan of een bevinding statistisch (toeval of niet) significant is
ES: maatstaf vd praktische significantie
- ES↑ => 1- β ↑
- Oranje curve ligt verder weg (dus β kleiner)
Significantieniveau = A
α↑ => kritische waarde verschuift nr links => β↓ => 1-β↑
Eenzijdige vs tweezijdige toetsen
= directioneel vs non-directioneel
3
, Eenzijdig: aan 1 kant (zoals vorige vbn)
Tweezijdig: richting ongekend dus aan 2 kanten vd blauwe curve zetten
α α/2
Verwerpingsgebied kleiner => kritische waarde
verschuift => power ↓
Steekproefomvang = N en variantie
Standaardfout van sampling distributie gebruiken om betrouwbaarheidsintervallen te estimeren:
Kritische waarde ↓ => power ↑ bij:
- Kleinere s
- Homogene subjecten (statistisch voordeel maar nadeel om te veralgemenen)
- Within-subjects designs
- Grotere steekproefomvang (n)
Kritische waarde vr t-test: r,… lager vr grotere samples (groter # vrijheidsgraden)
N ↑ en/of ∂ ↓:
Curve smaller en variabiliteit kleiner
Andere factoren
- Normale verdeling id populatie?
- Welke statistische procedure? Power van parametrische toetsen >/= distributievrije toetsen
- Betrouwbaarheid vd meetwaardes
- Welk design? Power van within-subjects designs > between-subject designs
Onderzoek nr power analyse -> wat wil je weten? (samenhang tss power, alfa, sample size, effect size)
- Als onderzoeker te bepalen:
4