Statistische toetsen
Bij
een
significant
resultaat,
kan
je
het
geobserveerde
verschil
niet
aan
toeval
Hoe kan je je aantonen dat je een significant resultaat hebt?
toeschrijven.
Een
hypothesetest
helpt
je
bij
het
beslissen
of
een
test
significant
is
of
niet.
I. Betrouwbaarheidsinterval
Een
betrouwbaarheidsinterval
is
een
interval
dat
aangeeft
tussen
welke
H0
:
de
situatie
waarin
er
geen
effect
of
verschil
wordt
verwacht
(men
wil
de
H0
twee
waarden
een
onbekende
populatieparameter
zal
liggen.
De
weerleggen)
formule
hiervoor
bij
een
normale
verdeling?
! !
HA:
de
situatie
waarin
er
wel
effect
of
verschil
wordt
verwacht
(men
wel
de
Ha
𝜇 − 𝑧! ; 𝜇 + 𝑧! ;
! !
accepteren)
met
σ
=
standaardafwijking
en
µ
=
gemiddelde
Wanneer
aanvaard
je
de
H0?
Wanneer
H0
in
je
interval
ligt,
moet
je
De
P-‐waarde
is
de
kans
de
op
de
in
de
steekproef
gevonden
waarde
of
nog
de
H0
accepteren!
extremer,
onder
de
aanname
dat
de
H0
juist
is.
Als
je
p-‐waarde
klein
is,
betekent
dit
dat
je
steekproefwaarde
niet
vaak
voorkomt
als
H0
waar
is.
In
dit
geval
ga
je
II. P-‐waarde
de
H0
verwerpen.
Wanneer
de
verkregen
kans
(p-‐waarde)
kleiner
is
dan
het
vooropgestelde
significantieniveau
α
wordt
de
H0
verworpen.
Stappenplan voor een goede hypothesetest
p
<
α:
H0
verwerpen
→
Significant
resultaat
1. Verzamel
gegevens
aan
de
hand
van
een
representatieve
steekproef
p
≥
α:
H0
aanvaarden
→
Geen
significant
resultaat
2. Kies
een
geschikte
statistische
test
en
formuleer
de
nulhypothese
H0
en
de
alternatieve
hypothese
Ha.
III. Kritieke
waarden
3. Leg
het
significantieniveau
(α)
vast
en
bereken
de
steekproefgrootte
(n)
Je
kan
ook
je
resultaat
vergelijken
met
een
kritische
waarde.
4. Voer
de
test
uit
Vergelijk
je
toetsingsgrootheid
met
de
kritieke
waarde
uit
een
tabel.
Is
je
5. Stemt
de
testgrootheid
overeen
met
de
p-‐waarde?
Interpreteer!
toetsingsgrootheid
hoger
dan
de
kritieke
waarde?
Dan
heb
je
een
6. Bevindt
de
berekende
testgrootheid
binnen
het
verwerpingsgebied
van
significant
resultaat!
Voorbeeld:
de
kritische
waarde
bij
de
chi-‐
de
H0?
Verwerp
dan
de
H0!
kwadraattoets
is
3,84
bij
één
vrijheidsgraad
Inleiding
tot
de
biostatistiek:
statistische
toetsen
1
Merk
op:
#
v
rijheidsgraden
=
(#rijen
–
1)
x
(#kolommen
–
1
)
,
Ongepaarde t-test Gepaarde t-test ANOVA
Wanneer
gebruik
Deze
test
vergelijkt
de
gemiddelden
van
twee
Deze
test
vergelijkt
de
van
gemiddelden
van
twee
Deze
test
vergelijkt
de
gemiddelden
van
meer
dan
je
deze
toets?
onafhankelijke
groepen
metingen
(onder
andere
omstandigheden)
bij
één
twee
groepen.
individu
Variabelen?
x
is
een
binaire
variabele
x
is
een
binaire
variabele
x
is
een
discrete
variabele
y
is
een
continue
variabele
y
is
een
continue
variabele
y
is
een
continue
variabele
Assumpties?
Waarden
moeten
normaal
verdeeld
zijn,
gelijke
Verschillen
moeten
normaal
verdeeld
zijn
y
is
normaal
verdeeld,
homoscedasticiteit
varianties
(=homoscedasticiteit)
!!!"#$""%
Methode?
Bereken
testgrootheid:
𝑡 =
∆
=
!! !!!
!!!
!
!
!
!
Bereken
F
=
!!!"#!!"
met
r
=
aantal
steekproeven,
!!!
N
=
totale
steekproefgrootte,
SSwithin
=
(observatie
–
2
gemiddelde
van
specifieke
groep)
en
SSbetween
=
(gemiddelde
van
specifieke
groep
–
algemeen
gemiddelde)
Hypothesen?
H0:
populatie
gemiddelden
in
beide
groepen
zijn
H0:
gemiddeld
verschil
in
populatie
is
gelijk
aan
0
H0:
µ1
=
µ2
=
µ3
=
…
=
µn
gelijk
HA:
gemiddeld
verschil
in
populatie
is
niet
gelijk
aan
0
Ha:
minstens
een
van
de
groepsgemiddelden
is
HA:
populatiegemiddelden
in
beide
groepen
zijn
(tweezijdig)
verschillend
niet
gelijk
(tweezijdig)
Wanneer
verwerp
P-‐waarde
<
α
P-‐waarde
<
α
Een
grote
F-‐waarde
stemt
overeen
met
een
kleine
p-‐
je
H0?
Toetsingsgrootheid
is
hoger
dan
kritieke
waarde
Toetsingsgrootheid
is
hoger
dan
kritieke
waarde
waarde.
Bij
een
grote
F-‐waarde
ga
je
de
H0
dus
verwerpen.
Inleiding
tot
de
biostatistiek:
statistische
toetsen
2
Bij
een
significant
resultaat,
kan
je
het
geobserveerde
verschil
niet
aan
toeval
Hoe kan je je aantonen dat je een significant resultaat hebt?
toeschrijven.
Een
hypothesetest
helpt
je
bij
het
beslissen
of
een
test
significant
is
of
niet.
I. Betrouwbaarheidsinterval
Een
betrouwbaarheidsinterval
is
een
interval
dat
aangeeft
tussen
welke
H0
:
de
situatie
waarin
er
geen
effect
of
verschil
wordt
verwacht
(men
wil
de
H0
twee
waarden
een
onbekende
populatieparameter
zal
liggen.
De
weerleggen)
formule
hiervoor
bij
een
normale
verdeling?
! !
HA:
de
situatie
waarin
er
wel
effect
of
verschil
wordt
verwacht
(men
wel
de
Ha
𝜇 − 𝑧! ; 𝜇 + 𝑧! ;
! !
accepteren)
met
σ
=
standaardafwijking
en
µ
=
gemiddelde
Wanneer
aanvaard
je
de
H0?
Wanneer
H0
in
je
interval
ligt,
moet
je
De
P-‐waarde
is
de
kans
de
op
de
in
de
steekproef
gevonden
waarde
of
nog
de
H0
accepteren!
extremer,
onder
de
aanname
dat
de
H0
juist
is.
Als
je
p-‐waarde
klein
is,
betekent
dit
dat
je
steekproefwaarde
niet
vaak
voorkomt
als
H0
waar
is.
In
dit
geval
ga
je
II. P-‐waarde
de
H0
verwerpen.
Wanneer
de
verkregen
kans
(p-‐waarde)
kleiner
is
dan
het
vooropgestelde
significantieniveau
α
wordt
de
H0
verworpen.
Stappenplan voor een goede hypothesetest
p
<
α:
H0
verwerpen
→
Significant
resultaat
1. Verzamel
gegevens
aan
de
hand
van
een
representatieve
steekproef
p
≥
α:
H0
aanvaarden
→
Geen
significant
resultaat
2. Kies
een
geschikte
statistische
test
en
formuleer
de
nulhypothese
H0
en
de
alternatieve
hypothese
Ha.
III. Kritieke
waarden
3. Leg
het
significantieniveau
(α)
vast
en
bereken
de
steekproefgrootte
(n)
Je
kan
ook
je
resultaat
vergelijken
met
een
kritische
waarde.
4. Voer
de
test
uit
Vergelijk
je
toetsingsgrootheid
met
de
kritieke
waarde
uit
een
tabel.
Is
je
5. Stemt
de
testgrootheid
overeen
met
de
p-‐waarde?
Interpreteer!
toetsingsgrootheid
hoger
dan
de
kritieke
waarde?
Dan
heb
je
een
6. Bevindt
de
berekende
testgrootheid
binnen
het
verwerpingsgebied
van
significant
resultaat!
Voorbeeld:
de
kritische
waarde
bij
de
chi-‐
de
H0?
Verwerp
dan
de
H0!
kwadraattoets
is
3,84
bij
één
vrijheidsgraad
Inleiding
tot
de
biostatistiek:
statistische
toetsen
1
Merk
op:
#
v
rijheidsgraden
=
(#rijen
–
1)
x
(#kolommen
–
1
)
,
Ongepaarde t-test Gepaarde t-test ANOVA
Wanneer
gebruik
Deze
test
vergelijkt
de
gemiddelden
van
twee
Deze
test
vergelijkt
de
van
gemiddelden
van
twee
Deze
test
vergelijkt
de
gemiddelden
van
meer
dan
je
deze
toets?
onafhankelijke
groepen
metingen
(onder
andere
omstandigheden)
bij
één
twee
groepen.
individu
Variabelen?
x
is
een
binaire
variabele
x
is
een
binaire
variabele
x
is
een
discrete
variabele
y
is
een
continue
variabele
y
is
een
continue
variabele
y
is
een
continue
variabele
Assumpties?
Waarden
moeten
normaal
verdeeld
zijn,
gelijke
Verschillen
moeten
normaal
verdeeld
zijn
y
is
normaal
verdeeld,
homoscedasticiteit
varianties
(=homoscedasticiteit)
!!!"#$""%
Methode?
Bereken
testgrootheid:
𝑡 =
∆
=
!! !!!
!!!
!
!
!
!
Bereken
F
=
!!!"#!!"
met
r
=
aantal
steekproeven,
!!!
N
=
totale
steekproefgrootte,
SSwithin
=
(observatie
–
2
gemiddelde
van
specifieke
groep)
en
SSbetween
=
(gemiddelde
van
specifieke
groep
–
algemeen
gemiddelde)
Hypothesen?
H0:
populatie
gemiddelden
in
beide
groepen
zijn
H0:
gemiddeld
verschil
in
populatie
is
gelijk
aan
0
H0:
µ1
=
µ2
=
µ3
=
…
=
µn
gelijk
HA:
gemiddeld
verschil
in
populatie
is
niet
gelijk
aan
0
Ha:
minstens
een
van
de
groepsgemiddelden
is
HA:
populatiegemiddelden
in
beide
groepen
zijn
(tweezijdig)
verschillend
niet
gelijk
(tweezijdig)
Wanneer
verwerp
P-‐waarde
<
α
P-‐waarde
<
α
Een
grote
F-‐waarde
stemt
overeen
met
een
kleine
p-‐
je
H0?
Toetsingsgrootheid
is
hoger
dan
kritieke
waarde
Toetsingsgrootheid
is
hoger
dan
kritieke
waarde
waarde.
Bij
een
grote
F-‐waarde
ga
je
de
H0
dus
verwerpen.
Inleiding
tot
de
biostatistiek:
statistische
toetsen
2