kwantitatief onderzoek les 3
Toetsende statistiek
1. Beschrijvende versus Toetsende Statistiek: herhaling Basis van
Onderzoek
beschrijvende statistiek toetsende statistiek
uitspraken betrekking op steekproef betrekking op populatie
doel Hoe ziet de steekproef eruit? generaliseren
datareductie theorievorming:
verschillen
verbanden
relevante ordeningstechnieken: falsificatiebeginsel: H0 versus
vraagstelling tabellen: FR, CFR, %, … H1
grafieken: cirkel-, staafdiagram, … formuleren van ‘Zijn gevonden
ligging: verschillen of verbanden op
positie/ligging: modus, mediaan, toeval gebaseerd (H0
gemiddelde, percentiel aanhouden) versus significant
spreiding: range, SD, variantie (H0 verwerpen en H1
vorm: kurtosis, scheefheid, normaliteit aannemen)?
relaties (verbanden) tussen variabelen: standaardnormaalverdeling
kruistabellen, relatieve en conditionele uitsluitsel door
proporties (‘distributies’) significantietoetsen
correlaties en regressie
Standaardnormaalverdeling w gebruikt om op 3 soorten vragen
antwoord te bieden:
1.1.Proporties berekenen
je schat hoeveel mensen bepaalde score hebben
bv. cijfers op examen zijn normaalverdeeld met M = 12 en SD = 4.
Hoeveel % van mensen heeft score kleiner dan 16?
Wat heb je nodig? Z-scores en grafiek met % of tabellen
Z = X-M/SD
o bv. Z = 16- 12/4 = +1
o (soms omkeren: X = M ± Z.SD)
bereken proportie van Z < +1
50% + 34.13% = 84.13%
1.2.Betrouwbaarheidsintervallen berekenen
rond steekproefwaarde interval dat voor 95% (of 99%) zekerheid aangeeft dat populatieparameter
tussen onder- en bovengrens van interval ligt
Wat heb je nodig? SEm = SD/√N + grafiek met % (of tabellen)
formule: M ± Z.SEm
voor 95%-interval: Z = 1.96; voor 99%-interval: Z = 2.58
1
, kwantitatief onderzoek les 3
1.3.Significantie toetsen
er w rond H0 bepaald interval getrokken
Wat heb je nodig voor interpretatie? p-waarden (die in Excel w berekend)
wetenschap is er op gericht theorieën te ontwikkelen
= algemene uitspraken die voor iedereen, dus hele populatie gelden
die uitspraken zijn vooral interessant als het gaat om uitspraken die betrekking hebben op:
o verschillen
tussen gemiddelden
bv. mannen zijn gemiddeld beter in kaartlezen dan vrouwen
tussen proporties
bv. er zijn meer vrouwen dan mannen die kunnen multitasken
o verbanden
bv. naarmate mensen ouder worden, vergeten ze meer
hoe gaan we dat doen? via steekproeftrekking
bv. we laten 100 mannen en 100 vrouwen een kaartlees-test afleggen
o Mmannen is score 18/20
o Mvrouwen is score 14/20
mogen we resultaten van steekproef doortrekken naar populatie?
of is dat gevonden verschil gebaseerd op toeval?
significantietoets
we geven steekproefbevindingen in Excel in, en voeren er significantietoets uit
we krijgen p-waarde
om p-waarde te kunnen interpreteren formuleren we eerst:
nulhypothese (H0): er is geen verschil
o mannen verschillen niet van vrouwen
o H0: mannen - vrouwen = 0
alternatieve Hypothese (H1): er is wel verschil
o mannen kunnen beter kaartlezen dan vrouwen
o H1: mannen - vrouwen > 0
zie falsificatiebeginsel
p-waarde wijst op proportie onder standaardnormaalverdeling
om te bepalen wat ‘extreem’ is, bepalen we rond nulhypothese zone van:
acceptatiegebied = gebied binnen groene zone hier houden we H0 aan en verwerpen we H1
kritieke gebied = gebied buiten groene zone hier verwerpen we H0 en nemen we H1 aan
als p heel klein is (p < .05 of p < 5%) dan is kans dat H0 waar is erg klein H0 verwerpen en H1
aannemen
gevonden steekproefverschil is significant
mag w aangenomen dat er ook in populatie verschil is tussen mannen en vrouwen
als p groter is (p > .10 of p > 5%) dan is kans dat H0 waar is groter H0 aanhouden en H1 verwerpen
gevonden steekproefverschil is op toeval gebaseerd
mag niet w aangenomen dat er ook in populatie verschil is tussen mannen en vrouwen
2
Toetsende statistiek
1. Beschrijvende versus Toetsende Statistiek: herhaling Basis van
Onderzoek
beschrijvende statistiek toetsende statistiek
uitspraken betrekking op steekproef betrekking op populatie
doel Hoe ziet de steekproef eruit? generaliseren
datareductie theorievorming:
verschillen
verbanden
relevante ordeningstechnieken: falsificatiebeginsel: H0 versus
vraagstelling tabellen: FR, CFR, %, … H1
grafieken: cirkel-, staafdiagram, … formuleren van ‘Zijn gevonden
ligging: verschillen of verbanden op
positie/ligging: modus, mediaan, toeval gebaseerd (H0
gemiddelde, percentiel aanhouden) versus significant
spreiding: range, SD, variantie (H0 verwerpen en H1
vorm: kurtosis, scheefheid, normaliteit aannemen)?
relaties (verbanden) tussen variabelen: standaardnormaalverdeling
kruistabellen, relatieve en conditionele uitsluitsel door
proporties (‘distributies’) significantietoetsen
correlaties en regressie
Standaardnormaalverdeling w gebruikt om op 3 soorten vragen
antwoord te bieden:
1.1.Proporties berekenen
je schat hoeveel mensen bepaalde score hebben
bv. cijfers op examen zijn normaalverdeeld met M = 12 en SD = 4.
Hoeveel % van mensen heeft score kleiner dan 16?
Wat heb je nodig? Z-scores en grafiek met % of tabellen
Z = X-M/SD
o bv. Z = 16- 12/4 = +1
o (soms omkeren: X = M ± Z.SD)
bereken proportie van Z < +1
50% + 34.13% = 84.13%
1.2.Betrouwbaarheidsintervallen berekenen
rond steekproefwaarde interval dat voor 95% (of 99%) zekerheid aangeeft dat populatieparameter
tussen onder- en bovengrens van interval ligt
Wat heb je nodig? SEm = SD/√N + grafiek met % (of tabellen)
formule: M ± Z.SEm
voor 95%-interval: Z = 1.96; voor 99%-interval: Z = 2.58
1
, kwantitatief onderzoek les 3
1.3.Significantie toetsen
er w rond H0 bepaald interval getrokken
Wat heb je nodig voor interpretatie? p-waarden (die in Excel w berekend)
wetenschap is er op gericht theorieën te ontwikkelen
= algemene uitspraken die voor iedereen, dus hele populatie gelden
die uitspraken zijn vooral interessant als het gaat om uitspraken die betrekking hebben op:
o verschillen
tussen gemiddelden
bv. mannen zijn gemiddeld beter in kaartlezen dan vrouwen
tussen proporties
bv. er zijn meer vrouwen dan mannen die kunnen multitasken
o verbanden
bv. naarmate mensen ouder worden, vergeten ze meer
hoe gaan we dat doen? via steekproeftrekking
bv. we laten 100 mannen en 100 vrouwen een kaartlees-test afleggen
o Mmannen is score 18/20
o Mvrouwen is score 14/20
mogen we resultaten van steekproef doortrekken naar populatie?
of is dat gevonden verschil gebaseerd op toeval?
significantietoets
we geven steekproefbevindingen in Excel in, en voeren er significantietoets uit
we krijgen p-waarde
om p-waarde te kunnen interpreteren formuleren we eerst:
nulhypothese (H0): er is geen verschil
o mannen verschillen niet van vrouwen
o H0: mannen - vrouwen = 0
alternatieve Hypothese (H1): er is wel verschil
o mannen kunnen beter kaartlezen dan vrouwen
o H1: mannen - vrouwen > 0
zie falsificatiebeginsel
p-waarde wijst op proportie onder standaardnormaalverdeling
om te bepalen wat ‘extreem’ is, bepalen we rond nulhypothese zone van:
acceptatiegebied = gebied binnen groene zone hier houden we H0 aan en verwerpen we H1
kritieke gebied = gebied buiten groene zone hier verwerpen we H0 en nemen we H1 aan
als p heel klein is (p < .05 of p < 5%) dan is kans dat H0 waar is erg klein H0 verwerpen en H1
aannemen
gevonden steekproefverschil is significant
mag w aangenomen dat er ook in populatie verschil is tussen mannen en vrouwen
als p groter is (p > .10 of p > 5%) dan is kans dat H0 waar is groter H0 aanhouden en H1 verwerpen
gevonden steekproefverschil is op toeval gebaseerd
mag niet w aangenomen dat er ook in populatie verschil is tussen mannen en vrouwen
2