GRASPLE-theorie en output-interpretaties
Practicum 1: Herhaling kwantitatieve analysetechnieken
Meetniveaus variabelen
Categorische variabelen
Nominaal: de data kunnen alleen worden gecategoriseerd, zonder duidelijke rangorde.
o Geboorteplaats, Gender, Etniciteit, Automerken, Geloofsovertuiging
Dichotoom: nominaal meetniveau met slechts twee categorieën
o Geslacht (m/v), kop of munt
Ordinaal: de data kunnen worden gecategoriseerd en er is sprake van een duidelijke
rangorde.
o Top tien bestsellers (boeken), Taalvaardigheid (zoals laag, gemiddeld, hoog),
Likertschaal-vragen,
Continue variabelen
Interval: de data kunnen worden gecategoriseerd, er is sprake van een rangorde en de
intervallen tussen de categorieën zijn gelijk (bijvoorbeeld steeds een stap van 10).
o Toets scores (zoals die van examens), Scores op een persoonlijkheidstest,
Temperatuur in Fahrenheit of graden Celsius
Ratio: de data kunnen worden gecategoriseerd, er is sprake van een rangorde, de
intervallen tussen de categorieën zijn gelijk en er is een betekenisvol nulpunt.
o Lengte, Leeftijd, Gewicht, Temperatuur in Kelvin
One sample t-test
= Een statistische test die wordt gebruikt om te bepalen of het gemiddelde van een steekproef
significant verschilt van een bekende of verwachte populatiewaarde. De afhankelijke variabele
moet op continu meetniveau zijn.
Toetst of het steekproefgemiddelde significant afwijkt van een populatiegemiddelde
(μ0)
Gebruikt een t-verdeling
De nulhypothese (H0) stelt dat er geen verschil is: H0: μ = μ0
De alternatieve hypothese (HA) stelt dat er wel een verschil is:
o HA: μ ≠ μ0 (tweezijdig)
o HA: μ > μ0 of HA: μ < μ0 (eenzijdig)
Met de p-waarde beoordeel je of het verschil statistisch significant is
,Descriptives statistics:
Mean: Gemiddelde variabele X
Minimum en maximum
Standaardafwijking: De maat voor de spreiding van de scores op variabelen
One-sample t-test output:
Mean-difference: dit is het verschil tussen het gevonden gemiddelde (7,539) en de
testwaarde (7,6). Deze testwaarde is het gemiddelde zoals gebruikt in de nulhypothese.
95% confidence interval: Het betrouwbaarheidsinterval voor het verschil tussen de
testwaarde en het geobserveerde steekproefgemiddelde, [-0.191, 0.068].
o Ondergrens: 7,6 – 0.191
o Bovengrens: 7,6 + 0.068
t-waarde: -0.935 en Sig. (p-waarde): 0.351. De p-waarde geeft de kans op een t-waarde
die net zover of verder afligt van 0 als de gevonden t-waarde als de nulhypothese waar
is. Dus dit betekent: als het gemiddelde in de populatie echt 7.6 is, dan is de kans om
een t-waarde te vinden die kleiner is dan –0.935 of groter is dan 0.935 gelijk aan 0.351
Overall conclusie: De p-waarde (.351) is groter dan α (.05). We verwerpen de nulhypothese
niet. Nul zit in het 95%- betrouwbaarheidsinterval en dat betekent dat het verschil tussen het
gevonden gemiddelde (7.539) en de nulhypothese (7.6) niet significant verschilt van 0.
Inhoudelijk kunnen we zeggen dat het gemiddelde cijfer van dit jaar niet significant afwijkt van
7.6
,Independent samples t-test
= Een statistische test die vergelijkt of het gemiddelde van twee onafhankelijke groepen
significant van elkaar verschillen. De afhankelijke variabele moet continu zijn, en de
onafhankelijke variabele categorisch.
Je vergelijkt hierbij de gemiddelden van twee aparte groepen (mannen versus vrouwen
of testgroep versus controlegroep)
Gebruikt de t-verdeling en houdt rekening van variantieverschillen tussen de groepen
o Levene's test controleert op homoscedastisciteit
De nulhypothese (H0) stelt dat er geen verschil is tussen de groepen: H0: μ1 = μ2
De alternatieve hypothese (HA) stelt dat er wel een verschil is tussen de groepen:
o HA: μ1 ≠ μ2 (tweezijdig)
o HA: μ1 > μ2 of HA: μ1 < μ2 (eenzijdig)
Met de p-waarde beoordeel je of het verschil tussen de groepen statistisch significant is
Group statistics:
Mean: gemiddelde beide groepen
Std. Deviation; Standaarfafwijking: De maat voor de spreiding van de scores op
variabelen binnen de groepen, in dit geval het variabele cijfer
Std. Error mean; Standaardfout: De maat voor spreiding van de gemiddelde cijfers
binnen de groepen. Dit wil zeggen: Stel je zou het onderzoek heel vaak herhalen en elke
keer het gemiddelde van de twee groepen uitrekenen. Deze gemiddelden zullen telkens
net iets anders zijn en vormen een verdeling. De standaardfout is een maat voor de
spreiding van al deze gemiddelden (steekproefgemiddelden).
o
, Independent samples t-test output:
Levene's test: Controleert of de varianties van de twee groepen gelijk zijn, ofwel:
homogeniteit van varianties. Dit is belangrijk omdat een van de assumpties voor een t-
test homoscedasticiteit is (gelijke variantie binnen beide groepen)
o Significant resultaat = spreiding tussen de twee groepen verschilt significant van
elkaar --> equal variances not assumed
o Niet significant resultaat = spreiding tussen de twee groepen verschilt niet
significant van elkaar --> equal variances assumed
Std. Error difference; standaardfout van het verschil: is een maat voor spreiding in het
verschil tussen de gemiddelden van groep A en B.
t-waarde en sig. (p-waarde): De t-waarde geeft aan dat het verschil tussen de
gemiddelden van A en B ongeveer 7,5 standaardfouten bedraagt. De significantie van dit
verschil is af te lezen aan de p-waarde.
o
95% confidence interval: Als we het onderzoek oneindig vaak zouden herhalen en
telkens het betrouwbaarheidsinterval zouden berekenen, dan zou 95% van die
betrouwbaarheidsintervallen het werkelijke verschil in gemiddelden omvatten. De 0 zit
niet in dit interval, want dat loopt van -1.1 tot -0.6. Dit betekent dat de twee groepen
waarschijnlijk verschillen in gemiddeld cijfer.
Overall conclusie: De nulhypothese is dat het verschil in de populatiegemiddelden van A en B
gelijk is aan nul (H0: μ1 = μ2) De p-waarde (𝑝 < .001) geeft aan hoe waarschijnlijk de
nulhypothese is. Aangezien de p-waarde kleiner is dan α = .05, verwerpen we de nulhypothese
en concluderen we dat lesmethode B significant hoger scoort dan lesmethode A.
Practicum 1: Herhaling kwantitatieve analysetechnieken
Meetniveaus variabelen
Categorische variabelen
Nominaal: de data kunnen alleen worden gecategoriseerd, zonder duidelijke rangorde.
o Geboorteplaats, Gender, Etniciteit, Automerken, Geloofsovertuiging
Dichotoom: nominaal meetniveau met slechts twee categorieën
o Geslacht (m/v), kop of munt
Ordinaal: de data kunnen worden gecategoriseerd en er is sprake van een duidelijke
rangorde.
o Top tien bestsellers (boeken), Taalvaardigheid (zoals laag, gemiddeld, hoog),
Likertschaal-vragen,
Continue variabelen
Interval: de data kunnen worden gecategoriseerd, er is sprake van een rangorde en de
intervallen tussen de categorieën zijn gelijk (bijvoorbeeld steeds een stap van 10).
o Toets scores (zoals die van examens), Scores op een persoonlijkheidstest,
Temperatuur in Fahrenheit of graden Celsius
Ratio: de data kunnen worden gecategoriseerd, er is sprake van een rangorde, de
intervallen tussen de categorieën zijn gelijk en er is een betekenisvol nulpunt.
o Lengte, Leeftijd, Gewicht, Temperatuur in Kelvin
One sample t-test
= Een statistische test die wordt gebruikt om te bepalen of het gemiddelde van een steekproef
significant verschilt van een bekende of verwachte populatiewaarde. De afhankelijke variabele
moet op continu meetniveau zijn.
Toetst of het steekproefgemiddelde significant afwijkt van een populatiegemiddelde
(μ0)
Gebruikt een t-verdeling
De nulhypothese (H0) stelt dat er geen verschil is: H0: μ = μ0
De alternatieve hypothese (HA) stelt dat er wel een verschil is:
o HA: μ ≠ μ0 (tweezijdig)
o HA: μ > μ0 of HA: μ < μ0 (eenzijdig)
Met de p-waarde beoordeel je of het verschil statistisch significant is
,Descriptives statistics:
Mean: Gemiddelde variabele X
Minimum en maximum
Standaardafwijking: De maat voor de spreiding van de scores op variabelen
One-sample t-test output:
Mean-difference: dit is het verschil tussen het gevonden gemiddelde (7,539) en de
testwaarde (7,6). Deze testwaarde is het gemiddelde zoals gebruikt in de nulhypothese.
95% confidence interval: Het betrouwbaarheidsinterval voor het verschil tussen de
testwaarde en het geobserveerde steekproefgemiddelde, [-0.191, 0.068].
o Ondergrens: 7,6 – 0.191
o Bovengrens: 7,6 + 0.068
t-waarde: -0.935 en Sig. (p-waarde): 0.351. De p-waarde geeft de kans op een t-waarde
die net zover of verder afligt van 0 als de gevonden t-waarde als de nulhypothese waar
is. Dus dit betekent: als het gemiddelde in de populatie echt 7.6 is, dan is de kans om
een t-waarde te vinden die kleiner is dan –0.935 of groter is dan 0.935 gelijk aan 0.351
Overall conclusie: De p-waarde (.351) is groter dan α (.05). We verwerpen de nulhypothese
niet. Nul zit in het 95%- betrouwbaarheidsinterval en dat betekent dat het verschil tussen het
gevonden gemiddelde (7.539) en de nulhypothese (7.6) niet significant verschilt van 0.
Inhoudelijk kunnen we zeggen dat het gemiddelde cijfer van dit jaar niet significant afwijkt van
7.6
,Independent samples t-test
= Een statistische test die vergelijkt of het gemiddelde van twee onafhankelijke groepen
significant van elkaar verschillen. De afhankelijke variabele moet continu zijn, en de
onafhankelijke variabele categorisch.
Je vergelijkt hierbij de gemiddelden van twee aparte groepen (mannen versus vrouwen
of testgroep versus controlegroep)
Gebruikt de t-verdeling en houdt rekening van variantieverschillen tussen de groepen
o Levene's test controleert op homoscedastisciteit
De nulhypothese (H0) stelt dat er geen verschil is tussen de groepen: H0: μ1 = μ2
De alternatieve hypothese (HA) stelt dat er wel een verschil is tussen de groepen:
o HA: μ1 ≠ μ2 (tweezijdig)
o HA: μ1 > μ2 of HA: μ1 < μ2 (eenzijdig)
Met de p-waarde beoordeel je of het verschil tussen de groepen statistisch significant is
Group statistics:
Mean: gemiddelde beide groepen
Std. Deviation; Standaarfafwijking: De maat voor de spreiding van de scores op
variabelen binnen de groepen, in dit geval het variabele cijfer
Std. Error mean; Standaardfout: De maat voor spreiding van de gemiddelde cijfers
binnen de groepen. Dit wil zeggen: Stel je zou het onderzoek heel vaak herhalen en elke
keer het gemiddelde van de twee groepen uitrekenen. Deze gemiddelden zullen telkens
net iets anders zijn en vormen een verdeling. De standaardfout is een maat voor de
spreiding van al deze gemiddelden (steekproefgemiddelden).
o
, Independent samples t-test output:
Levene's test: Controleert of de varianties van de twee groepen gelijk zijn, ofwel:
homogeniteit van varianties. Dit is belangrijk omdat een van de assumpties voor een t-
test homoscedasticiteit is (gelijke variantie binnen beide groepen)
o Significant resultaat = spreiding tussen de twee groepen verschilt significant van
elkaar --> equal variances not assumed
o Niet significant resultaat = spreiding tussen de twee groepen verschilt niet
significant van elkaar --> equal variances assumed
Std. Error difference; standaardfout van het verschil: is een maat voor spreiding in het
verschil tussen de gemiddelden van groep A en B.
t-waarde en sig. (p-waarde): De t-waarde geeft aan dat het verschil tussen de
gemiddelden van A en B ongeveer 7,5 standaardfouten bedraagt. De significantie van dit
verschil is af te lezen aan de p-waarde.
o
95% confidence interval: Als we het onderzoek oneindig vaak zouden herhalen en
telkens het betrouwbaarheidsinterval zouden berekenen, dan zou 95% van die
betrouwbaarheidsintervallen het werkelijke verschil in gemiddelden omvatten. De 0 zit
niet in dit interval, want dat loopt van -1.1 tot -0.6. Dit betekent dat de twee groepen
waarschijnlijk verschillen in gemiddeld cijfer.
Overall conclusie: De nulhypothese is dat het verschil in de populatiegemiddelden van A en B
gelijk is aan nul (H0: μ1 = μ2) De p-waarde (𝑝 < .001) geeft aan hoe waarschijnlijk de
nulhypothese is. Aangezien de p-waarde kleiner is dan α = .05, verwerpen we de nulhypothese
en concluderen we dat lesmethode B significant hoger scoort dan lesmethode A.