onderwerpen:
- general linear model
- toetsen van het gemiddelde (Y)
- Toetsen van verschil tussen gemiddelden van twee groepen (F)
- Toetsen van invloed van X (interval) op Y
- Toets voor vergelijken twee groepen (F) gecorrigeerd voor X op Y
- Toets voor interactie-effect F*X op Y
gebruikt voorbeeld:
Vijf onderzoeksvragen over de lichaamslengte van Nederlandse middelbare scholieren
1) Is de gemiddelde lengte 170 cm?
→ one-sample t-test voor toetsen van één gemiddelde
2) Wat is het lengteverschil tussen jongens en meisjes?
→ independent samples t-test voor toetsen verschil twee gemiddelden
3) Wat is het groeitempo per maand?
→ regressieanalyse voor het toetsen van invloed X op Y (enkelvoudig bij één
onafhankelijke variabele, meervoudig bij meerdere onafhankelijke variabelen)
4) Wat is het lengteverschil tussen jongens en meisjes na correctie voor leeftijd?
→ ANCOVA voor toetsen verschil gemiddelden gecorrigeerd voor covariaat
(onder de assumptie dat het groeitempo hetzelfde is voor jongens en meisjes)
5) Is het groeitempo hetzelfde voor jongens en meisjes?
→ ANCOVA met interactie voor toetsen van homogene regressielijnen
al deze technieken zijn bijzondere gevallen van het General Linear Model (GLM)
- Steekproef 100 scholieren (n = 100)
● 50 jongens, 50 meisjes
● leeftijd 12 tot 18 jaar
- Variabelen (meetniveau)
● Afhankelijke variabele: lengte in centimeters (ratio)
● Onafhankelijke variabelen:
➢ Groepsvariabele (F): geslacht, met 1 = jongen en 2 = meisje
(nominaal/dichotoom)
➢ Interval variabele X: leeftijd, gemeten in maanden (ratio)
One-sample t-test
- onderzoeksvraag 1: Is de gemiddelde lengte 170 cm?
- nulhypothese toetsing:
1) formuleer de nulhypothese en stel significantieniveau alfa vast
, 2) bereken toetsingsgrootheid en bepaal de overschrijdingskans p, en bereken
het betrouwbaarheidsinterval
● toetsingsgrootheid: is getal gebaseerd op dat wat we hebben
gevonden in de steekproef (z, t, etc; hebben een
steekproevenverdeling)
3) beslissing:
● als p > alfa, dan H0 niet verwerpen en als p ≤ α, dan H0 verwerpen
● als testwaarde (test value) binnen passende
betrouwbaarheidsinterval, dan H0 niet verwerpen en als testwaarde
buiten passende betrouwbaarheidsinterval, dan H0 verwerpen
- nulhypotese, significantieniveau
● H0: populatiegemiddelde μ - μ0 = 0
● H1: μ - μ0 ≠ 0
➢ ongerichte alternatieve hypothese -> tweezijdige toetsing
● significantieniveau α
- standaardfout SE en toetsingsgrootheid t
● SE: spreiding rondom het gemiddelde steekproefgemiddelde bij herhaaldelijk
steekproeftrekken
● SD: spreiding rondom steekproefgemiddelde binnen één steekproef
● t = verschil gerelateerd aan steekproefgemiddelden (zie hc)
- betrouwbaarheidsinterval:
● het werkelijke verschil tussen de testwaarde (gevonden waarde) en het
populatiegemiddelde ligt, op basis van de steekproefgegevens, met een
betrouwbaarheid van 95% tussen … en …
● als 0 er niet tussen ligt, verwerp dan H0 (significant)
● voor een gerealiseerd 95% BI geldt dat het met 95% betrouwbaarheid het
werkelijke verschil tussen de testwaarde en het populatiegemiddelde bevat
,toets voor gemiddelde in GLM
regressiemodel in GLM
- regrressievergelijking
-
- b0 is de gemiddelde lengte in de steekproef
ANOVA tabel
- intercept wijkt significant af van 0, F = 33377.5, p < 0,001
, Regressiecoëfficiënten (parameter estimates)
Verschil tussen groepen:
- onderzoeksvraag 2: wat is het lengteverschil tussen jongens en meisjes?
- H0: μjongens - μmeisjes = 0
- assumptie t-toets: homogene variantie
● nulhypothese: variantie lengte is gelijk in beide populaties
● H0: σ²jongens = σ²meisjes
●
● variantie = standaardafwijking in het kwadraat
- Levene’s test:
●
● geeft gelijke variantie aan (=assumptie voor t-toets)