ONDERZOEK SAMENHANG TUSSEN KWANTITATIEVE VARI ABELE EN DICHTOME
KWALITATIEVE VARIABELE: T-TOETS
T-TOETS: IDEE
• Histogram van de (gemiddelde) schulden bij
afstuderen op basis van gegevens over de gehele
steekproef
• Opsplitsen naar type universiteit (School) geeft
voorwaardelijke verdelingen van de schulden voor
publieke en private universiteiten afzonderlijk
Wrap up
• Er zijn verschillen tussen de deelsteekproeven, maar aan de getallen is niet te zien of deze verschillen groot
of klein zijn, systematisch of niet-systematisch
• Zelfs als men een verschil van US$ 3529 ’groot’ (of ’klein’) vindt, dan nog zijn er vragen, zoals:
o . . . hoe rekening te houden met de variatie binnen de deelsteekproeven (er zijn zelfs publieke
universiteiten met schulden boven het gemiddelde van de private universiteiten)?
o . . . hoe rekening te houden met het feit dat de gerealiseerde steekproef slechts een van de vele
mogelijke steekproeven is (steekproefvariatie)?
• Er is theorie nodig om antwoord te geven op deze vragen en om de waargenomen uitkomsten te kunnen
interpreteren
, T-TOETS THEORETISCHE ACHTERGROND
ONDERZOEK STATISTISCHE ONAFHANKELIJKHEID
Theoretische achtergrond t -toets
• Het gebruiken van steekproefinformatie om uitspraken te doen over verschillen tussen verwachte
waarden en varianties in de deelpopulaties vereist veronderstellingen over de populatie waaruit de
deelsteekproeven getrokken zijn
• Bij de t-toets wordt verondersteld dat de steekproeven aselect zijn getrokken uit deelpopulaties die
normaal verdeeld zijn met mogelijk verschillende verwachte waarden en varianties.
• Op basis van deze veronderstellingen worden twee t-toetsen ontwikkeld, TS en TP, voor het evalueren van
veronderstelde verschillen tussen populatiegemiddelden en een F-toets (Snedecor-Fisher) voor het
evalueren van veronderstelde verhoudingen van varianties van deelpopulaties.
Onderzoek veronderstelde onafhankelijkheid:
• Onafhankelijkheid betekent dat: f (y |X = 1) = f (y |X = 2) = f (y)
• Onderzoek naar (on-)afhankelijkheid gebeurt door toetsen van de
veronderstelde gelijkheid van gemiddelden en van de veronderstelde
gelijkheid van varianties in de deelpopulaties
• Handhaven van de nulhypothese betekent dat er geen systematische verschillen tussen de
populatieparameters (gemiddelden of varianties) zijn, en dus dat de betrokken variabelen
onafhankelijk verdeeld zijn
VERONDERSTELLINGEN
Veronderstellingen:
• De afhankelijke variabele Y is normaal verdeeld in de onafhankelijke deelpopulaties1 gedefinieerd door de
uitkomsten van X :
YX = i~ n(μi ,σi), i = 1,2
• Uit beide deelpopulaties worden aselect steekproeven getrokken met omvang n1 en n2:
X = 1 : Y1,1,...,Y1,n1
X = 2 : Y2,1,...,Y2,n2
KWALITATIEVE VARIABELE: T-TOETS
T-TOETS: IDEE
• Histogram van de (gemiddelde) schulden bij
afstuderen op basis van gegevens over de gehele
steekproef
• Opsplitsen naar type universiteit (School) geeft
voorwaardelijke verdelingen van de schulden voor
publieke en private universiteiten afzonderlijk
Wrap up
• Er zijn verschillen tussen de deelsteekproeven, maar aan de getallen is niet te zien of deze verschillen groot
of klein zijn, systematisch of niet-systematisch
• Zelfs als men een verschil van US$ 3529 ’groot’ (of ’klein’) vindt, dan nog zijn er vragen, zoals:
o . . . hoe rekening te houden met de variatie binnen de deelsteekproeven (er zijn zelfs publieke
universiteiten met schulden boven het gemiddelde van de private universiteiten)?
o . . . hoe rekening te houden met het feit dat de gerealiseerde steekproef slechts een van de vele
mogelijke steekproeven is (steekproefvariatie)?
• Er is theorie nodig om antwoord te geven op deze vragen en om de waargenomen uitkomsten te kunnen
interpreteren
, T-TOETS THEORETISCHE ACHTERGROND
ONDERZOEK STATISTISCHE ONAFHANKELIJKHEID
Theoretische achtergrond t -toets
• Het gebruiken van steekproefinformatie om uitspraken te doen over verschillen tussen verwachte
waarden en varianties in de deelpopulaties vereist veronderstellingen over de populatie waaruit de
deelsteekproeven getrokken zijn
• Bij de t-toets wordt verondersteld dat de steekproeven aselect zijn getrokken uit deelpopulaties die
normaal verdeeld zijn met mogelijk verschillende verwachte waarden en varianties.
• Op basis van deze veronderstellingen worden twee t-toetsen ontwikkeld, TS en TP, voor het evalueren van
veronderstelde verschillen tussen populatiegemiddelden en een F-toets (Snedecor-Fisher) voor het
evalueren van veronderstelde verhoudingen van varianties van deelpopulaties.
Onderzoek veronderstelde onafhankelijkheid:
• Onafhankelijkheid betekent dat: f (y |X = 1) = f (y |X = 2) = f (y)
• Onderzoek naar (on-)afhankelijkheid gebeurt door toetsen van de
veronderstelde gelijkheid van gemiddelden en van de veronderstelde
gelijkheid van varianties in de deelpopulaties
• Handhaven van de nulhypothese betekent dat er geen systematische verschillen tussen de
populatieparameters (gemiddelden of varianties) zijn, en dus dat de betrokken variabelen
onafhankelijk verdeeld zijn
VERONDERSTELLINGEN
Veronderstellingen:
• De afhankelijke variabele Y is normaal verdeeld in de onafhankelijke deelpopulaties1 gedefinieerd door de
uitkomsten van X :
YX = i~ n(μi ,σi), i = 1,2
• Uit beide deelpopulaties worden aselect steekproeven getrokken met omvang n1 en n2:
X = 1 : Y1,1,...,Y1,n1
X = 2 : Y2,1,...,Y2,n2