Aantekeningen hoorcolleges inferentiële statistiek 2
College 6 non-parametrische toetsen
- Non parametrische toetsen→ bij variabelen met een categorisch meet niveau
Toets op een frequentieverdeling
- Toetsen of een geobserveerde frequentie overeenkomt met de verwachtingen in de
populatie→ is er een significant verschil
- Nulhypothese→ relatieve aandeel in de populatie→ frequenties opvatten als het
aandeel in de populatie
o Rekening houden met meerdere proporties
- Twee nulhypotheses
o H0: π1=π2=πk→ alle categorieën zijn even groot
o H0: π1=0,28 π2= 0,34 → je kent de aandelen in de populatie en onderzoekt of
je in je steekproef dezelfde aandelen vind. Toetsen op representativiteit
o H1: H0 is niet waar
- Als H0 waar is dan komen de proporties in de steekproef overeen met de populatie
Toetsingsgrootheid
- Chikwadraat χ2
o Fo→ observed→ welk aantal is waargenomen in de steekproef
o Fe→ expected→ welk aantal wordt verwacht→ op basis van H0
- Hoe groter het verschil is tussen fo en fe→ hoe eerder H0 wordt verworpen
- Hoe hoger de waarde van χ2 → hoe eerder verwerpen H0
- Als er de geobserveerde waarde lager is dan het verwachte aantal dan is er sprake van
ondervertegenwoordiging
- Fe berekenen→ proportie H0 * aantal in de steekproef
- χ2 is altijd een positief getal→ altijd boven de 0
o In de formule worden negatieve getallen gekwadrateerd→ zo – opheffen
o Het maakt voor de formule dus niet uit in welke richting het verschil is
- De verdeling is asymmetrisch omdat de waarde niet onder de 0 kan zijn
- Hoe meer de fo afwijkt van de fe zowel positief als negatief→ hoe hoger χ2
- Verwerping zit in de rechterstaart van de verdeling maar wordt als tweezijdig gezien
- Alle waarde die links in de verdeling zitten zijn niet interessant→ waarden dichtbij de
0. F0 verschilt weinig van fe. De waarden zijn niet significant.
- Zijdigheid van de toets alleen relevant bij twee categorieën
o Groeit of krimpt de categorie vergeleken de andere→ tweezijdig
o Groeit de categorie vergeleken de andere→ eenzijdig
Vrijheidsgraden
1
College 6 non-parametrische toetsen
- Non parametrische toetsen→ bij variabelen met een categorisch meet niveau
Toets op een frequentieverdeling
- Toetsen of een geobserveerde frequentie overeenkomt met de verwachtingen in de
populatie→ is er een significant verschil
- Nulhypothese→ relatieve aandeel in de populatie→ frequenties opvatten als het
aandeel in de populatie
o Rekening houden met meerdere proporties
- Twee nulhypotheses
o H0: π1=π2=πk→ alle categorieën zijn even groot
o H0: π1=0,28 π2= 0,34 → je kent de aandelen in de populatie en onderzoekt of
je in je steekproef dezelfde aandelen vind. Toetsen op representativiteit
o H1: H0 is niet waar
- Als H0 waar is dan komen de proporties in de steekproef overeen met de populatie
Toetsingsgrootheid
- Chikwadraat χ2
o Fo→ observed→ welk aantal is waargenomen in de steekproef
o Fe→ expected→ welk aantal wordt verwacht→ op basis van H0
- Hoe groter het verschil is tussen fo en fe→ hoe eerder H0 wordt verworpen
- Hoe hoger de waarde van χ2 → hoe eerder verwerpen H0
- Als er de geobserveerde waarde lager is dan het verwachte aantal dan is er sprake van
ondervertegenwoordiging
- Fe berekenen→ proportie H0 * aantal in de steekproef
- χ2 is altijd een positief getal→ altijd boven de 0
o In de formule worden negatieve getallen gekwadrateerd→ zo – opheffen
o Het maakt voor de formule dus niet uit in welke richting het verschil is
- De verdeling is asymmetrisch omdat de waarde niet onder de 0 kan zijn
- Hoe meer de fo afwijkt van de fe zowel positief als negatief→ hoe hoger χ2
- Verwerping zit in de rechterstaart van de verdeling maar wordt als tweezijdig gezien
- Alle waarde die links in de verdeling zitten zijn niet interessant→ waarden dichtbij de
0. F0 verschilt weinig van fe. De waarden zijn niet significant.
- Zijdigheid van de toets alleen relevant bij twee categorieën
o Groeit of krimpt de categorie vergeleken de andere→ tweezijdig
o Groeit de categorie vergeleken de andere→ eenzijdig
Vrijheidsgraden
1