Week 1:
HC 1: Steekproevenverdelingen en hypothesetoetsing
Toetsende statistiek gaat over het uitspraken doen over een populatie, gebaseerd op een steekproef.
Dit begint altijd met het opstellen van een hypothese. Je gaat onderzoeken aan de hand van bepaalde
toetsen of de hypothese verworpen kan worden of niet.
Hypothese= een uitspraak over parameters in de populatie.
→ Een hypothese gaat dus nooit over parameters uit de steekproef, je gebruikt de steekproef om iets te
zeggen over de hypothese obv de populatie.
Voor populatie parameters worden altijd Griekse letters gebruikt; gemiddelde=mu.
Hypothese vorming gaat aan de hand van twee soorten hypothesen:
1. Nulhypothese= er is ‘niet aan de hand’ in de populatie. Er is geen verandering, verschil of relatie.
2. Alternatieve hypothese= er is ‘wel iets aan de hand’ in de populatie; een verandering, verschil of
relatie.
→ De alternatieve hypothese is vaak je verwachting als je aan onderzoek begint.
Soorten alternatieve hypothesen:
- Eenzijdig: je hebt een nulhypothese en de alternatieve hypothese zegt iets over 1 kant van de
verdeling t.o.v. de nulhypothese.
o Rechts: zegt iets over de rechter kant (hogere scores)
VB: H0: mu=7, Ha: mu>7
o Links: zegt iets over de linker kant (lagere scores)
VB: H0: mu=7, Ha: mu<7
- Tweezijdig: je hebt een nulhypothese en de alternatieve hypothese zegt iets over twee kanten van
de verdeling t.o.v. de nulhypothese.
VB: H0: mu=7, Ha: mu=/7 → Hier zeg je dus dat mu hoger of lager kan zijn dan 7; dus tweezijdig.
Bij toetsende statistiek stel je jezelf een vraag, maar je vraagt je ook af hoe zeker je jouw gevonden
resultaten zijn. Met hoeveel zekerheid kan je een bepaalde conclusie trekken; het gaat om kansen en
(on)zekerheid.
→ Hoe kan je weten of een bepaalde bevinding wel of geen toeval is; P-waarde en steekproevenverdeling.
Steekproevenverdeling= een verdeling van een statistiek verkregen uit alle mogelijke steekproeven van een
bepaalde grootte (n) uit een populatie.
Met een steekproevenverdeling bepaal je hoeveel random variatie je kan verwachten, vervolgens kan je de
variatie van jouw eigen steekproef hiermee vergelijken.
Een steekproeven verdeling is eveneens gebaseerd op de ‘normale’ populatie. Je kijkt als het ware naar
allerlei steekproeven uit de normale populatie, met dezelfde grootte als jouw eigen steekproef.
Hoe groter de steekproef hoe dichter de statistieken uit de steekproef bij de statistieken van de populatie
zullen liggen. De breedte van de steekproevenverdeling hangt dus af van de grootte van de steekproeven;
als je kleine steekproeven hebt is de kans groter dat die meer verschillen van de populatie. Daardoor krijg je
een bredere verdeling.
,Steekproefverdeling= de verdeling van waarden binnen een steekproef.
→ Hier gaat het dus om de individuen binnen jouw steekproef, die ga je hier plotten in een verdeling (in
plaats van dat je verschillende steekproeven gaat plotten in een verdeling).
De steekproevenverdeling wordt gebruikt voor hypothesetoetsing.
Hypothesetoetsen= een statistische methode om uit steekproefdata een uitspraak te doen over een
nulhypothese.
Je gaat kijken hoe uitzonderlijk jouw steekproef is aan de hand van de steekproevenverdeling.
Je gaat berekenen wat de kans is op jouw steekproefstatistiek:
1. Je kijkt naar jouw statistiek op de steekproevenverdeling en telt handmatig hoeveel steekproeven er
dezelfde statistiek hebben of hoger.
2. Dit aantal steekproeven deel je door het totaal aantal steekproeven in de verdeling.
3. Dit geeft de kans dat op jouw steekproefstatistiek of hoger in de ‘normale populatie’.
→ Dit kan je ook wel formuleren als: de kans om door toeval jouw statistiek of hoger te krijgen. Dit
noem je de P-waarde.
P-waarde= de kans op deze of een extremere toets statistiek, als in werkelijkheid de nulhypothese waar is.
Normaal gesproken heb je toets statistieken, dit is anders dan bijvoorbeeld een gemiddelde. Van deze toets
statistieken is de verdeling te berekenen zonder in de populatie allerlei steekproeven te moeten trekken. Je
berekend een toets statistiek aan de hand van jouw eigen steekproef en kan deze vervolgens vergelijken met
de populatie aan de hand van de verdeling die berekend is.
Een lagere p-waarde→ meer bewijs tegen de nul hypothese:
Als de p-waarde erg laag is dan is de data onwaarschijnlijk als de nulhypothese waar zou zijn. Daarom is de
nulhypothese waarschijnlijk onjuist en wil je die verwerpen.
Je weet of een p-waarde laag genoeg is om de H0 te verwerpen door een significantie niveau (alpha)=0.05.
Dit is een niveau wat gekozen wordt; over het algemeen wordt 0.05 gebruikt als alpha.
In de natuurkunde kunnen dingen heel exact gemeten worden, daardoor gebruiken ze daar nog wel eens
een veel lagere alpha. Ze kunnen daar dus strenger naar de p-waarde kijken omdat ze zo exact bezig zijn.
Maar dit verschilt dus per vakgebied.
P-waarde<=alpha→ H0 verwerpen.
Zo geeft alpha dus een verwerpingsgebied; je kan een lijn trekken op het punt in de steekproevenverdeling
waar de kans 0.05 is. Alles boven deze lijn heeft dus een kans kleiner dan 0.05 en zorgt dus voor een
verwerping van H0; het ligt dan namelijk in het verwerpingsgebied.
Steeproefgemiddelde>=steekproefgemiddelde wat bij alpha hoort (grens verwerpingsgebied)→ H0
verwerpen.
Er zijn dus twee manieren om er naar te kijken:
1. P-waarde berekenen en met alpha vergelijken:
P-waarde<=alpha→ H0 verwerpen.
2. De statistiek die bij alpha hoort bepalen adhv. De verdeling en vervolgens jouw statistiek hiermee
vergelijken.
Steeproefgemiddelde>=steekproefgemiddelde wat bij alpha hoort (grens verwerpingsgebied)→ H0
verwerpen.
,Onderzoekers presenteren altijd de volgende zaken:
- Het gekozen significantie niveau alpha
- De gevonden p-waarde en de beslissing over de nulhypothese; verwerpen of niet.
→ Hoe lager de p-waarde hoe sterker het bewijs.
Bij tweezijdige alternatieve hypotheses ga je de p-waarde op een andere maner berekenen. Een tweezijdige
alternatieve hypothese wordt meestal gebruikt want:
- Soms heeft de onderzoeker geen eenzijdige verwachting in een bepaalde richting.
- Ook al is er een eenzijdige verwachting, je wilt ook gevoelig zijn voor een effect de andere kant op.
Je kan namelijk niet je nulhypothese verwerpen als die eenzijdig is wanneer je dan een effect de
andere kant op vind dan dat je verwacht had. Dan kan je niet je nulhypothese verwerpen terwijl je
weldegelijk een verschil hebt gevonden.
- Voor sommige toetsen kun je geen eenzijdige hypothese opstellen.
- Tweezijdige hypothese gaat post hoc hypothesevorming tegen.
Bij eenzijdig toetsen zal je sneller een statistisch significant resultaat vinden; je hebt meer power.
De p-waarde is dus de kans op deze of een extremere toets statistiek, als in werkelijkheid de nulhypothese
waar is. Deze extremere toets statistiek kan zowel links als rechts gevonden worden. Bij een tweezijdige
hypothese ga je dus deze beiden kansen uitrekenen, voor zowel als rechts.
De alpha is nu verdeeld over beide zijdes; aan beide kanten 0.025.
→ De kritieke waarde schuift dan dus ook op (de grenswaarde van het verwerpingsgebied). Je het nu een
nog extremer resultaat nodig om te spreken van een statistisch significant resultaat.
Je gaat de p-waarde nu eigenlijk op dezelfde manier berekenen maar dan met twee kanten. Je krijgt
bijvoorbeeld een bepaalde score en dan kijk je aan de andere kant naar een score die net zo ver van de
nulhypothese af ligt. Die twee kanten hebben dus een bepaalde kans en de p-waarde is die kans opgeteld.
Je kan fouten maken bij hypotheses verwerpen omdat je steekproef random is, er zit dus altijd een verschil
met de populatie en dit geeft ruimte voor fouten.
Soorten fouten bij hypothese verwerpen:
1. Type 1:
Je verwerpt een nulhypothese die eigenlijk waar is.
→ De kans op dit type fout is alpha; 0.05
2. Type 2:
Je verwerpt een nulhypothese niet terwijl hij wel onjuist is.
→ De kans op dit type fout is beta; we weten niet hoe groot deze kans is. Hangt bv af van:
- Steekproefgrootte; hoe groter hoe kleiner de kans.
Statistische significantie zegt iets over de zekerheid dat het effect bestaat, niet over hoe groot dit effect is.
Hoe praktisch significant of relevant een effect is bepaal je door te kijken naar de grootte van het effect
(=effect grootte).
, Stappen in hypothesetoetsing:
1. Opstellen van hypothese:
Combinatie van H0 en Ha; over de populatie.
2. Steekproevenverdeling:
Verdeling van de toetsstatistiek onder de veronderstelling dat H0 waar is.
3. Toetsstatistiek:
De steekproefstatistiek uit de verdeling gebruiken om je eigen gevonden toetsstatistiek mee te
vergelijken.
4. P-waarde:
Berekenen en vergelijken met alpha.
5. Statistische conclusie
H0 verwerpen of niet.
6. Inhoudelijke conclusie
Beantwoord de onderzoeksvraag.
Voorbeeld tentamenvraag:
Antwoord:
D: het gebruikt het populatie symbool en geeft een tweezijdige alternatieve hypothese. Dit is het meest
gebruikelijk in onderzoek.