Hoofdstuk 8 – Inference for proportions
Toetsen: idee toetsen in nulhypothese. Je kiest de verdeling die de nulhypothese aangeeft (waarden
verassend of niet). Er zijn range waarden die aannemelijk zijn. Je trekt een grens, waarden die
daarbuiten liggen zijn onaannemelijk. Onaannemelijk is verwerpen de nulhypothese.
Statistische schatting
Gemiddelden
Verschillen in gemiddelden
Twee groepen met dezelfde gemiddelden in de populatie, niet dezelfde gemiddelden in de
steekproef die je trekt want je hebt te maken met steekproefvariantie. (Steekproeven zijn zelden
gelijk aan elkaar) → Er zal vaker een klein verschil zijn in steekproefgemiddelden of extreme
gevonden waarden.
H0 = er is GEEN verschil (beide groepen zijn gelijk. OF het gemiddelde is gelijk aan 0.
→ Hoe verder van de nulhypothese (0) hoe groter het verschil.
Verdeling van type scores
1. Teken de normale verdeling zoals de Nulhypothese zou kloppen (gemiddelde 0 , geen
verschil).
a. Individuele steekproef scores
Sluit de data aan bij de Nulhypothese is het niet verassend en niet onaannemelijk en klopt de
hypothese → Niet verwerpen.
Sluit de data niet aan bij de Nulhypothese is het verassend en groter verschil met vaker
uitvoeren → Nulhypothese verwerpen.
b. De populatie scores
Wat we vinden sluit aan bij de paramater van de verdeling van de populatie. Je wilt iets
zeggen over de populatie op basis van de steekproef.
Je kijkt NIET naar de individuele scores van de steekproef.
c. Iets anders
Kiezen van referentieverdeling (= verdeling paramater waarin we geïnteresseerd zijn onder de
nulhypothese).
Voorbeeld: Het verschil in gemiddelde → steekproef groep 1 en 2 en verschil berekenen. Dit doe je
steeds meer en hier maak je frequentieberekening van. Kost te veel tijd.
Dit doe je met Centrummaat of maat van spreiding
- Centrummaat
Het gemiddelde van de verdeling (het gemiddelde is de waarde
van de Nulhypothese)
- Maat van spreiding
Hoeveel variantie zit er in de populatie op basis van 1
steekproef? Dit kan om te bepalen hoe de verdeling eruit komt
te zien.
1
, De breedte van de steekproevenverdeling is gelijk aan de standaarddeviatie : de wortel van
je steekproefomvang.
Formule >
Standaarderror (breedte) SD populatie : wortel van de steekproeven.
Stappen die je zet
1)Nulhypothese
2)Nulhypothese omzetten in de referentieverdeling (welke waarden zijn aannemelijk en welke niet)
3)Je kiest een grenswaarde (als het extremer wordt dan … in de Nulhypothese ga ik hierbij de
Nulhypothese verwerpen). Te onaannemelijk.
Grenswaarden: 5% of minder (reden om H0 te verwerpen). Welke z-waarde hoort bij
2,5%/2,5% met het gemiddelde en de standaarddeviatie kan omgezet worden in de verassende
score. Om de H0 te verwerpen of niet.
Z-waarde formule > z = X – u : SD
--
Welke range aan waardes voor verschil in gemiddelde in populaties zijn aannemelijk?
Stappen die je zet
1)Nulhypothese
2) Nulhypothese omzetten in referentieverdeling
3) GEEN grenswaarden (kans 5% of minder).
Bepalen welke range aan waarden aannemelijk is voor steekproevenverdeling. Wat is aannemelijk.
Welke waarden vallen in het midden van steekproeven verdeling.
Betrouwbaarheidsinterval: op basis van verdeling 95% van de waarden binnen 2SD van de
verdeling valt. Maatstaaf.
→ Welke waarden liggen +2SD en -2SD van het gemiddelde.
Voorbeeld: gem 0 en SD 5. Betrouwbaarheidsinterval -10 tot +10. Volgens steekproevenverdeling zijn
de waarden te verwachten tussen -10 en +10 in de populatie.
Hoe smaller betrouwbaarheidsinterval, hoe smaller jou range van mogelijke waarden en hoe dichter
jou steekproefwaarden bij je populatiewaarden zit (range van waarden).
Betrouwbaarheisinterval: als we veel steekproeven trekken, hieruit gemiddelde en
betrouwbaarheidsinterval berekenen, 95% per keer (2SD), dan zullen 95% de echte
populatiewaarden bevatten als je het meerdere keren doet, gelijk hebben.
Foutieve gedachte: bij een betrouwbaarheidsinterval van 95% weet ik dus NIET 95% zeker dat het
populatiegemiddelde in het betrouwbaarheid gemiddelde ligt.
Formule > Schatting +_ margin or error
M = Z* SD / wortel n
Z* = kritieke waarde
2