Hypothesetoetsen is het trekken van een conclusie over de populatie, gebaseerd op de kans van het
vinden van een bepaalde steekproefwaarde voor een aangenomen populatiewaarde.
Je neemt aan dat de populatie een bepaalde waarde heeft (dit noem je de hypothese). Dan bepaal je
de kans dat je een bepaalde steekproefwaarde vindt. Als deze kans klein is, kun je concluderen dat de
echte populatie waarde waarschijnlijk verschilt van de populatiewaarde die je hebt aangenomen.
5 stappen van hypothesetoetsen:
1. Aannames benoemen: dus soort variabelen, procedures en verdeling
2. Hypotheses opstellen
3. Toetsingsgrootheid berekenen
4. P-waarde bepalen / kritieke waarden bepalen
5. Conclusies trekken
Hypothesetoets: methode waarmee je op grond van een steekproef nagaat hoe sterk de evidentie is
tegen een bepaalde hypothese en vervolgens een beslissing maakt om deze wel of niet te verwerpen.
Hypothese is een uitspraak over de populatie. Het is meestal een voorspelling dat een parameter die
een kenmerk van een variabele beschrijft een bepaalde numerieke waarde heeft. Of binnen een
bepaald bereik van waarden valt.
,z-toets
- Is voor categorische data
- Op nominale of ordinale schaal
- Wordt gebruikt om proporties te vergelijken.
- 1 steekproefproportie vergelijken met de nulhypothese (H0)
- 2 steekproevenproporties vergelijken met elkaar. H0 stelt dan dat beide groepen gelijk zijn.
- De populatiestandaarddeviatie is bekend
- Steekproef moet groter dan 30 zijn
- Bereken de z-waarde met
De uitgekomen z-waarde zoek je op in de z-tabel. De uitkomst daarvan is eigenlijk je p-waarde. Bij
tweezijdig toetsen doe je de p-waarde *2. Vergelijk p-waarde met het significantieniveau, meestal
0.05. Als de p-waarde extremer is dan het significantieniveau (a), dan verwerp je de H0.
Bij de z-toets hoort de standaard normale verdeling.
- Gemiddelde (mu) = 0
- Standaarddeviatie (sigma) = 1
- Symmetrische belvormige verdeling
- Z-score geeft het aantal standaardafwijkingen dat een waarneming van het gemiddelde ligt
- Z-score = y – mu / sigma
- Positieve z-score ligt boven het gemiddelde
- Negatieve z-score ligt onder het gemiddelde
- Z-score van 0 is gelijk aan het gemiddelde
Je kan de H0 ook verwerpen op basis van de kritieke waarden. Kritieke waarde is de grenswaarde
gebaseerd op het gekozen significantieniveau. Vergelijk z-score met significantieniveau.
Significantieniveau Eenzijdig Tweezijdig
a=0.10 +- 1.28 +- 1.645
a=0.05 +-1.645 +-1.96
a=0.01 +-2.33 +-2.575
Omdat je de populatiegrootheid niet kent, schatten we die op basis van de steekproefgrootheid die
we wel kennen. De puntschatter is de schatting van je parameter, in dit geval dus je
steekproefproportie.
Een intervalschatting: een interval (met in het midden de puntschatter) waarin met een bepaalde
waarschijnlijkheid de waarde van de parameter zou liggen.
- De breedte geeft aan hoe precies je puntschatter geschat is.
- De nauwkeurigheid hangt af van:
1. Standaarddeviatie van de steekproef
, 2. Steekproefomvang
BI 95% voor populatieproportie
1. Bereken de puntschatter (steekproefproportie)
- Steekproefproportie is x/n
- X aantal elementen van interesse
- N is steekproefomvang
2. Bepaal z-score passend bij het betrouwbaarheidsniveau. Bijvoorbeeld 1.96 bij 95% / 0.05.
3. Bereken de standaardfout van de puntschatter. Se =
4. Vul de formule in BI =
Als je een negatieve z-waarde hebt kan je gewoon het positieve getal er van opzoeken in z-tabel,
omdat z-verdeling symmetrisch is. De p-waarde is altijd positief.
Validiteit: schatters moeten zuiver zijn. Onzuiver als hij gemiddeld een overschatting of
onderschatting van parameters geeft.
Betrouwbaarheid: schatters moeten doeltreffend zijn. Een schatter met een kleine se wordt
doeltreffend of efficiënt genoemd.