hypothesetesten
Samenvatting
3 H3 – Schatters en schattingsintervallen
3.1 Inleiding
Gemiddelde: heel grote of kleine extreme waarden hebben een grote invloed
Standaardafwijking: houdt rekening met de verspreiding van de waardes ten opzichte van het gemiddelde
Mediaan
Deloof heeft een lager gemiddelde ten opzichte van de andere
verkopers. Aan wat is dit te wijden? (Terecht lager gemiddelde?)
Systematische afwijking: panden zijn systematische
goedkoper.
Ruis of variatie: paar panden met een proportioneel
lagere verkoopprijs die gemiddelde doen dalen.
3.2 Schatters
Steekproefvariabiliteit: verwijst naar de onvermijdelijke variatie in resultaten tussen verschillende
steekproeven die uit dezelfde populatie worden genomen. Aangezien elke steekproef unieke elementen van
de populatie bevat en slechts een klein deel van de volledige populatie vertegenwoordigen. Kunnen ze
onmogelijk alle informatie van een populatie bevatten.
3.2.1 Puntschatters
Is een één enkel getal, berekend uit een steekproef om de populatieparameter te schatten. Er wordt weinig rekening
gehouden met de resultaten van een bevraging. Bij een herhaling van een bevraging door een andere onderzoeker
zullen er waarschijnlijk niet exact dezelfde resultaten zijn. Daarom zijn er 2 VEREISTEN nodig:
Validiteit of juistheid
Puntschatter valide? => als de puntschatter zo dicht mogelijk bij de echte populatieparameter ligt dat die
probeert te schatten.
Zuivere schatter (groen): ls het centrum van de schatter (de zogenaamde verwachting) exact gelijk is aan de te
schatten populatieparameter 𝜃.
Onzuivere schatter: Als het centrum van de schatter niet exact overeenkomt met de populatieparameter.
Statistiek Page 1
, Precisie of betrouwbaarheid
Schatter moet minimaal variabel zijn bij herhaalde
steekproef.
Betrouwbare schatter: VAR(T) = laag
Onbetrouwbare schatter: VAR(T’) = hoog
Ruis(T’) > Ruis (T)
3.2.2 Schattingsintervallen
Gebied waarin te schatten parameter waarschijnlijk ligt. Gelijkaardig met de betrouwbaarheidsintervallen.
Nauwkeurigheid afhankelijk van:
Steekproefomvang: klein aantal waarnemingen minder nauwkeurig dan een groot aantal waarnemingen.
Variabiliteit: hoe groter de ruis (afwijkende metingen), hoe minder nauwkeurig.
De kans op een goede schatting noemen we de betrouwbaarheid van het schattingsinterval. Als we een
schattingsinterval voor populatieparameter 𝜃𝜃bepalen met een betrouwbaarheid van p%, betekent dit dat er een
kans van p% is dat 𝜃 binnen de grenzen van het interval ligt.
Hoe meer zekerheid/betrouwbaarheid, hoe minder nauwkeurigheid
Hoe meer exactheid/nauwkeurigheid, hoe lager de betrouwbaarheid
Meeste toepassingen: 95% betrouwbaarheid => 5% significant
3.3 Schatten van populatieparameters
3.3.1 Schattingsinterval populatiegemiddelde 𝜇
• Het populatiegemiddelde 𝜇
• De populatievariantie 𝜎²
• De populatiefractie 𝜋
3.3.1.1Steekproef met grote omvang (n >of = 30)
Voor de k-waarde te bereken kijk online tool van omni calculator. Te vinden bij de demo in
het leerpad. Deze berekent ook direct de onder en boven grenzen.
Statistiek Page 2