Populatieparameters hebben twee soorten schattingen:
Puntschatting: een enkel getal dat onze beste gok voor de parameter is, maar dat op zichzelf
geen informatie geeft over de nauwkeurigheid. Bijvoorbeeld: het gemiddelde.
Intervalschatting: een bereik dat waarschijnlijk de parameter bevat en een foutenmarge
biedt om de nauwkeurigheid aan te geven.
Een goede schatting is:
Onbevooroordeeld (unbiased): de steekproefverdeling is gecentreerd rond de werkelijke
parameter. Voor grote aselecte steekproeven is deze ongeveer normaal verdeeld.
Nauwkeurig (precies): heeft een kleine standaarddeviatie, wat het accurater maakt.
Bijvoorbeeld: het steekproefgemiddelde heeft een kleinere standaarddeviatie dan de
steekproefmediaan, waardoor het een betere schatting is van het populatiegemiddelde.
Een betrouwbaarheidsinterval is een bereik van
plausibele waarden voor een parameter, waarbij een
puntschatting wordt gecombineerd met een
foutenmarge. Het betrouwbaarheidsniveau, meestal
95%, geeft de waarschijnlijkheid aan dat dit interval
de parameter bevat. De standaardfout (standard
error – se) is de geschatte standaarddeviatie van een
steekproefverdeling.
De foutenmarge (margin of error – m) laat
zien hoe dicht een puntschatting
waarschijnlijk ligt bij de populatieparameter
bij een gegeven betrouwbaarheidsniveau.
Het is z(se).
o Voor de populatieproportie p:
o se=
√ ^p (1− ^p )
n
, waarbij ^p de steekproefproportie is en z de z-score (aantal
standaarddeviaties van het gemiddelde).
s
o Voor het populatiegemiddelde x̄ : se= , , waarbij s de steekproefstandaarddeviatie is.
√n
, Voor 90%, 95% en 99% betrouwbaarheidsintervallen zijn de z-scores respectievelijk 1,645;
1,96; en 2,58. Dit is alleen geldig wanneer er minstens 15 successen (n ^p) en 15
mislukkingen n(1− ^p ) zijn, en de data door aselecte trekking zijn verkregen. ^ betekent
schatting.
o Het betrouwbaarheidsinterval voor een populatieproportie p: ^p= ± margin of
error (z(se)).
o Het betrouwbaarheidsinterval voor een populatiegemiddelde x̄ = x ˉ±z(se) x̄ \pm
z(se)xˉ±z(se).
Als een aselecte steekproef niet minstens 15 successen en 15 mislukkingen heeft, voegen we
2 toe aan het oorspronkelijke aantal successen en 2 aan het aantal mislukkingen in de
oorspronkelijke formule voor het betrouwbaarheidsinterval. Dit resulteert in een toename
van 4 in de steekproefomvang n.
Een hoger betrouwbaarheidsniveau leidt tot een groter interval en een grotere foutenmarge.
Een grotere steekproefomvang leidt tot een kleinere foutenmarge.
^p ( 1− ^p ) z 2
Steekproefomvang voor het schatten van een populatieproportie: n= 2
m
Je kunt ^p raden op basis van andere informatie, of de veilige aanpak kiezen door ^p = =0.5 te
nemen.
Een t-score wordt gebruikt in plaats van een z-score voor kleine, aselecte steekproeven. Het is
robuust omdat het alleen faalt als de data extreme uitschieters bevatten of binair zijn, ongeacht de
vorm van de verdeling.
De t-verdeling is klokvormig en symmetrisch rond 0.
Het heeft een unieke vorm voor elke waarde van de vrijheidsgraden (df). Zowel kansen als t-
scores zijn afhankelijk van df.
De t-verdeling heeft dikkere staarten dan de standaardnormale verdeling, wat meer
variabiliteit toestaat. Naarmate df toeneemt, benadert het de standaardnormale verdeling
steeds beter; rond df = 30 zijn ze bijna identiek.
De foutenmarge voor een betrouwbaarheidsinterval van het gemiddelde µ is t(se).
Een 95% betrouwbaarheidsinterval voor het populatiegemiddelde µ is: x̄ ± t.025(se), waar
se= s/√n.
Voor 95% betrouwbaarheid geldt df = n – 1, met t-score , t.025 die een rechterstaartkans van
0.025 heeft (totale kans 0.05 in de twee staarten en 0.95 tussen -t.025 and t.025 . De t-
scores vind je in Tabel B.
σ2 z2
Steekproefomvang voor het schatten van een populatiegemiddelde µ: n= , waarbij m
m2
= foutenmarge. De z-score hangt af van het betrouwbaarheidsniveau (bijv. z = 1,96 voor 95%
betrouwbaarheid). Deze formule vereist een schatting van de populatiestandaarddeviatie σ,
zoals de steekproefstandaarddeviatie s.
, o Voorbeeld: Welke steekproefomvang is nodig voor een 95%
betrouwbaarheidsinterval met een foutenmarge van 1 jaar voor het gemiddelde
aantal jaren opleiding?
Zonder voorafgaande informatie over de standaarddeviatie van opleidingsniveaus
kunnen we dit schatten door aan te nemen dat waarden tussen 0 en 18 jaar vallen.
Voor een klokvormige verdeling liggen de meeste waarden binnen m ± 3σ, dus 18 =
3 2∗1.962
6σ (twee zijden), wat geeft σ ≈ 3. n= = 34.6 = ten minste 35
12
proefpersonen.
H. 9: Statistical Inference: Significance Tests
About Hypotheses
Stappen van een significantietoets over een populatieproportie:
1. Assumpties: De variabele is categorisch, de data zijn verkregen via
randomisatie, en de steekproefgrootte is groot genoeg zodat de
steekproefverdeling ongeveer normaal is (verwachte successen én
mislukkingen beide >15 volgens H0). De methode is echter robuust
genoeg om ook te werken voor kleine steekproeven.f
2. Hypothesen: Formuleer H0 en Ha. Deze moeten altijd betrekking
hebben op populatieparameters, niet op steekproefstatistieken; en
Ha mag niet gekozen worden op basis van de verkregen data.
a. De nulhypothese (H0) is één enkele populatieparameter die
gelijk is aan een specifieke waarde, meestal “geen effect”.
H0: p = p₀. Bijvoorbeeld: p = 1/3.
b. De alternatieve hypothese (Ha) is een reeks alternatieve
waarden voor de parameter die een effect aangeven, positief,
negatief of beide.
Ha: p > / < / ≠ p₀.
In onderzoek wordt meestal een tweezijdige Ha (≠) gebruikt.
3. Teststatistiek: Meet de afstand tussen de puntschatting p^\
hat{p}p^ en de parameterwaarde p₀ in de nulhypothese, meestal in
termen van standaardfouten.
^p −p 0 ^p − p0
z statistic= =
√
a. se 0 p 0 (1− p0 )
n
4. P-waarde: De kans om de
teststatistiek of een extremere
waarde te observeren,
aangenomen dat H0 waar is. De P-
, waarde is een enkelzijdige of tweezijdige kans uit de z-verdeling,
afhankelijk van of de alternatieve hypothese één- of tweezijdig is.
Voor een enkelzijdige kans met significantieniveau α = 0,05 komt de
z-waarde overeen met 1 – 0,05 = 0,95 cumulatieve kans. In Tabel A
zie je dat dit een P-waarde oplevert die correspondeert met z =
1,645.
5. Conclusie: Kleinere P-waarden (dicht bij nul) geven sterker bewijs
tegen H0; grotere P-waarden geven sterker bewijs vóór H0.
Als een beslissing nodig is: verwerp H0 als de P-waarde kleiner is
dan of gelijk aan het vooraf gekozen significantieniveau α (vaak ≤
0,05, wat betekent dat het resultaat statistisch significant is).
Relateer de conclusie altijd aan de context van het onderzoek.
Significantietoetsen geven vaak minder inzicht dan
betrouwbaarheidsintervallen: ze tonen alleen aan of een effect bestaat,
terwijl betrouwbaarheidsintervallen ook aangeven hoe groot dat effect kan
zijn.
Stappen van een significantietoets over een
populatiegemiddelde:
1. Assumpties: De variabele is kwantitatief, de data zijn verkregen
via randomisatie, en de populatieverdeling is ongeveer normaal.
2. Hypothesen:
a. Nulhypothese: H0: µ = µ₀
b. Alternatieve hypothese: Ha: µ ≠ µ₀ (tweezijdig) of Ha: µ > µ₀ /
Ha: µ < µ₀ (eenzijdig).
3. Teststatistiek: Meet de afstand tussen het steekproefgemiddelde
xˉ\bar{x}xˉ en de waarde in de nulhypothese, meestal in termen
van standaardfouten.
x̄−µ0 sample mean−null hypothesis mean x̄−µ0
t statistic= = =
a. se standard error of sample mean s
√n
4. P-waarde: Een enkelzijdige of tweezijdige kans uit de t-verdeling,
afhankelijk van de alternatieve hypothese.
5. Conclusie: Kleinere P-waarden (dicht bij nul) geven sterker bewijs
tegen H0; grotere P-waarden geven sterker bewijs vóór H0.
Als een beslissing nodig is: verwerp H0 als de P-waarde ≤ het vooraf