Statistische modellen formules
Hoofdstuk 5
Standaard fouten
SEy is standaardfout van het gemiddelde van de steekproef.
σ^2 is standaarddeviatie in het kwadraat. n is de
steekproefgrootte
SEy is e standaardfout van het gemiddelde
van de steekproef. S = spreiding in de
steekproef
SEπ is de standaardfout van de proportie van de
steekproef
π met een dakje is proportie van de steekproef en
π zonder dakje is proportie van de populatie
Z-waarde
De z-waarde bereken je altijd door het verschil in π te delen door de
standaardfout
- π0 (populatie) = 0,65 en πdakje = 0,55 (steekproef) -> z-waarde =
0,10 / se
- π1(groep 1) = 0,50 en π2 (groep 2) = 0,65 -> z-waarde = 0,15 / se
Normaal gesproken kan je de z-waarde uit de tabel halen
- Een 95%-bhi heeft een 5% kans dat de parameter uit buiten valt,
dit verdeeld over links en rechts = 2,5% per kans. Dit maakt een
kans van 0,025 en dit geeft een z-waarde van 1.96
Margin of error
Dit is de z- óf t-waarde x standaardfout
Hoe je de standaardfout berekent is afhankelijk van de beschikbare data
die je hebt, staat hierboven uitgelegd
, Wanneer gebruik je de z-waarde en wanneer de t-waarde? Bij het bhi
berekenen van proporties gebruikt je altijd de z-waarde. Bij het bhi
berekenen van gemiddelden hangt dit af van hoe groot je steekproef is.
Is de n groter dan 150, dan gebruik je de z-waarde en is je n kleiner dan
150, dan gebruik je de t-waarde
Betrouwbaarheidsinterval
Algemeen: puntschatting +/- margin of error (foutenmarge)
Proportie
Bij proporties gebruiken we altijd de z-waarde,
ongeacht de grootte van n. π dakje staat voor
de schatting van de populatie proportie, de
proportie van je steekproef dus. Hier is je z-
waarde weer afhankelijk van de gekozen bhi%,
deze zoek je dan op in tabel A
Gemiddelde
Zoals we bij ‘margin of error’ hadden gezien, is de manier waarop we die
berekenen, afhangt van je data.
Weet je de echte standaard deviatie (die van de populatie)?
Dan gebruik je deze formule. Ongeacht grootte van n (!)
Weet je de echte standaarddeviatie van de
populatie niet, maar is je steekproef (n) groter dan 150?
Dan gebruik je deze formule
Weet je de echte standaarddeviatie uit de populatie niet,
en is je steekproefgrootte kleiner dan 150? Dan gebruik
je deze formule
Y dakje staat voor het gemiddelde uit de steekproef. Sigma staat voor de
standaarddeviatie van de populatie en s staat voor standaarddeviatie
van de steekproef
Steekproefgrootte vooraf bepalen
Door je maximale margin of error vooraf te bepalen, bepaal je de
maximale breedte van je bhi. Je margin of error is eigenlijk alleen te
beïnvloeden door je steekproefgrootte
Proporties
Dit is de formule voor het bepalen van de
steekproefgrootte bij proporties. Hierbij staat π voor de
populatie proportie. Als je niet weet wat deze is, gebruik
je π = 0,5.
Hoofdstuk 5
Standaard fouten
SEy is standaardfout van het gemiddelde van de steekproef.
σ^2 is standaarddeviatie in het kwadraat. n is de
steekproefgrootte
SEy is e standaardfout van het gemiddelde
van de steekproef. S = spreiding in de
steekproef
SEπ is de standaardfout van de proportie van de
steekproef
π met een dakje is proportie van de steekproef en
π zonder dakje is proportie van de populatie
Z-waarde
De z-waarde bereken je altijd door het verschil in π te delen door de
standaardfout
- π0 (populatie) = 0,65 en πdakje = 0,55 (steekproef) -> z-waarde =
0,10 / se
- π1(groep 1) = 0,50 en π2 (groep 2) = 0,65 -> z-waarde = 0,15 / se
Normaal gesproken kan je de z-waarde uit de tabel halen
- Een 95%-bhi heeft een 5% kans dat de parameter uit buiten valt,
dit verdeeld over links en rechts = 2,5% per kans. Dit maakt een
kans van 0,025 en dit geeft een z-waarde van 1.96
Margin of error
Dit is de z- óf t-waarde x standaardfout
Hoe je de standaardfout berekent is afhankelijk van de beschikbare data
die je hebt, staat hierboven uitgelegd
, Wanneer gebruik je de z-waarde en wanneer de t-waarde? Bij het bhi
berekenen van proporties gebruikt je altijd de z-waarde. Bij het bhi
berekenen van gemiddelden hangt dit af van hoe groot je steekproef is.
Is de n groter dan 150, dan gebruik je de z-waarde en is je n kleiner dan
150, dan gebruik je de t-waarde
Betrouwbaarheidsinterval
Algemeen: puntschatting +/- margin of error (foutenmarge)
Proportie
Bij proporties gebruiken we altijd de z-waarde,
ongeacht de grootte van n. π dakje staat voor
de schatting van de populatie proportie, de
proportie van je steekproef dus. Hier is je z-
waarde weer afhankelijk van de gekozen bhi%,
deze zoek je dan op in tabel A
Gemiddelde
Zoals we bij ‘margin of error’ hadden gezien, is de manier waarop we die
berekenen, afhangt van je data.
Weet je de echte standaard deviatie (die van de populatie)?
Dan gebruik je deze formule. Ongeacht grootte van n (!)
Weet je de echte standaarddeviatie van de
populatie niet, maar is je steekproef (n) groter dan 150?
Dan gebruik je deze formule
Weet je de echte standaarddeviatie uit de populatie niet,
en is je steekproefgrootte kleiner dan 150? Dan gebruik
je deze formule
Y dakje staat voor het gemiddelde uit de steekproef. Sigma staat voor de
standaarddeviatie van de populatie en s staat voor standaarddeviatie
van de steekproef
Steekproefgrootte vooraf bepalen
Door je maximale margin of error vooraf te bepalen, bepaal je de
maximale breedte van je bhi. Je margin of error is eigenlijk alleen te
beïnvloeden door je steekproefgrootte
Proporties
Dit is de formule voor het bepalen van de
steekproefgrootte bij proporties. Hierbij staat π voor de
populatie proportie. Als je niet weet wat deze is, gebruik
je π = 0,5.