7.1 – Statistische verdelingen
Bij een symmetrische verdeling zijn de gemiddelde, de
modus en de mediaan gelijk. (ook wel normaalkromme,
hoort bij een normale verdeling)
Rechts-scheve verdeling
Bij de scheve verdeling heb je twee Links-scheve verdeling
soorten, de rechts-scheve verdeling en
de links-scheve verdeling. Hierin is de
data aan één kant meer verspreid wat
ook wel de staart van de verdeling
heet. Het gemiddelde ligt meer richting
de staart van de verdeling dan de mediaan. Mediaan is
een betere centrummaat.
Bij een meertoppige verdeling zijn er meerdere
toppen binnen de data te onderscheiden, de standaardafwijking
is relatief groot.
Bij een uniforme verdeling zijn
alle waarnemingsgetallen
hetzelfde.
Een waarnemingsgetal dat
opvallend afwijkt van de rest van
de verdeling wordt een uitschieter of uitbijter genoemd.
Een verdelingskromme is een globale grafiek van een verdeling. De modus ligt
bij de top, de mediaan in het midden. De mediaan is groter dan de modus, maar
omdat de verdeling rechtsscheef is, is het gemiddelde weer groter dan de
mediaan. Van een cumulatieve
verdelingskromme kun je een
verdelingskromme maken en
andersom.
Bij de normale verdeling wordt het gemiddelde
aangegeven met de Griekse letter μ. Voor de
standaardafwijking de Griekse letter σ.
Vuistregel bij de normale verdeling:
- Ongeveer 68% van de
waarnemingsgetallen ligt tussen μ – σ en μ
+ σ. (34% & 34%)
- Ongeveer 95% van de waarnemingsgetallen ligt tussen μ – 2σ en μ + 2σ.
(34%, 34%, 13,5%, 13,5%)
- Bijna 100% van de waarnemingsgetallen ligt tussen μ – 3σ en μ + 3σ.
(34%,34%,13.5%,13.5%,2.5%,2.5%)
, 7.2 – Betrouwbaarheidsintervallen voor het
populatiegemiddelde
Bij een steekproef van n objecten uit een normale verdeling met gemiddelde μ en
standaardafwijking σ is het steekproefgemiddelde normaal verdeeld met
gemiddelde μ en standaardafwijking σ . Het aantal objecten n van een
√n
steekproef wordt ook wel de steekproefomgang of steekproeflengte genoemd.
Het 95%-betrouwbaarheidsinterval voor het populatiegemiddelde is
x
±¿ 2
∙
. Hierin is x het steekproefgemiddelde, S de
S
√ n
steekproefstandaardafwijking en n de steekproefomvang.
7.3 – betrouwbaarheidsintervallen voor de
populatieproportie
De verdeling die aangeeft hoe waarschijnlijk de verschillende steekproefproportie
zijn, heet de verdeling van de steekproefproportie. Hoe groter de
steekproefomvang hoe beter de verdeling van de steekproefproportie
overeenkomt met de normale verdeling. Bij populatieproportie p en
steekproefomvang n is de steekproefproportie normaal verdeeld met gemiddelde
p en standaardafwijking σ =
√ p(1−p) .
n
Bij een onderzoek onder n personen met populatieproportie p zal de
steekproefproportie p per steekproef verschillen. De waarden van p ontstaan uit
een steekproevenverdeling die normaal verdeeld is met gemiddelde p en
standaardafwijking σ =
√ p(1−p) . Het 95%-betrouwbaarheidsinterval voor de
n
populatieproportie is
√
[¿ p¿±¿2¿σ¿] . Hierin is p de steekproefproportie en σ =
met n de steekproefomvang.
p(1−P)
n
7.4 – betrouwbaarheidsintervallen toepassen
Voor het betrouwbaarheidsinterval voor een populatieproportie heb je P en n
nodig. Voor het betrouwbaarheidsinterval voor het
populatiegemiddelde heb je x , S en n nodig.