H10
Normaal verdeling (Gaussische verdeling): een continue kansverdeling die een klokvormige
curve beschrijft. Het is een goede benadering van de frequentieverdeling van veel
biologische variabelen.
- Bij een variabele met een normale verdeling ligt ongeveer twee/derde van de
individuelen binnen één standaard deviation van het gemiddelde en ongeveer 95%
binnen twee standaard deviations van het gemiddelde.
- Als een variabele een normale verdeling heeft in de populatie dan is de verdeling van de
sample mean ook normaal verdeeld.
- Eigenschappen:
o symmetrisch om μ ;
o modus, mediaan en gemiddelde liggen op zelfde punt ;
o continue verdeling -> kans kan berekend worden door opp. bepalen
Standaard normaal verdeling, Z-verdeling: normaal verdeling waarbij de mean=0 en
standaard deviation= 1.
- Standaard normaal afwijking, Z-waarde= verteld hoeveel standaard deviations een
waarde afwijkt van het gemiddelde.
Y −μ
- Z=
SE
- Y= de sample mean/ de genomen mean
- μ= de populatie mean/ de echte mean
- Als de σ van de populatie kent
- Kansen berekenen:
o P(x>27) = P(Z> Z bij Y=27)
o P(Z < -nummer) = P(Z > nummer) Want Z verdeling is symmetrisch om de mean
Standaard deviatie van de steekproevenverdeling van het gemiddelde = SE
Centrale limiet theorie= de som of het gemiddelde van een groot getal of meting random
gesampled van een niet normaal verdeelde populatie is ongeveer normaal verdeeld.
Normal approximation to the binomial distribution
- Als N groot is dan kan de binominale kans verdeling voor het aantal successen berekend
worden met een normaal verdeling met mean np en standaard deviatie √ np(1− p)
1
observed− −np
- 2
P ( X ≥ observed )=P (Z > )
√np ( 1−np )
1
observed− −np
- 2
P ( X ≤ observed )=P(Z < )
√np ( 1−np )
- n=trials , p=kans van succes van elke trial , observed=aantal successen∈data
H11/12
Betrouwbaarheidsinterval
, - ( 95 % )=μ−t 0.05 ,df ∗SE en μ+t 0.05 ,df ∗SE
- ( 99 % )=μ−t 0.01, df ∗SE en μ+t 0.01 ,df ∗SE
- ( 95 % )=μ−1.96∗SE en μ+1.96∗SE
x−μ0
Student’s t-toets; t=
SE
- df= n-1
s
- SE=
√n
- De σ van de populatie is niet bekend.
- Random samples
- t.test(x, …)
One-sample t-test:
- Vergelijkt gemiddelde van willekeurige steekproef uit een normaalverdeling met de
populatie gemiddelde
- H 0=echte meanis μ 0 Ha=echte mean isniet μ0
- Assumptie: score is normaal verdeeld -> shapiro.test(x)
Two-sample t-test
- Gepaard (afhankelijk)
o Onderzoek bij proefpersonen/dieren die gelinked zijn. (broer en zus, groep voor en
na tentame etc.)
o Assumptie: verschilscore normaal verdeeld -> shapiro.test(x)
o H 0 :μ=0 Ha: μ ≠ 0
o Gebruikt verschil scores dus zelfde berekenen als one-sample
- onafhankelijk
o twee onafhankelijke groepen met elkaar vergelijken
o assumpties: scores normaal verdeeld -> shapiro.test(x)
o gelijke variantie (σ1= σ2) -> leveneTest(y, groep)
eenzijdig -> als je een hele sterke hypothese hebt over richting van effect
tweezijdig-> meestal doen
2
pooled sample variance ( S p ) = het gemiddelde van de variantie van de samples rekening
houdend met de vrijheidsgraden (df).
2 df 1∗s 21+ df 2∗s22
- s p=
df 1+ df 2
2 2
- s1=sd (sd van sample)
- T berekenen
( Y 1−Y 2 ) −( μ1−μ 2)
o t=
SEY −Y
1 2