STATISTIEK 2
TUTORIAL 1
Quantile plot (Q-Q plot): als waarnemingen dicht bij de rechte lijn liggen, zijn de
waarnemingen normaal verdeeld
Centrale limit stelling: trekkingen uit een normale verdeling worden weer normale
verdeling, zelfde gemiddelde alleen breedte / wortel n. Als oorspronkelijke verdeling niet
normaal verdeeld is, mag verdeling van gemiddelde wel normaal verdeeld worden, mits n
groot genoeg is.
TUTORIAL 2
Precisie: hoe dicht bij de werkelijke waarde
Nauwkeurigheid: spreiding
Steekproefgemiddelde is an unbiased (precies) estimator voor de verwachte waarde, want mu
y bar = mu y
Steekproefgemiddelde is ook consistent (nauwkeurig), hoe groter de sample hoe dichter bij
werkelijke waarde. Dus weinig spreiding.
Y bar is een (punt) schatting voor verwachte waarde van y.
Confidence interval (CI): estimator +/- error margin
Confidence coefficient 1 – alfa. Stel 1 – alfa = 95% betekent dat 95 van de 100 de verwachte
waarde zullen bevatten
Right tail probability / fout marge: z-score van alfa (bijvoorbeeld 0.1 bij 90%) / 2 (tabel 2)
Betrouwbaarheidsinterval 1 – alfa = y bar +/- z-score alfa / 2 x sd / wortel n
Standaard deviatie van het gemiddelde = variantie / wortel n = standaard fout van het
gemiddelde (SE)
T-verdeling (=df) = oneindig
Staarten van de verdeling gedragen zich niet normaal. Ze passen zich aan aan de totale
oppervlakte van 1
Onafhankelijke waarnemingen uit een normale verdeling
TUTORIAL 1
Quantile plot (Q-Q plot): als waarnemingen dicht bij de rechte lijn liggen, zijn de
waarnemingen normaal verdeeld
Centrale limit stelling: trekkingen uit een normale verdeling worden weer normale
verdeling, zelfde gemiddelde alleen breedte / wortel n. Als oorspronkelijke verdeling niet
normaal verdeeld is, mag verdeling van gemiddelde wel normaal verdeeld worden, mits n
groot genoeg is.
TUTORIAL 2
Precisie: hoe dicht bij de werkelijke waarde
Nauwkeurigheid: spreiding
Steekproefgemiddelde is an unbiased (precies) estimator voor de verwachte waarde, want mu
y bar = mu y
Steekproefgemiddelde is ook consistent (nauwkeurig), hoe groter de sample hoe dichter bij
werkelijke waarde. Dus weinig spreiding.
Y bar is een (punt) schatting voor verwachte waarde van y.
Confidence interval (CI): estimator +/- error margin
Confidence coefficient 1 – alfa. Stel 1 – alfa = 95% betekent dat 95 van de 100 de verwachte
waarde zullen bevatten
Right tail probability / fout marge: z-score van alfa (bijvoorbeeld 0.1 bij 90%) / 2 (tabel 2)
Betrouwbaarheidsinterval 1 – alfa = y bar +/- z-score alfa / 2 x sd / wortel n
Standaard deviatie van het gemiddelde = variantie / wortel n = standaard fout van het
gemiddelde (SE)
T-verdeling (=df) = oneindig
Staarten van de verdeling gedragen zich niet normaal. Ze passen zich aan aan de totale
oppervlakte van 1
Onafhankelijke waarnemingen uit een normale verdeling