categorische variabelen numerieke variabelen
→ verdeelt de populatie in groepen → kwantitatief
→ beperkt aantal niveaus bv. resultaten van metingen
nominaal ordinaal discreet continu
= zonder orde = met orde = gehele getallen = kommagetallen
bloedgroep, ja-nee schaal met x niveaus, punten op een examen een %, bloeddruk, BMI
vragen, nationaliteit graad
range = grootste - kleinste
mediaan van x y z = y
rekenkundig gemiddelde van x y z = (x+y+z)/3
p^de percentiel = p% van alle observaties is kleiner dan = (1-p)% van alle observaties is groter
p50 = mediaan
p25-p75 = kwartielen
interkwartielafstand (IQR) = afstand van p25 tot p75 = maat voor de spreiding
p10-p20-p30 = decielen
uniforme verdeling poisson verdeling normale verdeling
bv. dobbelsteen gooien bv. aantal sekspartners bv. lichaamslengte
proportie → binormale verdeling λ-parameter parameters: gemiddelde μ en
standaardafwijking σ
Gauss curve (normale verdeling) percentielen:
p2,5 = μ - 1,96σ
p5 = μ - 1,64σ
p50 = μ = gemiddelde
p95 = μ + 1,64σ
p97,5 = μ + 1,96σ = range waarin 95% van de data gelegen is
steekproefgemiddelde û standaardafwijking steekproef ô^2
→ normaal verdeeld → t-verdeling
zelfs als de onderlinge verdeling dit niet is → schatting van σ
→ steekproefvariantie hoe groter n, hoe het op N-verdeling lijkt
standaardfout (SEM) ↓ als n ↑ (meer nauwkeurig)
nulhypothese H(0) = uitspraak over de onderliggende populatie = moet testbaar zijn
→ verdeelt de populatie in groepen → kwantitatief
→ beperkt aantal niveaus bv. resultaten van metingen
nominaal ordinaal discreet continu
= zonder orde = met orde = gehele getallen = kommagetallen
bloedgroep, ja-nee schaal met x niveaus, punten op een examen een %, bloeddruk, BMI
vragen, nationaliteit graad
range = grootste - kleinste
mediaan van x y z = y
rekenkundig gemiddelde van x y z = (x+y+z)/3
p^de percentiel = p% van alle observaties is kleiner dan = (1-p)% van alle observaties is groter
p50 = mediaan
p25-p75 = kwartielen
interkwartielafstand (IQR) = afstand van p25 tot p75 = maat voor de spreiding
p10-p20-p30 = decielen
uniforme verdeling poisson verdeling normale verdeling
bv. dobbelsteen gooien bv. aantal sekspartners bv. lichaamslengte
proportie → binormale verdeling λ-parameter parameters: gemiddelde μ en
standaardafwijking σ
Gauss curve (normale verdeling) percentielen:
p2,5 = μ - 1,96σ
p5 = μ - 1,64σ
p50 = μ = gemiddelde
p95 = μ + 1,64σ
p97,5 = μ + 1,96σ = range waarin 95% van de data gelegen is
steekproefgemiddelde û standaardafwijking steekproef ô^2
→ normaal verdeeld → t-verdeling
zelfs als de onderlinge verdeling dit niet is → schatting van σ
→ steekproefvariantie hoe groter n, hoe het op N-verdeling lijkt
standaardfout (SEM) ↓ als n ↑ (meer nauwkeurig)
nulhypothese H(0) = uitspraak over de onderliggende populatie = moet testbaar zijn