Overzichtelijke samenvatting statistiek 1
Meetniveaus:
Categorisch (kwalitatief):
o Nominaal: categorie (geboorteplaats, etniciteit etc)
Dichotoom: 2 categorieën: ja/nee, man/vrouw etc
o Ordinaal: categorie + volgorde (top tien boeken, laag/gem/hoog niveau)
Numeriek (kwantitatief):
o Interval: categorie + volgorde + verschillen (toets scores, temp)
o Ratio: categorie + volgorde + verschillen + verhoudingen (absoluut nulpunt)
(lengte, leeftijd, gewicht, temp in Kelvin)
Type steekproef:
Aselecte steekproef: iedere mogelijke steekproef heeft dezelfde waarschijnlijkheid
om geselecteerd te worden
Steekproef variabiliteit: verschillen tussen steekproeven, ook in uitkomsten
o Sampling error: verschil in uitkomsten door toeval
>> je kan alleen kansuitspraken doen
Type variabelen:
Discrete: afzonderlijke meetwaarden (geslacht, opleiding, schaal 1-10)
o Binair: wel/niet, man/vrouw etc
Continue: altijd een fijnere indeling mogelijk (lengte, gewicht, BMI, tijd)
o Vaak ongeveer > dan 30 mogelijke meetwaarden
Experimentele variabelen
Onafhankelijke variabele (Predictor variable): wat je manipuleert,
waarvan je invloed van onderzoekt (wat is het effect van X op y)
Afhankelijke variabele (outcome variable): wat je meet, uitkomst
variabele die je gaat toetsen (wat is het effect van x op Y)
Centrummaten:
Gemiddelde (μ/M/ x ):
o Voor variabelen op interval en ratio niveau
o Gevoelig voor sterke afwijkingen
Modus: score die het meest frequent voorkomt
Mediaan (ME): middelste waarde op volgorde (klein > groot)
o Ongevoelig voor sterke afwijkingen
o Symmetrische verdeling: gem = mediaan
o Ordinaal, interval en ratio niveau
Spreidingsmaten:
Range (r): maximum – minimum
Standaarddeviatie (std) (σ/s/SD): afwijking geobserveerde waarnemingen tov gem
, o Kleine spreiding = kleine std
o Met std op basis van een steekproef uitspraak kunnen doen over populatie
Variantie (v): std2
Kwartielscores:
o Q1: mediaan van onderste helft
o Q2: mediaan
o Q3: mediaan van bovenste helft
Interkwartiel range: middelste helft van dataset
o IQR = Q3 – Q1
Populatie (complete Steekproef (deelverzameling)
verzameling)
Parameter Kengetallen
Gemiddelde μ x of M
Std σ s of SD
Variantie Σ ( Xi−μ)
2
Σ ( xi−x)
2
𝛔2 = s2 =
N n−1
Frequentieverdeling (histogram):
Uniforme verdeling: alle uitkomsten komen even vaak voor
Unimodale verdeling: normaalverdeling (dus 1 piek)
Bimodale verdeling: 2 pieken
Multimodale verdeling: meerdere pieken
Statistiek:
Beschrijvende statistiek: obv variabelen om centrummaten vast te stellen/te
toetsen
Toetsende statistiek: schatting over populatiekenmerken obv steekproefgegevens
maken.
o Hypothese wordt door kansberekeningen getoetst
o Er wordt bepaald of bepaalde samenhang/verschil toeval is of niet
Normaalverdeling:
Unimodaal
Gem = mediaan = modus
68% van de data ligt binnen + en – 1 std
95% van de data ligt binnen + en – 2 std
Z-verdeling: standaard normaalverdeling
o Gem = 0
o Std = 1
o 95% van de data ligt binnen + en – 1.96 std (oftewel tussen + en – 2 std)
Z-score: aantal std units boven of onder gem. Geeft linker en rechter
overschrijdingskans
Meetniveaus:
Categorisch (kwalitatief):
o Nominaal: categorie (geboorteplaats, etniciteit etc)
Dichotoom: 2 categorieën: ja/nee, man/vrouw etc
o Ordinaal: categorie + volgorde (top tien boeken, laag/gem/hoog niveau)
Numeriek (kwantitatief):
o Interval: categorie + volgorde + verschillen (toets scores, temp)
o Ratio: categorie + volgorde + verschillen + verhoudingen (absoluut nulpunt)
(lengte, leeftijd, gewicht, temp in Kelvin)
Type steekproef:
Aselecte steekproef: iedere mogelijke steekproef heeft dezelfde waarschijnlijkheid
om geselecteerd te worden
Steekproef variabiliteit: verschillen tussen steekproeven, ook in uitkomsten
o Sampling error: verschil in uitkomsten door toeval
>> je kan alleen kansuitspraken doen
Type variabelen:
Discrete: afzonderlijke meetwaarden (geslacht, opleiding, schaal 1-10)
o Binair: wel/niet, man/vrouw etc
Continue: altijd een fijnere indeling mogelijk (lengte, gewicht, BMI, tijd)
o Vaak ongeveer > dan 30 mogelijke meetwaarden
Experimentele variabelen
Onafhankelijke variabele (Predictor variable): wat je manipuleert,
waarvan je invloed van onderzoekt (wat is het effect van X op y)
Afhankelijke variabele (outcome variable): wat je meet, uitkomst
variabele die je gaat toetsen (wat is het effect van x op Y)
Centrummaten:
Gemiddelde (μ/M/ x ):
o Voor variabelen op interval en ratio niveau
o Gevoelig voor sterke afwijkingen
Modus: score die het meest frequent voorkomt
Mediaan (ME): middelste waarde op volgorde (klein > groot)
o Ongevoelig voor sterke afwijkingen
o Symmetrische verdeling: gem = mediaan
o Ordinaal, interval en ratio niveau
Spreidingsmaten:
Range (r): maximum – minimum
Standaarddeviatie (std) (σ/s/SD): afwijking geobserveerde waarnemingen tov gem
, o Kleine spreiding = kleine std
o Met std op basis van een steekproef uitspraak kunnen doen over populatie
Variantie (v): std2
Kwartielscores:
o Q1: mediaan van onderste helft
o Q2: mediaan
o Q3: mediaan van bovenste helft
Interkwartiel range: middelste helft van dataset
o IQR = Q3 – Q1
Populatie (complete Steekproef (deelverzameling)
verzameling)
Parameter Kengetallen
Gemiddelde μ x of M
Std σ s of SD
Variantie Σ ( Xi−μ)
2
Σ ( xi−x)
2
𝛔2 = s2 =
N n−1
Frequentieverdeling (histogram):
Uniforme verdeling: alle uitkomsten komen even vaak voor
Unimodale verdeling: normaalverdeling (dus 1 piek)
Bimodale verdeling: 2 pieken
Multimodale verdeling: meerdere pieken
Statistiek:
Beschrijvende statistiek: obv variabelen om centrummaten vast te stellen/te
toetsen
Toetsende statistiek: schatting over populatiekenmerken obv steekproefgegevens
maken.
o Hypothese wordt door kansberekeningen getoetst
o Er wordt bepaald of bepaalde samenhang/verschil toeval is of niet
Normaalverdeling:
Unimodaal
Gem = mediaan = modus
68% van de data ligt binnen + en – 1 std
95% van de data ligt binnen + en – 2 std
Z-verdeling: standaard normaalverdeling
o Gem = 0
o Std = 1
o 95% van de data ligt binnen + en – 1.96 std (oftewel tussen + en – 2 std)
Z-score: aantal std units boven of onder gem. Geeft linker en rechter
overschrijdingskans