OIMB
Hoorcollege 1
Conceptuele achtergronden
- De cijfers spreken nooit voor zich
- Initiële observatie → theorie → hypothese → dataverzameling → analyse → uitspraak
(inference)
Onderzoeksvraag: waarom is er in sommige landen of gemeenten meer verzet tegen komst AZC dan
in andere?
1. Identificeren van de afhankelijke variabele: meningen over migratie (attitude-meting)
2. Bepalen van de mate van spreiding (variantie)
3. Op zoek naar factoren die deze spreiding mogelijk kunnen verklaren (mate van geluk, angst
voor misdaad)
4. Modellen opstellen die deze spreiding kunnen wegnemen
Modellen komen altijd terug op deze vier stappen. Basis voor ieder statistisch model.
Twee varianten van statistiek:
- Beschrijvende statistiek
- Verklarende statistiek (inferential statistics)
Datamatrix
- In je rijen staan je onderzoekseenheden
- In de kolommen staan je variabelen (variabelen varieert, heeft scores)
Typen gegevens
- Kwalitatieve gegevens (categorisch)
o Nominaal meetniveau (geslacht, nationaliteit)
o Ordinaal meetniveau (opleidingsniveau)
- Kwantitatieve gegevens (continue)
o Interval meetniveau (IQ, temperatuur)
o Ratio meetniveau (inkomen, leeftijd)
Eigenschappen
(kwantitatieve)
gegevens
Centrale
Spreiding Vorm
tendentie
Gemiddelde Bereik Scheefheid
Mediaan Kwartiel afstand Spitsheid
Modus Variantie
Standaarddeviati
e
Centrale tendentie
Maat Populatie Steekproef Type data
Modus - - N/O/I/R
Mediaan M m O/I/R
Gemiddelde µ X̄ I/R
1
,N = nominaal
O = ordinaal
I = interval
R = ratio
Tweede eigenschap van een verdeling: variantie
Maat Populatie Steekproef Type data
Bereik - - O/I/R
Interkwartiel range IQR IQR O/I/R
Variantie σ (tot de macht twee) s2 I/R
Standaarddeviatie σ s I/R
Spreiding: interkwartielrange
1. Maat voor spreiding in de middelste 50% van de waarnemingen (rondom de mediaan)
2. Verdeelt data in vier kwarten
3. Interkwartiel afstand = Q3 – Q1
Spreiding: standaarddeviatie
Maat Populatie Steekproef Type data
Bereik - - O/I/R
Interkwartiel range IQR IQR O/I/R
Variantie σ (tot de macht twee) s2 I/R
Standaarddeviatie σ s I/R
Als je met een steekproef werkt, deel je niet door N, maar door N-1. De onzekerheid wordt
meegenomen in de berekening.
In een ideale wereld zijn de datasets helemaal symmetrisch. Extreem lage waarde – gemiddelde
wordt omlaag getrokken → links-scheve verdeling.
Derde eigenschap van een verdeling: vorm spitsheid
Het kan zijn dat je verdeling heel spits is. Er is weinig spreiding.
- Maat = kurtosis
- Idee = inschatten of spreiding van variabele adequaat is (voor het toepassen van statistische
procedures)
Werken met de normale verdeling
- Klokvormig, symmetrisch
- Gemiddelde, mediaan en modus zijn gelijk
2
, - Heeft (in theorie) een oneindige range
Hoorcollege 2
Verdelingen van steekproefgrootheden
Schattingsproces
1. Populatie vaststellen, bijvoorbeeld de Nederlandse bevolking
2. Steekproef trekken – a-selecte steekproef
3. Steekproef waarde (X) vaststellen – eigenschap waar je naar het kijken bent
4. Schatten door analyses – let altijd eerst op je meetniveau’s
Wil je een gemiddelde of standaarddeviatie uitrekenen moet je minimaal een interval of ratio
variabele hebben. Als je een ordinale of nominale variabele hebt, kun je geen gemiddelde
uitrekenen. Bij een ordinale variabele is de centrale tendentie maat = mediaan. De modus is van de
nominale.
Stel er is een populatie
- Populatie omvang, N = 4 personen
- Random variabele x = # glazen alcohol
- Waarden van x: 1, 2, 3, 4 (persoon 1 heeft 1 glas alcohol, persoon 2 heeft 2 glazen gehad,
etc..)
- Uniforme verdeling
Dan kun je het volgende uitrekenen:
3
Hoorcollege 1
Conceptuele achtergronden
- De cijfers spreken nooit voor zich
- Initiële observatie → theorie → hypothese → dataverzameling → analyse → uitspraak
(inference)
Onderzoeksvraag: waarom is er in sommige landen of gemeenten meer verzet tegen komst AZC dan
in andere?
1. Identificeren van de afhankelijke variabele: meningen over migratie (attitude-meting)
2. Bepalen van de mate van spreiding (variantie)
3. Op zoek naar factoren die deze spreiding mogelijk kunnen verklaren (mate van geluk, angst
voor misdaad)
4. Modellen opstellen die deze spreiding kunnen wegnemen
Modellen komen altijd terug op deze vier stappen. Basis voor ieder statistisch model.
Twee varianten van statistiek:
- Beschrijvende statistiek
- Verklarende statistiek (inferential statistics)
Datamatrix
- In je rijen staan je onderzoekseenheden
- In de kolommen staan je variabelen (variabelen varieert, heeft scores)
Typen gegevens
- Kwalitatieve gegevens (categorisch)
o Nominaal meetniveau (geslacht, nationaliteit)
o Ordinaal meetniveau (opleidingsniveau)
- Kwantitatieve gegevens (continue)
o Interval meetniveau (IQ, temperatuur)
o Ratio meetniveau (inkomen, leeftijd)
Eigenschappen
(kwantitatieve)
gegevens
Centrale
Spreiding Vorm
tendentie
Gemiddelde Bereik Scheefheid
Mediaan Kwartiel afstand Spitsheid
Modus Variantie
Standaarddeviati
e
Centrale tendentie
Maat Populatie Steekproef Type data
Modus - - N/O/I/R
Mediaan M m O/I/R
Gemiddelde µ X̄ I/R
1
,N = nominaal
O = ordinaal
I = interval
R = ratio
Tweede eigenschap van een verdeling: variantie
Maat Populatie Steekproef Type data
Bereik - - O/I/R
Interkwartiel range IQR IQR O/I/R
Variantie σ (tot de macht twee) s2 I/R
Standaarddeviatie σ s I/R
Spreiding: interkwartielrange
1. Maat voor spreiding in de middelste 50% van de waarnemingen (rondom de mediaan)
2. Verdeelt data in vier kwarten
3. Interkwartiel afstand = Q3 – Q1
Spreiding: standaarddeviatie
Maat Populatie Steekproef Type data
Bereik - - O/I/R
Interkwartiel range IQR IQR O/I/R
Variantie σ (tot de macht twee) s2 I/R
Standaarddeviatie σ s I/R
Als je met een steekproef werkt, deel je niet door N, maar door N-1. De onzekerheid wordt
meegenomen in de berekening.
In een ideale wereld zijn de datasets helemaal symmetrisch. Extreem lage waarde – gemiddelde
wordt omlaag getrokken → links-scheve verdeling.
Derde eigenschap van een verdeling: vorm spitsheid
Het kan zijn dat je verdeling heel spits is. Er is weinig spreiding.
- Maat = kurtosis
- Idee = inschatten of spreiding van variabele adequaat is (voor het toepassen van statistische
procedures)
Werken met de normale verdeling
- Klokvormig, symmetrisch
- Gemiddelde, mediaan en modus zijn gelijk
2
, - Heeft (in theorie) een oneindige range
Hoorcollege 2
Verdelingen van steekproefgrootheden
Schattingsproces
1. Populatie vaststellen, bijvoorbeeld de Nederlandse bevolking
2. Steekproef trekken – a-selecte steekproef
3. Steekproef waarde (X) vaststellen – eigenschap waar je naar het kijken bent
4. Schatten door analyses – let altijd eerst op je meetniveau’s
Wil je een gemiddelde of standaarddeviatie uitrekenen moet je minimaal een interval of ratio
variabele hebben. Als je een ordinale of nominale variabele hebt, kun je geen gemiddelde
uitrekenen. Bij een ordinale variabele is de centrale tendentie maat = mediaan. De modus is van de
nominale.
Stel er is een populatie
- Populatie omvang, N = 4 personen
- Random variabele x = # glazen alcohol
- Waarden van x: 1, 2, 3, 4 (persoon 1 heeft 1 glas alcohol, persoon 2 heeft 2 glazen gehad,
etc..)
- Uniforme verdeling
Dan kun je het volgende uitrekenen:
3