Aantekeningen Onderzoeks- en interventiemethodologie B
,Hoorcollege 1 (05-02-2020)
Basisbeginselen statistiek, beschrijvende statistiek
Gebruik en misbruik van statistiek
Asylum trends, rapportage Eurostat (December 2015)
Welk Europees land behandelde (in 1e helft van 2015) relatief gezien de meest asielaanvragen?
• In relatie tot de grootte van het land → hoeveel mensen passen er in het land?
• In relatie tot de bevolkingsomvang →hoeveel mensen wonen er?
• In relatie tot de welvarendheid (BNP) → economie, hoe rijk is dit land?
Inhoud cursus
Inleidende statistiek Toetsende statistiek
Beschrijvende statistiek (1) T-toetsen (3)
• Verschillen tussen twee groepen
Centrale limietstelling Veredelingsvrije statistiek (4)
betrouwbaarheidsintervallen (2)
Hypothese toetsing (3) Variantieanalyse (5)
• Toetsen in experimenten
Correlatie (5)
Regressieanalyse
• Enkelvoudige lineaire regressie (6)
• Multipele lineaire regressie (7)
Conceptuele achtergronden
Data spreekt nooit voor zich! Je kunt het manipuleren of selecteren.
• De cijfers spreken nooit voor zich
• Initiële observatie → theorie → hypothese → dataverzameling → analyse → uitspraak (inference)
Onderzoeksvraag: Waarom is er in sommige landen op gemeenten meer verzet tegen komst AZC dan in
andere?
1. Identificeren van de afhankelijke variabele (=het gene wat je wilt gaan verklaren/meten). Deze
afhankelijke variabele wordt beïnvloed door verschillende dingen.
a. Meningen over migratie (attitude-meting)
2. Bepalen van de mate van spreiding (=variantie) in die variabele → niet iedereen denkt er hetzelfde
over
3. Op zoek naar factoren die deze spreiding mogelijk kunnen verklaren (mate van geluk, angst voor
misdaad)
4. Modellen opstellen die deze spreiding kunnen wegnemen → precies verklaren in welke groep je valt.
,Beschrijvende & verklarende statistiek. (=gevolgtrekking op basis van het geheel)
Rijen → onderzoekeenheden (het gene waarover je uitspraak gaat doen
Scores zijn altijd numeriek → altijd getallen
Typen gegevens/data
Kwalitatieve gegevens (categorisch) → alleen in categorieën in te delen
• Nominaal meetniveau (geslacht, nationaliteit)
• Ordinaal meetniveau (opleidingsniveau)
Kwantitatieve gegevens (continue)
• Interval meetniveau (IQ, temperatuur)
• Ratio meetniveau (inkomen, leeftijd)
Hoe meer spreiding, hoe beter de resultaten.
Missing values= scoren die ontbreken. Mensen die niet mee doen in de analyse.
1. Opvragen van een frequentieverdeling (absoluut & relatief) → welke antwoorden zijn er mogelijk en
hoe vaak komen ze voor?
Eigenschappen data
, • Centrale tendentie (locatie)
o Gemiddelde
o Mediaan
o Modus
• Spreiding (variantie)
o Bereik
o Kwartiel afstand
o Variantie
o Standaarddeviatie
• Vorm
o Scheefheid
o Spitsheid
De frequentieverdeling is scheef verdeeld. Je hebt niet
voldoende data over mensen die niet zo happy zijn.
Representatie verschillen, omdat je bij de eerste begint met
heel veel zorgen ga je negatief kijken naar de 50% die soms
zorgen heeft over criminaliteit. Bij de tweede tabel neem je de
81% die zich soms zorgen maakt positief. Ze maken zich dus
niet heel vaak zorgen.
,Hoorcollege 1 (05-02-2020)
Basisbeginselen statistiek, beschrijvende statistiek
Gebruik en misbruik van statistiek
Asylum trends, rapportage Eurostat (December 2015)
Welk Europees land behandelde (in 1e helft van 2015) relatief gezien de meest asielaanvragen?
• In relatie tot de grootte van het land → hoeveel mensen passen er in het land?
• In relatie tot de bevolkingsomvang →hoeveel mensen wonen er?
• In relatie tot de welvarendheid (BNP) → economie, hoe rijk is dit land?
Inhoud cursus
Inleidende statistiek Toetsende statistiek
Beschrijvende statistiek (1) T-toetsen (3)
• Verschillen tussen twee groepen
Centrale limietstelling Veredelingsvrije statistiek (4)
betrouwbaarheidsintervallen (2)
Hypothese toetsing (3) Variantieanalyse (5)
• Toetsen in experimenten
Correlatie (5)
Regressieanalyse
• Enkelvoudige lineaire regressie (6)
• Multipele lineaire regressie (7)
Conceptuele achtergronden
Data spreekt nooit voor zich! Je kunt het manipuleren of selecteren.
• De cijfers spreken nooit voor zich
• Initiële observatie → theorie → hypothese → dataverzameling → analyse → uitspraak (inference)
Onderzoeksvraag: Waarom is er in sommige landen op gemeenten meer verzet tegen komst AZC dan in
andere?
1. Identificeren van de afhankelijke variabele (=het gene wat je wilt gaan verklaren/meten). Deze
afhankelijke variabele wordt beïnvloed door verschillende dingen.
a. Meningen over migratie (attitude-meting)
2. Bepalen van de mate van spreiding (=variantie) in die variabele → niet iedereen denkt er hetzelfde
over
3. Op zoek naar factoren die deze spreiding mogelijk kunnen verklaren (mate van geluk, angst voor
misdaad)
4. Modellen opstellen die deze spreiding kunnen wegnemen → precies verklaren in welke groep je valt.
,Beschrijvende & verklarende statistiek. (=gevolgtrekking op basis van het geheel)
Rijen → onderzoekeenheden (het gene waarover je uitspraak gaat doen
Scores zijn altijd numeriek → altijd getallen
Typen gegevens/data
Kwalitatieve gegevens (categorisch) → alleen in categorieën in te delen
• Nominaal meetniveau (geslacht, nationaliteit)
• Ordinaal meetniveau (opleidingsniveau)
Kwantitatieve gegevens (continue)
• Interval meetniveau (IQ, temperatuur)
• Ratio meetniveau (inkomen, leeftijd)
Hoe meer spreiding, hoe beter de resultaten.
Missing values= scoren die ontbreken. Mensen die niet mee doen in de analyse.
1. Opvragen van een frequentieverdeling (absoluut & relatief) → welke antwoorden zijn er mogelijk en
hoe vaak komen ze voor?
Eigenschappen data
, • Centrale tendentie (locatie)
o Gemiddelde
o Mediaan
o Modus
• Spreiding (variantie)
o Bereik
o Kwartiel afstand
o Variantie
o Standaarddeviatie
• Vorm
o Scheefheid
o Spitsheid
De frequentieverdeling is scheef verdeeld. Je hebt niet
voldoende data over mensen die niet zo happy zijn.
Representatie verschillen, omdat je bij de eerste begint met
heel veel zorgen ga je negatief kijken naar de 50% die soms
zorgen heeft over criminaliteit. Bij de tweede tabel neem je de
81% die zich soms zorgen maakt positief. Ze maken zich dus
niet heel vaak zorgen.