OM4 HOORCOLLEGES
HC 1 Het idee achter statistiek 1
THE BASICS 1: VARIABELEN
Variabelen
Unit of analysis: datgene waarover je informatie verzamelt
Individuen, bedrijven, landen, scholen (kan van alles zijn)
Meestal individuen
Variabelen: gemeten kenmerken van een unit of analysis
De vragen in je vragenlijst worden variabelen
Geslacht, leeftijd, BNP, de Likert-scales in je enquête
Values: de scores van een unit of analysis op een variabele
‘Man/vrouw’, ‘leeftijd in jaren’, ‘grotendeels mee oneens’
(On)afhankelijke variabelen
Onafhankelijke variabele: de vermoedelijke oorzaak, de predictor. Noemen we X.
o Heeft invloed op iets anders
Afhankelijke variabele: het vermoedelijke gevolg, de outcome. Noemen we Y.
o Wordt beïnvloed door iets anders
Per analyse vaak één afhankelijke, maar mogelijk meerdere onafhankelijken
Theorie en je hoofdvraag zijn bepalend:
o Hoe beïnvloedt lidmaatschap van een studentenvereniging sociaal kapitaal?
o Wat is het effect van sociaal kapitaal op socio-economische status? (sociaal
kapitaal de onafhankelijke variabele)
Geslacht en leeftijd zijn vrijwel altijd onafhankelijk
,Tentamenvraag vorig jaar
• Het ging zojuist steeds over data met individuen als de unit of analysis. Verzin een
onderzoeksvraag waarbij landen de unit of analysis zijn.
- Wat is het effect van het werkloosheidspercentage van een land op het BnP?
THE BASICS 2: MEETNIVEAUS
Meetniveaus
Categoriaal - iemand valt per se in een klasse/groep
- Binair
- Nominaal
- Ordinaal
Continu - iemand kan overal op de schaal zitten
- Interval
- Ratio
Categoriaal: variabelen met verschillende categorieën
- Binair: 2 categorieën
- Nominaal: meer dan 2 categorieën (welke politieke partij heb je gestemd)
- Ordinaal: inherente ordening (opleidingsniveau)
Continu: kan in theorie iedere waarde aannemen
- Interval: verschillen op schaal zijn betekenisvol
- Ratio: ratios zijn betekenisvol (vanwege nulpunt) (leeftijd)
Meetniveaus in SPSS In SPSS alleen ‘nominal’, ‘ordinal' en ‘scale’
SPSS: Scale
- Categoriaal
o Binair -> SPSS: Nominal (groepen die naast elkaar staan)
o Nominaal -> SPSS: Nominal
o Ordinaal -> SPSS: Ordinal (groepen met wel ordening)
- Continu
o Interval -> SPSS: Scale (alle schalen, je kan elke waarde aanemen)
o Ratio -> SPSS: Scale
Meetniveaus
- Waarom zijn meetniveaus zo belangrijk?
o Als je dit niet goed snapt, kun je later in de knoop raken
o Meetniveau bepaalt welke statistische toets mogelijk is
Voor een afhankelijke variabele is ‘scale’ het beste
Vaak meerdere Likert-scales samengevoegd
- Meetniveau niet vaststaand: antwoordopties van een vraag bepalen het meetniveau
van een variabele!
, 1. Binair
2. Nominaal
3. Ordinaal
Vraag 1. Scale
Vraag 2. Ordinaal
Tentamenvraag vorig jaar
Wat is het meetniveau van onderstaande vraag/variabele?
Hoeveel uur per dag spendeert u naar schatting achter uw computer of laptop?
- 0-3 uur
- 3-6 uur
- 6-9 uur
- Meer dan 9 uur
Meetniveau is ordinaal, je kiest namelijk een groep en deze groepen staan in een
bepaalde logische ordening.
, THE BASICS 3: GEMIDDELDE EN STANDAARDDEVIATIE
Ken uw data
- Centrummaten
o Mediaan
o Modus
o Gemiddelde
- Spreidingsmaten
o Range
o Standaarddeviatie: gemiddelde afwijking van het gemiddelde
Alle deviance2 opgeteld is Sum of squares! Hier 19,5
Sum of squares
- We hebben nu de Sum of Squares, de kwadratensom
o Vooruitblik: die gaan we vaker tegenkomen
- Probleem;
o Afhankelijk van het aantal scores, het aantal respondenten
o Sum of squares groter wanneer je dataset groter is
HC 1 Het idee achter statistiek 1
THE BASICS 1: VARIABELEN
Variabelen
Unit of analysis: datgene waarover je informatie verzamelt
Individuen, bedrijven, landen, scholen (kan van alles zijn)
Meestal individuen
Variabelen: gemeten kenmerken van een unit of analysis
De vragen in je vragenlijst worden variabelen
Geslacht, leeftijd, BNP, de Likert-scales in je enquête
Values: de scores van een unit of analysis op een variabele
‘Man/vrouw’, ‘leeftijd in jaren’, ‘grotendeels mee oneens’
(On)afhankelijke variabelen
Onafhankelijke variabele: de vermoedelijke oorzaak, de predictor. Noemen we X.
o Heeft invloed op iets anders
Afhankelijke variabele: het vermoedelijke gevolg, de outcome. Noemen we Y.
o Wordt beïnvloed door iets anders
Per analyse vaak één afhankelijke, maar mogelijk meerdere onafhankelijken
Theorie en je hoofdvraag zijn bepalend:
o Hoe beïnvloedt lidmaatschap van een studentenvereniging sociaal kapitaal?
o Wat is het effect van sociaal kapitaal op socio-economische status? (sociaal
kapitaal de onafhankelijke variabele)
Geslacht en leeftijd zijn vrijwel altijd onafhankelijk
,Tentamenvraag vorig jaar
• Het ging zojuist steeds over data met individuen als de unit of analysis. Verzin een
onderzoeksvraag waarbij landen de unit of analysis zijn.
- Wat is het effect van het werkloosheidspercentage van een land op het BnP?
THE BASICS 2: MEETNIVEAUS
Meetniveaus
Categoriaal - iemand valt per se in een klasse/groep
- Binair
- Nominaal
- Ordinaal
Continu - iemand kan overal op de schaal zitten
- Interval
- Ratio
Categoriaal: variabelen met verschillende categorieën
- Binair: 2 categorieën
- Nominaal: meer dan 2 categorieën (welke politieke partij heb je gestemd)
- Ordinaal: inherente ordening (opleidingsniveau)
Continu: kan in theorie iedere waarde aannemen
- Interval: verschillen op schaal zijn betekenisvol
- Ratio: ratios zijn betekenisvol (vanwege nulpunt) (leeftijd)
Meetniveaus in SPSS In SPSS alleen ‘nominal’, ‘ordinal' en ‘scale’
SPSS: Scale
- Categoriaal
o Binair -> SPSS: Nominal (groepen die naast elkaar staan)
o Nominaal -> SPSS: Nominal
o Ordinaal -> SPSS: Ordinal (groepen met wel ordening)
- Continu
o Interval -> SPSS: Scale (alle schalen, je kan elke waarde aanemen)
o Ratio -> SPSS: Scale
Meetniveaus
- Waarom zijn meetniveaus zo belangrijk?
o Als je dit niet goed snapt, kun je later in de knoop raken
o Meetniveau bepaalt welke statistische toets mogelijk is
Voor een afhankelijke variabele is ‘scale’ het beste
Vaak meerdere Likert-scales samengevoegd
- Meetniveau niet vaststaand: antwoordopties van een vraag bepalen het meetniveau
van een variabele!
, 1. Binair
2. Nominaal
3. Ordinaal
Vraag 1. Scale
Vraag 2. Ordinaal
Tentamenvraag vorig jaar
Wat is het meetniveau van onderstaande vraag/variabele?
Hoeveel uur per dag spendeert u naar schatting achter uw computer of laptop?
- 0-3 uur
- 3-6 uur
- 6-9 uur
- Meer dan 9 uur
Meetniveau is ordinaal, je kiest namelijk een groep en deze groepen staan in een
bepaalde logische ordening.
, THE BASICS 3: GEMIDDELDE EN STANDAARDDEVIATIE
Ken uw data
- Centrummaten
o Mediaan
o Modus
o Gemiddelde
- Spreidingsmaten
o Range
o Standaarddeviatie: gemiddelde afwijking van het gemiddelde
Alle deviance2 opgeteld is Sum of squares! Hier 19,5
Sum of squares
- We hebben nu de Sum of Squares, de kwadratensom
o Vooruitblik: die gaan we vaker tegenkomen
- Probleem;
o Afhankelijk van het aantal scores, het aantal respondenten
o Sum of squares groter wanneer je dataset groter is