Hoorcollege 1
Hoe kun je een onderzoeksvraag beantwoorden?
• Wat wordt er bedoeld met bepaalde begrippen?
• Hoe kun je deze begrippen meten?
• Operationaliseren.
Operationalisatie
• Omvat de operationalisatie wat ik wil onderzoeken?
• Hoe verhoudt mijn operationalisatie zich tot die van andere onderzoekers?
• Is er een standaard manier?
• In mijn operationalisatie eenvoudig meetbaar?
Meetniveaus van variabelen
• De gebruiker/onderzoeker kiest het meetniveau
- Kies het hoogst mogelijk zinvolle (mbt inhoud) meetniveau
Meetniveaus van variabelen
• Verschillende meetniveaus
- Nominaal: ongeordende categorieën (bijv. identity/labels: geslacht, politieke
voorkeur)
- Ordinaal: geordende categorieën (bijv. categorical: schaal: er slecht, voldoende, erg
goed)
- Interval: kwantitatief: zonder nulpunt waarin 0 niks betekend. Bijvoorbeeld
temperatuur of tijdstip.
- Ratio: kwantitatief: met een absoluut nulpunt wat dan ook ‘niks’ betekend.
Bijvoorbeeld gewicht, lengte en inkomen.
Discrete vs. continue metingen
• Een ander belangrijk kenmerk is of de data discreet of continu is.
• Discrete data:
- Getallen “ertussenin” hebben geen betekenis
• Continue data:
- Getallen “ertussenin” hebben wel betekenis
Nominaal en ordinaal zijn vaak discreet.
Interval en ratio kunnen beide zijn.
Data set met meerdere getallen (bijv. subset van lengtes van studenten) →
sample/steekproef.
Data (sample) analyse
- Twee (complementary) aanpakken van data analyse:
• Grafische weergave van de data
• Vat kenmerken van de data numeriek samen
• De keuze van een bepaalde plot/grafiek is afhankelijk van het meetniveau van je
variabele.
,Histogram
- Elke staaf is een klasse
- Er is een klasse voor elke range van getallen in de data
- Alle klassen hebben dezelfde breedte
- De hoogte van de klasse is het aantal waarnemingen in de klasse
- Er zit geen ruimte/gaten tussen de klassen! (Dit is een verschil met een
staafdiagram!!!)
Doel van grafieken
- Meestal het helpen begrijpen van de data
- Kijk altijd naar het algemene patroon en naar opvallende afwijkingen van dat
patroon
- Te stellen vragen bij het bekijken van een grafiek:
• Waar ligt het ‘centrum’ van de data? (center)
• Waar zie je een clustering/ophoping van de data? (center)
• Hoe is de spreiding van de data? (spread)
• Is de verdeling symmetrisch? (shape, outliers)
Samenvattingsmaten
- Te stellen vragen bij het bekijken van een grafiek:
• Waar ligt het ‘centrum’ van de data?
➢ Central tendency: median, mean
• Waar zie je een clustering/ophoping van de data?
➢ Modus/mode
• Hoe is de spreiding van de data?
➢ Spreiding: range; variantie; standaarddeviatie, interquartile range
(IQR).
• Is de verdeling symmetrisch?
➢ Vorm: outliers/uitbijters
Central tendency
- Waar ligt het ‘centrum’ van de data?
• Wat is het “middelste” getal → mediaan
• Wat is het “gemiddelde” getal → mean
• Wat is het meest voorkomende getal? Waar is een clustering van de data? →
modus
Centrum: mean/gemiddelde
- Het steekproefgemiddelde is de meest belangrijke centrummaat (measure of central
tendency)
- Dit is het punt waarbij de som van alle afwijkingen hiervan gelijk is aan 0.
- Kan gezien worden als een “balanspunt” van de steekproef.
- Het gemiddelde van de waarnemingen wordt weergegeven als x met een streepje
erboven.
,Spreiding:
Hoe verspreid is de data? Hoe verschillend zijn de waarnemingen van elkaar?
▪ Range = max - min
▪ Variantie
▪ Standaarddeviatie
▪ Interkwartielafstand / Interquartile range (IQR)
Spreiding: Interquartile range (IQR)
• Bepaal de kwartielen op een vergelijkbare manier als de mediaan.
- Eerste kwartiel (Q1): mediaan van de laagste 50% van de waarnemingen.
- Tweede kwartiel (Q2): mediaan van de waarnemingen
- Derde kwartiel (Q3): mediaan van de hoogste 50% van de waarnemingen.
• IQR is de range van de middelste 50% van de data.
- Bepaal Q1 en Q3
- Het verschil tussen Q1 en Q3 is de interquartile range
, Five number summary
We kunnen elke verdeling weergeven met vijf
getallen: de range en de kwartielen → Dit noemen we de five-number summary.
▪ Eerste getal: minimum, kleinste waarneming
▪ Tweede getal: eerste kwartiel
▪ Derde getal: mediaan/tweede kwartiel
▪ Vierde getal: derde kwartiel
▪ Vijfde getal: maximum, grootste waarneming
➢ De five number summary heeft ook een grafische
➢ vorm: box plot
Waarom boxplots?
- Snel een goed overzicht van de belangrijke kenmerken van de steekproef.
- Boxplots kunnen makkelijker op een klein stuk papier.
Vorm: Outliers
- Hoe outliers vinden?
• Gebruik histogram en boxplot
• 1,5 x IQR rule
➢ Een waarneming die verder af ligt dan 1,5 x IQR
➢ = onder het 1e kwartiel
➢ = boven het 3e kwartiel
• Eigen inzicht is belangrijk: er is geen harde beslisregel
Hoorcollege 2
Nog even over college 1:
• Onderzoeksvraag:
- Operationalisatie van concepten
- Meten (kies zelf het meetniveau: nominaal/ordinaal/interval/ratio; discreet vs.
continu)
• Data verzameling (steekproef/sample)
Inspecteer de data voor elke variabele:
- Grafisch
- Numeriek
➢ Centrum: mediaan, gemiddelde, modus
➢ Spreiding: range, IQR, variantie, standaarddeviatie
➢ Vorm: outliers
Lineaire transformaties
• Lijkt een losstaand stukje theorie en is vrij wiskundig
• We zullen dit vaak (onbewust) toepassen