HOORCOLLEGE 1
Introductie
Statistiek: een hulpmiddel om gegevens samen te vatten. Dus
verzamelen, classificeren, samenvatten, organiseren, analyseren en
interpreteren van numerieke gegevens. Het is een hulpmiddel om een
onderzoeksvraag te beantwoorden.
Wetenschappelijk bewijzen: aantonen op basis van empirische
gegevens met een empirisch waargenomen resultaat.
Binnen de statistiek zijn er 2 varianten:
1. Beschrijvende statistiek: het beschrijven van je steekproef.
2. Toetsende statistiek: op basis van de steekproef uitspraken doen
over de populatie.
Het verschil hiertussen gaat over welke groep/eenheid je onderzoekt. Een
steekproef wordt getrokken uit een populatie.
Populatie (N) aantal personen of onderzoekseenheden in de populatie
(alle inwoners van Nederland).
Steekproef (n) het aantal onderzoekseenheden in de steekproef.
Onderzoekseenheden: over welke eenheid wil je uitspraken doen?
- Individuen, huishoudens, dorpen
Variabelen: eigenschappen van de onderzoekseenheden
- Sekse, leeftijd (individuen)
- Bruto inkomen, samenstelling (huishouden)
- Aantal inwoners, relatieve groenoppervlakten (dopen)
Waarden: scores die de onderzoekseenheid kan halen op de variabelen
Al deze gegevens gebruik je om uiteindelijk je onderzoeksvraag te
beantwoorden, door middel van statistische analyses.
In SPSS: de antwoorden van de respondenten staat op de pagina ‘’data
view’’ en onder ‘’variable view’’ staat een soort codeboek met de waarden
van elke variabele.
In rij: respondenten
,In kolom: de variabelen
Numerieke variabelen: getal
Alfanumerieke variabelen / string variabelen: tekst waarbij een
antwoord is gegeven op een open vraag.
- Statistische analyses niet mogelijk, het moet eerst omgezet worden
naar numerieke waarde.
- In Excel heet het ‘tekstveld’
Meetniveaus waarden van variabelen:
1. Kwalitatieve variabelen (categorische variabelen)
Nominaal: categorieën, geen volgorde/rangorde (bv godsdiensten)
Dichotome variabele (binary variabele): variabele die 2
waarden aan kan nemen.
Ordinaal: categorieën + ordening/rangorde van categorieën (bv
opleidingsniveau)
2. Kwantitatieve variabele (continue variabelen)
Interval: categorieën + ordening + betekenisvolle verschillen
(temperatuurschaal in graden Celsius)
Ratio: categorieën + ordening + verschillen + absoluut nulpunt
(leeftijd)
De meetniveaus hangen samen met de operationalisering.
Ontbrekende waarden:
- Respondent vraag onbewust niet beantwoord
- Respondent vraag bewust niet beantwoord (weet antwoord niet, wil
niet zeggen)
In SPSS wordt een ontbrekende waarde vaak aangeduid met bijvoorbeeld
99 of 999. Een rare waarden die niks betekent moet je dus buiten
beschouwing laten.
Univariate analyse: beschrijven één enkele variabele (geen
relaties).
Bivariate analyse: beschrijven samenhang/relatie van 2
variabelen.
Multivariate analyse: beschrijven samenhang/relatie van meer
dan 2 variabelen (trivariate analyse = drie variabelen)
, Stappen
1. Ga ik beschrijvende of toetsende statistiek toepassen?
2. Betreft het een onderzoeksvraag die hoort bij univariate, bivariate of
multivariate analyse?
3. Ga ik dit grafisch doen of numeriek?
4. Welk meetniveau hoort hierbij?
Univariate relaties: