CORRELATIONELE
ONDERZOEKSMETHODEN
Jaar 2 – semester 1
COLLEGE 1
EMPIRISCH ONDERZOEK
Aspecten van empirisch onderzoek:
Steekproeven vs. populatie
Beschrijvende vs. toetsende statistiek
Meetniveaus; nominaal, ordinaal, interval, ratio
Experimenteel/quasi-experimenteel/correlationeel onderzoek
Uit de populatie wordt een steekproef getrokken, afhankelijk van ons sampling
design. Hieruit komen descriptives en kunnen we met inferential statistics
iets zeggen over de populatie.
STEEKPROEVEN
Sampling designs:
Simple random sampling: elk element in de populatie heeft dezelfde kans om in de
steekproef te komen
Stratified sampling: populatie wordt opgedeeld in strata (geslacht/leeftijd/etc.);
binnen elk stratum wordt een volledig aselecte steekproef getrokken
Convenience sampling: steekproef bestaat uit de diegene die voorhanden zijn (bijv.
alle aanwezigen in een kantine)
DESCRIPTIVES
= beschrijvende statistiek: vatten data samen; maken geen aannames over populatie
buiten de steekproef
Data kan je beschrijven door te kijken naar:
Centrummaten; gemiddelde, mediaan (middelste), modus (hoogste frequentie)
Spreidingsmaten; variantie, standaarddeviatie
INFERENTIËLE STATISTIEK
Wanneer we resultaten willen generaliseren naar de populatie zijn beschrijvende
statistieken niet genoeg
Inferentiële statistiek om conclusies te trekken over de populatie, op basis van de
informatie uit de steekproef
2 mogelijke problemen:
Representativiteit van de steekproef
Sampling error
Null hypothesis significance testing:
1. Formuleren van nul en alternatieve hypothese
2. Beslisregel maken; wanneer p<a
, 3. T- en p-waarde halen uit output
4. Wel of niet verwerpen van nulhypothese en conclusie trekken
BETROUWBAARHEIDSINTERVALLEN
C: level van betrouwbaarheid; geeft aan in hoeveel procent van de
betrouwbaarheidsintervallen het populatiegemiddelde zou vallen
1) Zoek de kritieke waarde t - via tabel met c en df
2) Bereken SEM met SD en N
3) Vind de lage en hoge limiet van de betrouwbaarheid:
M + (tkritiek * SEM)
4) Limiet schrijf je als [lage limiet; hoge limiet]
Betrouwbaarheidsinterval breder bij;
Hogere betrouwbaarheid
Kleinere N
Grotere SD
Je wilt het betrouwbaarheidsinterval het liefste zo smal mogelijk
Betrouwbaarheidsinterval is niet betrouwbaar wanneer er een 0 in zit.
MEETNIVEAUS
Categorische variabelen: geslacht, type opleiding, experimentele conditie,
diagnose, sociale klasse
Kwantitatieve/continue variabelen: leeftijd, IQ, NEO-PI scores,
tentamencijfers, scores op vragenlijsten
ONDERZOEKSDESIGNS
Experimenteel: zowel probability sampling, random toewijzing en “actieve”
manipulatie
actieve manipulatie = onderzoeker heeft controle over onafhankelijke variabele
Quasi-experimenteel: probability sampling en “actieve” manipulatie
Correlationeel: alleen probability sampling
CORRELATIONELE ONDERZOEKSMETHODEN
Samenhang tussen variabelen onderzoeken
Pearson’s correlatie coëfficiënt: maat voor lineaire samenhang
r = correlatie in populatie
r = correlatie in steekproef
Sterk r > 0.50, matig r > 0.30, zwak r > 0.10
r2 = proportie variantie in Y dat verklaart kan worden door X
Toetsen van correlatie coëfficiënt: H0 (r=0) tegen H1
P-waarde: de kans dat je een extremere waarde vindt dan de nu gevonden waarde
T-toets: toetsen of gevonden correlatie gegeneraliseerd mag worden naar populatie
bij eenzijdige toets; p-waarde delen door 2, maar significantie niet
Type I error: onterecht verwerpen van nulhypothese, risico op = α
Type II error: onterecht behouden van nulhypothese, risico op kan niet geschat worden
ONDERZOEKSMETHODEN
Jaar 2 – semester 1
COLLEGE 1
EMPIRISCH ONDERZOEK
Aspecten van empirisch onderzoek:
Steekproeven vs. populatie
Beschrijvende vs. toetsende statistiek
Meetniveaus; nominaal, ordinaal, interval, ratio
Experimenteel/quasi-experimenteel/correlationeel onderzoek
Uit de populatie wordt een steekproef getrokken, afhankelijk van ons sampling
design. Hieruit komen descriptives en kunnen we met inferential statistics
iets zeggen over de populatie.
STEEKPROEVEN
Sampling designs:
Simple random sampling: elk element in de populatie heeft dezelfde kans om in de
steekproef te komen
Stratified sampling: populatie wordt opgedeeld in strata (geslacht/leeftijd/etc.);
binnen elk stratum wordt een volledig aselecte steekproef getrokken
Convenience sampling: steekproef bestaat uit de diegene die voorhanden zijn (bijv.
alle aanwezigen in een kantine)
DESCRIPTIVES
= beschrijvende statistiek: vatten data samen; maken geen aannames over populatie
buiten de steekproef
Data kan je beschrijven door te kijken naar:
Centrummaten; gemiddelde, mediaan (middelste), modus (hoogste frequentie)
Spreidingsmaten; variantie, standaarddeviatie
INFERENTIËLE STATISTIEK
Wanneer we resultaten willen generaliseren naar de populatie zijn beschrijvende
statistieken niet genoeg
Inferentiële statistiek om conclusies te trekken over de populatie, op basis van de
informatie uit de steekproef
2 mogelijke problemen:
Representativiteit van de steekproef
Sampling error
Null hypothesis significance testing:
1. Formuleren van nul en alternatieve hypothese
2. Beslisregel maken; wanneer p<a
, 3. T- en p-waarde halen uit output
4. Wel of niet verwerpen van nulhypothese en conclusie trekken
BETROUWBAARHEIDSINTERVALLEN
C: level van betrouwbaarheid; geeft aan in hoeveel procent van de
betrouwbaarheidsintervallen het populatiegemiddelde zou vallen
1) Zoek de kritieke waarde t - via tabel met c en df
2) Bereken SEM met SD en N
3) Vind de lage en hoge limiet van de betrouwbaarheid:
M + (tkritiek * SEM)
4) Limiet schrijf je als [lage limiet; hoge limiet]
Betrouwbaarheidsinterval breder bij;
Hogere betrouwbaarheid
Kleinere N
Grotere SD
Je wilt het betrouwbaarheidsinterval het liefste zo smal mogelijk
Betrouwbaarheidsinterval is niet betrouwbaar wanneer er een 0 in zit.
MEETNIVEAUS
Categorische variabelen: geslacht, type opleiding, experimentele conditie,
diagnose, sociale klasse
Kwantitatieve/continue variabelen: leeftijd, IQ, NEO-PI scores,
tentamencijfers, scores op vragenlijsten
ONDERZOEKSDESIGNS
Experimenteel: zowel probability sampling, random toewijzing en “actieve”
manipulatie
actieve manipulatie = onderzoeker heeft controle over onafhankelijke variabele
Quasi-experimenteel: probability sampling en “actieve” manipulatie
Correlationeel: alleen probability sampling
CORRELATIONELE ONDERZOEKSMETHODEN
Samenhang tussen variabelen onderzoeken
Pearson’s correlatie coëfficiënt: maat voor lineaire samenhang
r = correlatie in populatie
r = correlatie in steekproef
Sterk r > 0.50, matig r > 0.30, zwak r > 0.10
r2 = proportie variantie in Y dat verklaart kan worden door X
Toetsen van correlatie coëfficiënt: H0 (r=0) tegen H1
P-waarde: de kans dat je een extremere waarde vindt dan de nu gevonden waarde
T-toets: toetsen of gevonden correlatie gegeneraliseerd mag worden naar populatie
bij eenzijdige toets; p-waarde delen door 2, maar significantie niet
Type I error: onterecht verwerpen van nulhypothese, risico op = α
Type II error: onterecht behouden van nulhypothese, risico op kan niet geschat worden