onderzoek
Week 1: Correlaties en maten voor effectgrootte
Verband vorige cursussen:
- Algemeen:
1) Hypothesetoetsing
2) Steekproevenverdeling
3) Maten voor effectgrootte
- Specifiek
1) Scatterplot, covariantie, pearson r (IMT week 7)
2) Standaardscores (IMT week 6)
3) T-verdeling (TS week 4 en 5)
4) X2 en Φ (TS week 3 en 8)
Correlatie ≠ causatie
- Correlatie -> is er samenhang tussen variabele
- Causaliteit -> is er een effect?
o Criteria:
1) Covariantie: variabele moeten samenhangen
2) Directionaliteit: oorzaak gaat vooraf aan gevolg
3) Interne validiteit: alternatieve verklaringen uitgesloten
Scatterplots
> Visualiseert samenhang tussen 2 variabele
- Richting (positief vs. negatief)
- Sterkte (hoe méér punten op 1 (rechte) lijn liggen, hoe sterker het verband)
- Vorm (lineair vs. niet lineair) (homogeen vs. heterogeen)
- Uitbijters (punten die ver van de andere liggen)
Covariantie (sxy)
> Mate waarin 2 variabele variëren
- s xy=
∑ (x i−x )( y i− y )
N−1
o Boven de breuk = kruisproduct
o Howell noemt hem covxy
- Covariantie geeft informatie over de sterkte en richting van de samenhang
- Nadeel: waarde is afhankelijk van meeteenheid -> dus, standaardiseren
Alternatieve correlatiecoëfficiënten
- Meest gebruikt: Pearson (product-moment) correlatiecoëfficiënt r
- Maar er zijn er meer, afhankelijk van meetniveau:
o Kwantitatief + kwantitatief = Pearson r
o Ordinal + ordinal = Spearman’s rho (rs)
o Dichotoom + kwantitatief = Punt-biseriële correlatie (rpb)
o Dichotoom + dichotoom = phi-coëfficiënt (Φ)
Dichotoom = maar twee opties/alternatieve
- Te berekenen met:
o Pearson r procedure
o Specifieke formule (bij Φ)
1
, - Drie factoren die sterkte van correlatie ten onrechte kunnen verhogen of verlagen:
o 1) Restricted range, 2) uitbijters, 3) betrouwbaarheid meetinstrumenten
Pearson r
> Gestandaardiseerde maat die het lineaire verband beschrijft tussen twee kwantitatieve
variabele
- Altijd tussen de -1 en +1
s xy
- r=
sx s y
- r=
∑ zx zy
N−1
- Voordeel: makkelijk te interpreteren, waarde is niet afhankelijk van meeteenheid
- Factoren die Pearson r beïnvloeden:
o Pas op voor:
1) Niet lineaire verbanden
2) Uitbijters
3) Heterogene subgroepen
4) Restriction of range
- Deze r is geen goede schatting van de correlatiecoefficient van de populatie (ρ), om
hiervoor te corrigeren gebruik je de aangepaste correlatiecoëfficiënt raang:
√
2
o r aang = 1− (1−r )(N −1)
N −2
Spearman’s rho (rs)
> Samenhang tussen 2 ordinale/gerangorde variabele
- Scores omzetten in rangnummers
- Dan: gebruik Pearson correlatieformule op de rangnummers om rs te berekenen
- Gemiddelde en standaard deviatie voor rangscores:
N +1
o x r=
2
√
o sr = N (N + 1)
12
- Rs is robuuste variant van Pearson r bij uitbijters en/of zwakke lineairiteit
- Spearman’s rho is niet gevoelig voor uitbijters
Punt-biseriële correlatie (rpb)
> Samenhang dichotome en kwantitatieve variabele
- Gebruik Pearson correlatieformule om rpb te berekenen
- Rpb=r
- Relatie rpb en independent t-test
√
2
o r pb= 2 t
t + df
o t is hier verkregen uit de t test voor verschil tussen gemiddelden, df=N1+N2-2
- Correlatie hangt af van wijze waarin 0 en 1 zijn toegewezen aan groepen
- Verband niet meer omschrijven als positief of negatief, maar aan de hand van het
verschil in gemiddeldes.
Phi coëfficiënt (Φ)
> Samenhang 2 dichotome variabele
2
, - Gebruikt Pearson correlatieformule om Φ te berekenen
o Φ=r
- NB correlatie hangt af van wijze waarin 0 en 1 zijn toegewezen aan groepen (we
kijken dus niet echt of Φ + of – is)
- Berekenen:
o
Significantietoetsing van r
- r, rs, rpb en Φ zeggen iets over samenhang steekproef
- Wat zeggen ze over correlatie in populatie (ρ)?
- Uitgangspunt: er is geen correlatie:
o H0: ρ=0 (ρ = rho = populatiecorrelatie)
o Ha: ρ≠0 óf Ha: ρ>0 óf Ha: ρ<0
- T-toets voor het toetsen van de significantie van r:
r √ N −2
o t=
√1−r 2
o Met df = N-2
o r in de formule kan staan voor r, rs, rpb of Φ
Correlatie en significantie
- Statistische significantie hangt af van N, r en 𝛼
- Resultaat
o Significantie van lage correlaties in grote steekproeven
o Niet-significantie van hoge correlaties in kleine steekproeven
- Dus: alleen significantietoetsing is te beperkt
Maten voor effectgrootte
> reffect = r, rs, rpb en Φ
- Nadeel: moeilijk te interpreteren
- Oplossing: kwadrateren
o r2
Coëfficiënt of determination (COD)
Proportie verklaarde variantie (VAF)
o Voordeel: r2’s vergelijken
o Kritiek
Moeilijk te interpreteren
Geen informatie over richting
Kleine waarde r -> r2 nog kleiner
VAF soms niet terug te brengen tot correlatie
Vuistregels effectgrootte (Cohen):
3