Week 1:
HC 1: Correlaties en maten voor effectgrootte
Opfrissen van voorkennis:
Pearson r is geschikt voor de samenhang tussen variabele van interval en ratio meetniveau’s, dus
numerieke variabele.
De pearson r kan alleen gebruikt worden bij een lineaire samenhang. De correlatiecoëfficiënt ligt
altijd tussen -1 en 1, het maakt voor deze waarde niet uit welke variabele afhankelijk en
onafhankelijk is. Het maakt dus niet uit welke op de y-as staat en welke op de x-as.
Correlatie is geen causaliteit;
Correlatie= is er samenhang tussen twee variabelen?
Causaliteit= is er een effect?
Voorwaarden voor causaliteit:
- Covariantie= variabelen moeten samenhangen
- Directionaliteit= oorzaak gaat vooraf aan gevolg
- Interne validiteit= alternatieve verklaringen moeten uitgesloten worden.
Als het gaat om correlaties is het goed om te beginnen met het maken van een scatterplot. Dit geeft
een visuele weergave van de data waardoor je soms in één oogopslag kan zien of en wat voor
samenhang er is.
Scatterplots bekijken:
1. Richting:
Positief vs. Negatief
2. Sterkte:
Hoe meer de punten op één lijn liggen hoe sterker het verband.
3. Vorm:
Lineair of niet-lineair.
Homogeen of heterogeen (=meerdere clusters). Deze vormen kunnen mogelijk komen door
een mogelijke derde variabele in de samenhang.
4. Uitbijters :
Punten die ver van andere punten liggen. Van invloed op de sterkte van de correlatie.
,Covariantie (sxy)= de mate waarin twee variabele samen variëren.
- Het geeft informatie over de sterkte en de richting van samenhang.
- Het is echter moeilijk te interpreteren want de waarde is afhankelijk van de meeteenheid.
Een oplossing voor de nadelen van de covariantie was het standaardiseren van deze maat, hieruit
kwam de Pearson r.
Pearson r= een gestandaardiseerde maat die het lineaire verband beschrijft tussen twee
kwantitatieve (numerieke) variabelen en waarvan de waarde altijd tussen -1 en 1 ligt.
- Makkelijker te interpreteren want de waarde is niet afhankelijk van de meeteenheid.
- Pas op voor:
1. Niet-lineaire verbanden:
Pearson r niet te gebruiken bij dit soort verbanden.
2. Uitbijters:
Beïnvloed de waarde van de correlatie.
3. Heterogene subgroepen:
Invloed van een derde variabele in het spel.
4. Restriction of range:
Beperkt deel van de mogelijke waardes wordt in kaart gebracht, je mist dan een deel
van de mogelijke samenhang wat een vertekend beeld kan geven.
Sx= standaarddeviatie x zx= z-score van x
Sy= standaarddeviatie y zy= z-score van y
Z-score= hoeveel standaarddeviaties een score afwijkt van een gemiddelde.
De z scores zijn als volgt te berekenen:
Voorbeeld Pearson r:
Is de perceptie van een bepaalde docent met betrekking tot intelligentie van haar leerlingen
gerelateerd aan IQ scores van die kinderen gemeten met een test?
Informatie:
12 participanten,
X=perceptie docent op intelligentie (1-10),
Y=IQ score leerlingen.
Dit geeft de volgende scatterplot:
Richting: positief
Sterkte: sterk
Vorm: lineair en homogeen
Uitbijters: op het oog geen
, De volgende waardes worden gevonden:
Na berekening krijg je de volgende statistieken:
x= 6.75
Sx= 1.80
Y= 103.75
Sy= 11.24
Geeft voor de onderste drie rijen:
De meest gebruikte correlatiecoëfficiënt is de Pearson r, maar er zijn per meetniveau nog andere
varianten:
De onderstaande formule is voor de pearson r te gebruiken, maar voor alle andere varianten van
correlatie coëfficiënten kan deze formule ook gebruikt worden (=pearson r procedure):