Statistiek 1: week 6
Correlatie en covariantie
- Correlatie: Is de statistische samenhang tussen twee variabelen die uitgedrukt kan worden in
een correlatiecoëfficiënt variërend tussen -1 en 1
- Data bestaat uit subgroepen van individuen waarbij het gemiddelde op zeker een van beide
variabelen verschilt.
- Een correlatie coëfficiënt geeft richting en sterkte van samenhang tussen 2 variabelen
- Sterk verband is nog geen causaal verband.
- r waarde is enkel valide binnen de range van x en y waarden.
- Gevonden verband kan een onjuist beeld geven bij subgroepen
Correlatietoetsen en Pearson r
- Een gevonden correlatiecoëfficiënt in een steekproef (≠0) kan groot zijn (relatie is sterk) maar
dat wil nog niet zeggen dat dit verband niet door toeval tot stand kan komen -> toets voor
significantie
- De correlatie is significant als de kans klein is (p<0.05) dat je deze correlatiecoefficient (r) of
nog sterker in je steekproef vindt als H0 (geen verband) in de populatie waar is.
- r is de toetsgrootheid! Een grote r is onwaarschijnlijk als H0 in de populatie waar is.
- Parametrische correlatie: Pearson r, voorwaardes: n voldoende groot, 2 variabelen met
continue meetniveau, lineair verband, geen uitbijters (e.g. normaal verdeeld)
- Nonparametrische correlatie: Spearman’s rho of Kendall’s tau. Bij niet-lineair verband,
ordinaal meetniveau, Kleine steekproefgrootte (n<), Wel sprake van steeds stijgend of dalend
verband (geen parabool)
- Is er een verband? H0: rho = 0 (geen verband) H1: rho ≠ 0 (wel verband)
- Eenzijdig verband H0: rho ≤ 0 H1: r > 0 -> positief verband
- ρ is de correlatiecoefficient in de populatie r is de pearson correlatiecoefficient in de
steekproef
- De waarde van de pearson correlatie r geeft aan hoe ver de data punten liggen van een
rechte lijn die het beste de lineaire relatie tussen de beide variabelen geeft.
- H0 verwerpen -> er is een significant lineair verband tussen X en Y
- Met uitbijters of niet normaal verdeeld: geen Pearson!,
- Toetsgrootheid t uit r, df=n-2
- t extremer dan Tkr: H0 verwerpen. Er is een significant lineair verband
- Er bestaat een significant positief lineair verband tussen X en Y, r=0.45, n=.., p<.05. r2=..
Pearson’s r correlatie voorbeeld
- t extremer dan Tkr: H0 verwerpen. Er is een significant lineair verband
- Er bestaat een significant positief lineair verband tussen systolische en diastolische
bloeddruk (r=0.57, n=235, eenzijdige p<0.05)
- Effect size is bij correlaties is de determinatiecoefficient r
Spearman’s rho
- 1 of 2 variabelen van ordinaal meetniveau, Niet normaal verdeelde variabelen, Kleine n
(10<n<20), Niet-linear, maar wel continue stijgend of dalend, verband
- Rangen toekennen: per variabele de scores vervangen door rangen. De laagste score krijgt
rangorde 1
Correlatie en covariantie
- Correlatie: Is de statistische samenhang tussen twee variabelen die uitgedrukt kan worden in
een correlatiecoëfficiënt variërend tussen -1 en 1
- Data bestaat uit subgroepen van individuen waarbij het gemiddelde op zeker een van beide
variabelen verschilt.
- Een correlatie coëfficiënt geeft richting en sterkte van samenhang tussen 2 variabelen
- Sterk verband is nog geen causaal verband.
- r waarde is enkel valide binnen de range van x en y waarden.
- Gevonden verband kan een onjuist beeld geven bij subgroepen
Correlatietoetsen en Pearson r
- Een gevonden correlatiecoëfficiënt in een steekproef (≠0) kan groot zijn (relatie is sterk) maar
dat wil nog niet zeggen dat dit verband niet door toeval tot stand kan komen -> toets voor
significantie
- De correlatie is significant als de kans klein is (p<0.05) dat je deze correlatiecoefficient (r) of
nog sterker in je steekproef vindt als H0 (geen verband) in de populatie waar is.
- r is de toetsgrootheid! Een grote r is onwaarschijnlijk als H0 in de populatie waar is.
- Parametrische correlatie: Pearson r, voorwaardes: n voldoende groot, 2 variabelen met
continue meetniveau, lineair verband, geen uitbijters (e.g. normaal verdeeld)
- Nonparametrische correlatie: Spearman’s rho of Kendall’s tau. Bij niet-lineair verband,
ordinaal meetniveau, Kleine steekproefgrootte (n<), Wel sprake van steeds stijgend of dalend
verband (geen parabool)
- Is er een verband? H0: rho = 0 (geen verband) H1: rho ≠ 0 (wel verband)
- Eenzijdig verband H0: rho ≤ 0 H1: r > 0 -> positief verband
- ρ is de correlatiecoefficient in de populatie r is de pearson correlatiecoefficient in de
steekproef
- De waarde van de pearson correlatie r geeft aan hoe ver de data punten liggen van een
rechte lijn die het beste de lineaire relatie tussen de beide variabelen geeft.
- H0 verwerpen -> er is een significant lineair verband tussen X en Y
- Met uitbijters of niet normaal verdeeld: geen Pearson!,
- Toetsgrootheid t uit r, df=n-2
- t extremer dan Tkr: H0 verwerpen. Er is een significant lineair verband
- Er bestaat een significant positief lineair verband tussen X en Y, r=0.45, n=.., p<.05. r2=..
Pearson’s r correlatie voorbeeld
- t extremer dan Tkr: H0 verwerpen. Er is een significant lineair verband
- Er bestaat een significant positief lineair verband tussen systolische en diastolische
bloeddruk (r=0.57, n=235, eenzijdige p<0.05)
- Effect size is bij correlaties is de determinatiecoefficient r
Spearman’s rho
- 1 of 2 variabelen van ordinaal meetniveau, Niet normaal verdeelde variabelen, Kleine n
(10<n<20), Niet-linear, maar wel continue stijgend of dalend, verband
- Rangen toekennen: per variabele de scores vervangen door rangen. De laagste score krijgt
rangorde 1