Correlatie analyse
Theorie
- De (Pearson) correlatie r is de meest gebruikte methode om de sterkte van het verband
tussen twee variabelen uit te drukken.
- -1.00 < r < 1.00
- Voor continue variabelen met interval of ratio meetniveau (bv. leeftijd & inkomen), maar
werkt ook goed voor ordinale variabelen, bijvoorbeeld Likert-type schalen.
- Als twee indicatoren Y1 en Y2 een gemeenschappelijke oorzaak X hebben, zijn ze
gecorreleerd (x is bijvoorbeeld Machiavellisme).
- Hoe kleiner de variantie van e1 en e2 (random error), des te sterker is deze correlatie.
- De correlatie tussen twee indicatoren is gelijk aan de betrouwbaarheid van deze indicatoren.
- De gemiddelde correlatie van meerdere indicatoren wordt gebruikt in de formule van
betrouwbaarheid (Cronbach’salfa).
- − H0: nulhypothese – de veronderstelling dat het
- effect niet bestaat
- − H1: nulhypothese wordt verworpen bij significantie
- (p <.05). De kans dat de H0 waar is –er is geen effect
- –is dan 5% (dus 1 op 20).
Wanneer is een correlatie significant?:
- Als de SE kleiner dan de helft van de correlatie is.
- SE(r) = √1 –r2/ (N-2) ≈ 1 / √N
- Bv: N=100 SE(r)
= .10 r = .20 (p<.05)
- Bv: N=400 SE(r)
= .05 r = .10 (p<.05)
- Dus, als de SE(r) = .10, dan moet de correlatie ongeveer
- 2x zo groot zijn voor significantie
SPSS
Stap 0: bekijk data
- Waar gaan de items over?
- Zijn er missing values? Zo ja, staan deze correct aangegeven in de dataset?
- Wat zijn de meetschalen?
- Zijn er opvallende waardes? Zo ja, wat moet hiermee gebeuren?
Stap 1: voer correlatieanalyse uit
Via menu:
Analyze -> correlate -> Bivariate-> vul variabelen in.
Aangevinkt in scherm ‘Bivariate Correlations’ (= home scherm) =
- ‘Pearson’ ,
- ‘Two-Tailed’
- ‘Flag significant correlations’.
Aangevinkt onder ‘options’ in het blok ‘missings’=
- exclude cases pairwise.
Klik ‘continue’.
,Klik ‘paste’ en run vanuit de syntax.
Stap 2: interpreteer uitkomsten: significantie, sterkte en richting
Significantie:
R > 0.50 ‘’Strong’’
R > 0.30 ‘’Moderate’’
R > 0.10 ‘’Weak’’
- Wat betekenen de gevonden correlaties? (uitkomst omschreven in woorden)
- Passen de vragen goed bij elkaar?
- Welke vragen passen er minder bij? Hoe kan dit probleem/deze problemen worden
opgelost?
Stap 3: rapporteer de uitkomsten
,Factor-analyse
Theorie
Validiteit: meet je het bedoelde concept, of ook nog iets anders (bias).
Wat is een factoranalyse?
Factoranalyse gaat over de indicatoren van meerdere variabelen (schalen, etc.): je wilt verschil
tussen de indicatoren van verschillende schalen.
- Factoranalyse is een multivariate statistische techniek die voor een groot aantal
geobserveerde variabelen een kleiner aantal achterliggende variabelen identificeert. Deze
niet geobserveerde, achterliggende variabelen worden factoren genoemd.
- Wij gebruiken de factoranalyse om systematische meetfouten / invaliditeit te ontdekken.
- Het is ons “middel” om te checken of de indicatoren/items van een schaal ook daadwerkelijk
het bedoelde construct meten.
- Factoranalyse is weinig anders dan een verzameling van meerdere multipele
regressiemodellen, waarbij de onafhankelijke variabelen ongemeten (latent) zijn. “We”
moeten dus zelf een label plakken op de indicatoren die bij elkaar horen.
- In de praktijk gebruiken we bijna altijd gestandaardiseerde coëfficiënten; de intercepten zijn
dan altijd 0 en blijven onvermeld.
Factoranalyse = validiteitsanalyse
- Er is sprake van invaliditeit of systematische meetfouten wanneer een meting (indicator)
meer dan één latente variabele (construct) meet, of een andere, niet bedoelde latente
variabele meet.
- Je vindt dan een extra factor of een kruislading.
- Systematische meetfouten kunnen correlaties (kunstmatig) verhogen. Dit is onwenselijk.
Wat doet een factoranalyse?
- Er zijn verschillende rotaties. Binnen “onze” modellen zijn variabelen vaak gecorreleerd.
Daarom gebruiken we Oblique rotatie.
Wat doet een oblimin factoranalyse?
Systematische meetfouten
Vermijden van
Praktisch:
- Stel je vragen over één ding
- Hou het kort
- Denk goed na: “wat meet de vraag überhaupt?”
, Theoretisch (ik gebruik deze niet):
- Gebruik positief en negatief gepoolde vragen door elkaar.
- Of laat respondenten kiezen tussen twee extreme formuleringen
- Gebruik afwisselende en afwisselend vormgegeven antwoordformuleringen.
Diagnose
- Voor het opsporen van systematische meetfouten moet je meerdere indicatoren hebben.
- Je kunt systematische meetfouten opsporen door factoranalyse, maar met het bekijken van
de correlatiematrix kom je ook een eind.
Factoranalyse als validiteitsanalyse
- Voor ons is het belangrijkste doel van factoranalyse het opsporen van indicatoren met
kruisladingen. Deze dien je uit de indexconstructie weg te laten.
- Als een indicator hoger op een andere factor laadt dan op de bedoelde factor is hier sprake
van.
- NB: Het liefst factorladingen van .60 of hoger op de bedoelde factor. Het liefst laden
indicatoren met een verschil van meer dan .30 op de bedoelde factor (versus een andere
factor).
Besliscriteria in factoranalyse
- Eigenwaarden: groter dan 1.0.
- Knikcriterium: knik –1 = aantal dimensies.
- Factorladingen: Indelen bij construct waar ze de hoogste lading op hebben (en theoretisch
gezien bij horen).
- Factorladingen: liefst .60 op de bedoelde factor. Liefst .30 meer op de bedoelde factor dan
op een andere factor.
- Kruisladingen: groter op de onbedoelde factor dan op de bedoelde factor.
- Correlations ≠ 0
- KMO (> .60 liefst . > 80)
- Barlett (p < .05)
- Iterations = zet deze op 250
SPSS
Stappenplan
Stap 0: Voorbereiding gegevens
Het is altijd belangrijk om eerst naar ‘frequencies’ te kijken:
- Minstens ordinale meetschaal (bijvoorbeeld helemaal mee oneens –helemaal eens);
- Check missing values, etcetera.
**Anders dan bij de betrouwbaarheidsanalyse is gelijke poling (i.e. allemaal van [1]oneens tot [5]
eens) en gelijke variantie niet vereist.
Theorie
- De (Pearson) correlatie r is de meest gebruikte methode om de sterkte van het verband
tussen twee variabelen uit te drukken.
- -1.00 < r < 1.00
- Voor continue variabelen met interval of ratio meetniveau (bv. leeftijd & inkomen), maar
werkt ook goed voor ordinale variabelen, bijvoorbeeld Likert-type schalen.
- Als twee indicatoren Y1 en Y2 een gemeenschappelijke oorzaak X hebben, zijn ze
gecorreleerd (x is bijvoorbeeld Machiavellisme).
- Hoe kleiner de variantie van e1 en e2 (random error), des te sterker is deze correlatie.
- De correlatie tussen twee indicatoren is gelijk aan de betrouwbaarheid van deze indicatoren.
- De gemiddelde correlatie van meerdere indicatoren wordt gebruikt in de formule van
betrouwbaarheid (Cronbach’salfa).
- − H0: nulhypothese – de veronderstelling dat het
- effect niet bestaat
- − H1: nulhypothese wordt verworpen bij significantie
- (p <.05). De kans dat de H0 waar is –er is geen effect
- –is dan 5% (dus 1 op 20).
Wanneer is een correlatie significant?:
- Als de SE kleiner dan de helft van de correlatie is.
- SE(r) = √1 –r2/ (N-2) ≈ 1 / √N
- Bv: N=100 SE(r)
= .10 r = .20 (p<.05)
- Bv: N=400 SE(r)
= .05 r = .10 (p<.05)
- Dus, als de SE(r) = .10, dan moet de correlatie ongeveer
- 2x zo groot zijn voor significantie
SPSS
Stap 0: bekijk data
- Waar gaan de items over?
- Zijn er missing values? Zo ja, staan deze correct aangegeven in de dataset?
- Wat zijn de meetschalen?
- Zijn er opvallende waardes? Zo ja, wat moet hiermee gebeuren?
Stap 1: voer correlatieanalyse uit
Via menu:
Analyze -> correlate -> Bivariate-> vul variabelen in.
Aangevinkt in scherm ‘Bivariate Correlations’ (= home scherm) =
- ‘Pearson’ ,
- ‘Two-Tailed’
- ‘Flag significant correlations’.
Aangevinkt onder ‘options’ in het blok ‘missings’=
- exclude cases pairwise.
Klik ‘continue’.
,Klik ‘paste’ en run vanuit de syntax.
Stap 2: interpreteer uitkomsten: significantie, sterkte en richting
Significantie:
R > 0.50 ‘’Strong’’
R > 0.30 ‘’Moderate’’
R > 0.10 ‘’Weak’’
- Wat betekenen de gevonden correlaties? (uitkomst omschreven in woorden)
- Passen de vragen goed bij elkaar?
- Welke vragen passen er minder bij? Hoe kan dit probleem/deze problemen worden
opgelost?
Stap 3: rapporteer de uitkomsten
,Factor-analyse
Theorie
Validiteit: meet je het bedoelde concept, of ook nog iets anders (bias).
Wat is een factoranalyse?
Factoranalyse gaat over de indicatoren van meerdere variabelen (schalen, etc.): je wilt verschil
tussen de indicatoren van verschillende schalen.
- Factoranalyse is een multivariate statistische techniek die voor een groot aantal
geobserveerde variabelen een kleiner aantal achterliggende variabelen identificeert. Deze
niet geobserveerde, achterliggende variabelen worden factoren genoemd.
- Wij gebruiken de factoranalyse om systematische meetfouten / invaliditeit te ontdekken.
- Het is ons “middel” om te checken of de indicatoren/items van een schaal ook daadwerkelijk
het bedoelde construct meten.
- Factoranalyse is weinig anders dan een verzameling van meerdere multipele
regressiemodellen, waarbij de onafhankelijke variabelen ongemeten (latent) zijn. “We”
moeten dus zelf een label plakken op de indicatoren die bij elkaar horen.
- In de praktijk gebruiken we bijna altijd gestandaardiseerde coëfficiënten; de intercepten zijn
dan altijd 0 en blijven onvermeld.
Factoranalyse = validiteitsanalyse
- Er is sprake van invaliditeit of systematische meetfouten wanneer een meting (indicator)
meer dan één latente variabele (construct) meet, of een andere, niet bedoelde latente
variabele meet.
- Je vindt dan een extra factor of een kruislading.
- Systematische meetfouten kunnen correlaties (kunstmatig) verhogen. Dit is onwenselijk.
Wat doet een factoranalyse?
- Er zijn verschillende rotaties. Binnen “onze” modellen zijn variabelen vaak gecorreleerd.
Daarom gebruiken we Oblique rotatie.
Wat doet een oblimin factoranalyse?
Systematische meetfouten
Vermijden van
Praktisch:
- Stel je vragen over één ding
- Hou het kort
- Denk goed na: “wat meet de vraag überhaupt?”
, Theoretisch (ik gebruik deze niet):
- Gebruik positief en negatief gepoolde vragen door elkaar.
- Of laat respondenten kiezen tussen twee extreme formuleringen
- Gebruik afwisselende en afwisselend vormgegeven antwoordformuleringen.
Diagnose
- Voor het opsporen van systematische meetfouten moet je meerdere indicatoren hebben.
- Je kunt systematische meetfouten opsporen door factoranalyse, maar met het bekijken van
de correlatiematrix kom je ook een eind.
Factoranalyse als validiteitsanalyse
- Voor ons is het belangrijkste doel van factoranalyse het opsporen van indicatoren met
kruisladingen. Deze dien je uit de indexconstructie weg te laten.
- Als een indicator hoger op een andere factor laadt dan op de bedoelde factor is hier sprake
van.
- NB: Het liefst factorladingen van .60 of hoger op de bedoelde factor. Het liefst laden
indicatoren met een verschil van meer dan .30 op de bedoelde factor (versus een andere
factor).
Besliscriteria in factoranalyse
- Eigenwaarden: groter dan 1.0.
- Knikcriterium: knik –1 = aantal dimensies.
- Factorladingen: Indelen bij construct waar ze de hoogste lading op hebben (en theoretisch
gezien bij horen).
- Factorladingen: liefst .60 op de bedoelde factor. Liefst .30 meer op de bedoelde factor dan
op een andere factor.
- Kruisladingen: groter op de onbedoelde factor dan op de bedoelde factor.
- Correlations ≠ 0
- KMO (> .60 liefst . > 80)
- Barlett (p < .05)
- Iterations = zet deze op 250
SPSS
Stappenplan
Stap 0: Voorbereiding gegevens
Het is altijd belangrijk om eerst naar ‘frequencies’ te kijken:
- Minstens ordinale meetschaal (bijvoorbeeld helemaal mee oneens –helemaal eens);
- Check missing values, etcetera.
**Anders dan bij de betrouwbaarheidsanalyse is gelijke poling (i.e. allemaal van [1]oneens tot [5]
eens) en gelijke variantie niet vereist.