Correlationeel onderzoek
In voorgaande cursussen heb je geleerd dat er drie voorwaarden zijn om te kunnen spreken van
een causaal verband. Om te bepalen of aan deze voorwaarden wordt voldaan kun je de volgende
vragen stellen:
1. Is er sprake van een relatie tussen twee of meer variabelen?
2. Gaat de oorzaak vooraf aan het gevolg (in tijd)?
3. Kunnen we andere verklaringen voor het gevonden verband uitsluiten?
Met experimenteel onderzoek kunnen we in principe een hogere interne validiteit realiseren dan met
kwalitatief of correlationeel onderzoek. Een experiment kunnen we namelijk uitvoeren in een
gecontroleerde setting, waardoor we alternatieve verklaringen zo veel mogelijk kunnen uitsluiten. We
kunnen dan bepalen of er sprake is van een causaal verband tussen de afhankelijke en de
onafhankelijke variabele.
Ook al is een steekproef groot, dit maakt hem nog niet representatief. De representativiteit hangt af
van de gebruikte steekproefmethode.
Als je zou kiezen voor een Pearson correlatie, is de toets die je uitvoert niet geschikt voor de
beantwoording van de onderzoeksvraag. Een Person correlatie meet namelijk de samenhang tussen
twee variabelen en is niet geschikt om het verschil tussen twee groepen te meten. Er wordt ook niet
voldaan aan de voorwaarden/assumpties voor het uitvoeren van deze toets, want voor een Pearson
correlatie moeten de onafhankelijke en de afhankelijke variabele allebei van interval/ratio
meetniveau zijn. In dit onderzoek is de onafhankelijke variabele ‘lesmethode’ van nominaal
meetniveau.
Het beperken van de neiging om sociaal wenselijke antwoorden te geven draagt bij aan
de begripsvaliditeit, omdat respondenten dan mogelijk ‘eerlijker’ antwoorden en het
meetinstrument dus beter slaagt in het meten van het onderzochte construct.
JASP les 1
Descriptive Statistics, onder het kopje Basis plots, heb je drie opties:
1. Distribution plots: denk hierbij aan een histogram om te zien hoe de scores op een variabele
verdeeld zijn
, 2. Correlation plots: denk hierbij een spreidingsdiagram (scatterplot) die om te zien hoe de
relatie tussen twee variabelen eruit ziet
3. Interval plots: grafieken waarmee je ook kunt zien hoe de scores op een variabele verdeeld
zijn
In de klassieke statistische toetsprocedure volg je de volgende stappen: Onderzoeksvraag >
Nulhypothese (H0) > Toets > Verwerpen H0 of niet verwerpen H0 (op basis van p-waarde)
Dit is de procedure die bekend staat onder de naam Null Hypothesis Significance Testing (NHST).
NHST impliceert dat onderzoekers uiteindelijk concluderen "er is niets" (als p > αα en de
nulhypothese niet wordt verworpen) of "er is iets" (als p <≤<≤ αα en de nulhypothese wel wordt
verworpen). En bij een "er is iets" spreken we van significant resultaat. Vaak rapporteert men dan ook
een effectgrootte (bijvoorbeeld r of Cohens's d) als schatting voor het effect waarin men
geinteresseerd is.
Met de Bayesiaanse procedure kan je meerdere hypotheses tegelijkertijd evalueren. Je kan dan
uitbreidingen van modellen met elkaar vergelijken om tot het best passende model te komen.
Hiervoor vergelijk je de Bayes Factoren voor elke hypothese met elkaar. In deze les laten we zien hoe
de je de evaluatie van hypotheses volgens de Bayesiaanse procedure uitvoert.
De Bayes Factor is dus een maat voor de relatieve hoeveelheid steun voor de ene hypothese versus
de andere. Wat betekent dat eigenlijk? Voor antwoord op deze vraag moeten we weten waar de
steun in de data voor een hypothese door bepaald wordt. De hoeveelheid steun die we vinden in de
data (steekproef) voor een hypothese is afhankelijk van twee zaken:
(1) De fit van de hypothese voor de data, ofwel hoe goed past de hypothese bij de data, en
(2) De specificiteit van de hypothese, ofwel hoeveel mogelijkheden worden met de hypothese
uitgesloten.
We weten dat BFH0 HA=60BFH0 HA=60 betekent dat er 60 keer meer steun is voor H0, en we weten
dat BFH0 HA=1.5BFH0 HA=1.5 betekent dat er maar 1,5 keer meer steun is voor H0. De hypothese
waarvoor de BF = 60 is er dus meer steun dan voor de hypothese waarvoor de BF = 1.5
De resultaten van de factoranalyse geven zicht op de interne structuur van een verzameling items
(variabelen) en is daarmee een techniek die kan worden ingezet bij de beoordeling van
de begripsvaliditeit van een test, maar ook kan het zicht geven op het aantal zinvol te onderscheiden
factoren binnen een verzameling items.
confirmatieve factoranalyse (ook wel 'theoriegestuurd' genoemd)
exploratieve factoranalyse (ook wel 'datagestuurd' genoemd)
,oer, op basis van onderstaande instructies, een explorerende factoranalyse uit met een oblique
rotatie op de items over Persoonlijkheid: pk01 t/m pk20.
Factor > Exploratory Factor Analysis
Selecteer de items pk01 t/m pk20 en zet deze in de box ‘Variables’
Stip aan bij 'Number of Factors based on': ‘Eigenvalues’
Selecteer bij 'Factoring method': 'Principal axis factoring'
Selecteer onder 'Rotation': 'Oblique' en daarbij 'oblimin'
Klik op Output options:
Vink aan onder 'Tables': 'Factor Correlations', en
Vink aan Onder 'plots': 'Scree Plot' en deselecteer daarbij 'Parallel analysis results'
JASP maakt niet standaard gebruik van het eigenwaardecriterium voor het aantal te selecteren
factoren. In JASP geef je dit aan onder 'Number of Factors based on' te kiezen voor 'Eigenvalues
above 1'.
Als er veel variabelen (items) in de analyse zijn opgenomen, dan leidt het eigenwaarde-criterium vaak
tot een relatief groot aantal factoren. Daarom is er een tweede criterium voor de keuze van het
aantal zinvol te onderscheiden factoren: het knikcriterium.
Bij dit criterium wordt gezocht naar de overgang tussen factoren welke veel variantie verklaren en de
factoren die weinig variantie verklaren.
Om deze overgang te bepalen, gebruiken we de screeplot. In het screeplot wordt voor elke mogelijke
factor de hoogte van de eigenwaarde weergegeven. De eerste factor heeft de hoogste eigenwaarde
en de laatste factor de laagste. Volgens het knikcriterium kies je voor het aantal factoren met een
eigenwaarde die in de figuur voor of boven de 'knik' ligt.
Les 2 factorladingen
Een factorlading kunnen we beschouwen en interpreteren als een correlatie tussen een factor en een
variabele (vaak een item). Het geeft de sterkte van de lineaire relatie tussen de factor en de variabele
weer.
In de onderstaande figuur geven de rode lijnen factoren weer en de zwarte punten de items. De
positie van elk item is hierbij bepaald door de factorladingen van een item voor de twee factoren.
Bij een standaard factoranalyse worden factoren zodanig berekend dat ze hoog correleren
met alle testitems. Grafisch ziet dat er bijvoorbeeld uit als de linkergrafiek in de figuur.
, Met deze benadering weten we alleen niet goed welke testitems goed door een achterliggende
variabele verklaard worden en welke minder. Om dit te verhelpen passen we een zogeheten rotatie
toe. De lijnen worden zodanig geroteerd dat dat testitems zo hoog mogelijk laden op één factor, en zo
laag mogelijk laden op de andere factoren. Grafisch ziet het resultaat van de rotatie eruit als de
rechter grafiek in de onderstaande figuur.
Het doel van de rotatie is het verkrijgen van een factorladingenmatrix die interpretatie van factoren
vergemakkelijkt. Na rotatie is het over het algemeen eenvoudiger om vast te stellen welke items
samen door een achterliggende variabele verklaard kunnen worden. We gebruiken hiervoor, in eerste
instantie, de oblique of scheve rotatie. Bij deze vorm van roteren, kan het voorkomen dat de factoren
na rotatie samenhangen. In dat geval staan de factoren in een figuur niet meer loodrecht
(orthogonaal) op elkaar. Zie de figuur op de vorige pagina.
In de tabel 'Factor Loadings' worden veel factorladingen niet weergegeven. JASP doet dit automatisch
om de tabel overzichtelijk te houden: alleen de sterkste en daarmee meest relevante factorladingen
worden weergegeven.
Als je van meer items de factorladingen wilt zien, kun je dit doen met het schuifje 'Display loadings
above'. Als je dat schuifje naar 0 sleept zul je in de tabel 'Factor Loadings' alle factorladingen zien. Als
je het schuifje verder omhoog sleept, dan zie je alleen nog de factorladingen hoger dan de
aangegeven waarde.Het gaat hierbij overigens om absolute factorladingen. In de output kan de
ordening van de variabelen (items) gedaan worden op basis van ' Factor size' of op basis van de
'Variabele'. In dat laatste geval krijg je de volgorde van items zoals in het databestand. Hier is gekozen
voor 'Factor size'.
Setting jasp factor explainatory voor vragen over factoranalyse, (bv: Hoeveel items hebben een hoge
lading)
Numbers of factors based on: eigenvalues
Rotation:
oblique
oblimin
Base analysis
on correlation
matrix