Tutorial 1
Validiteit = meet je het bedoelde concept of ook nog iets anders (bias)
Betrouwbaarheid = komt er bij hermeting hetzelfde uit? (Geef een schatting hoe de index
gecorreleerd zou zijn met een volgende meting van die index)
Correlatieanalyse
r > 0.50 “Strong”
r > 0.30 “Moderate”
r > 0.10 “Weak”
Factoranalyse
1. Voorbereiding is door de items door een correlatieanalyse heen te halen
2. Is data geschikt? > KMO en Bartlett
a. KMO > .60 liefst >.80
b. BTS significant <.05
De communaliteiten geven de verklaarde variantie in elke indicator weer. Het is hiermee
gemakkelijk te spotten welke indicatoren slecht binnen de set passen. Wanneer de waardes
onder de 0.3 vallen, spreken we van te lage waardes.
- LET OP: Hoewel je altijd naar de communaliteiten kijkt, baseer je er nog geen
besluiten op. De items die nu opvallen, hou je tijdens de verdere analyse wel in de
gaten. Je zal dus nooit op basis van alleen een lage communaliteit besluiten om een
item uit de analyse te verwijderen. Het besluiten tot het verwijderen van items
gebeurt pas later tijdens de analyse
Factorladingen op basis van de factorladingen wordt besloten welk item onder welke
factor valt. Op basis van deze factoren worden de schalen gevormd (en op basis van de items
per factor, wordt er voor elke schaal de betrouwbaarheid berekend). Je wil een zo ‘simpel’
mogelijke oplossing: elk item laadt hoog op slechts één van de factoren, waarbij elke factor
uit liefst drie items of meer bestaat. Vaak is het beeld wat uit de factoranalyse komt, wat
onduidelijker en moet de factor analyse meerdere malen worden uitgevoerd om tot een
goede, ‘simpele’ oplossing te komen.
- Tabel SPSS: Pattern Matrix
Vervolgens bestaan er twee manieren van het ‘opschonen’ van de factoroplossing:
1. Statistische manier Hierbij wordt gekeken naar de hoogtes van de factorladingen
en of er kruisladingen zijn. ‘Rommelige’ items zijn items die laag scoren op de eigen
factor, of relatief hoog op een andere onbedoelde factor. Deze worden verwijderd
totdat de oplossing ‘simpel’ is. Een ‘simpele’ oplossing is in dit geval een oplossing
waarbij elk item hoog laadt op één factor, terwijl hij niet of heel laag (<.3) laadt op
alle andere factoren. Pas wanneer dit is gelukt, wordt er gekeken naar de inhoud van
de factoren: slaat deze combinatie van vragen ergens op? Deze tactiek wordt
eigenlijk alleen toegepast om nieuwe vragenlijsten te valideren
2. Bevestigende manier Deze manier wordt gebruikt door onderzoekers die met
bestaande vragenlijsten werken en willen weten of deze vragenlijsten ook valide zijn
in zijn of haar onderzoek sample. Dit is wat wij hier ook doen. Hierbij heb je al een
beeld van hoeveel factoren je wil vinden (namelijk gelijk aan het aantal vragenlijsten
, of sub schalen) en welke items je op elk van de factoren terug wil vinden (namelijk de
vragen die uit één vragenlijst of sub schaal komen). Bij het opschonen van de
factoranalyse zul je er dus eerder voor kiezen om een item weg te halen die hoog
laadt op een verkeerde factor (de zogenoemde kruislading), dan een item die zwak
laadt op zijn eigen factor (en tegelijkertijd minder sterk op een andere factor laadt).
Een ‘schone’ oplossing is hierbij een oplossing waarbij je per factor de (overgebleven)
items van de bestaande vragenlijsten hebt gegroepeerd.
De bevestigende manier is dus wat abstracter, je kijkt niet alleen of een item hoog
laadt op 1 factor en heel laag (<.30) laadt op andere factoren maar je kijkt
bijvoorbeeld ook naar het verschil tussen deze getallen. Een factor die
bijvoorbeeld .80 scoort op 1 factor en .35 scoort zou bijvoorbeeld alsnog
meegenomen kunnen worden in de analyse terwijl een factor die .40 scoort op 1
factor en .29 op een andere factor wel weggehaald zou kunnen worden. De
bevestigende manier maakt dus gebruik van inzicht i.p.v. harde regels
Factorcorrelaties In SPSS kan de factoranalyse op meerdere manieren worden uitgevoerd.
Eén van deze manieren is om de factoren toe te staan om onderling een relatie te hebben
(bij ‘scheve roteren’ van de assen). De factorladingen zijn daarbij vergelijkbaar met partiële
regressiecoëfficiënten. Een andere manier is om dit niet toe te staan, en de factoren vast te
zetten onder een vooraf bepaalde hoek (‘rechte rotatie’ van de assen). De assen van de
factoren worden dan onder een vaste hoek geplot op de puntenwolk. De factorladingen zijn
daarbij vergelijkbaar met correlaties. In werkelijkheid bestaat er vaak een relatie tussen de
verschillende factoren. Omdat dit in organisatiedata bijna altijd het geval is, gebruiken we
‘oblique rotatie’ (in SPSS heet dit: Direct Oblimin). Of dit werkelijk zo is, kan je zien door de
correlaties tussen de factoren te checken. Zolang deze correlaties niet 0 zijn, doen we er
verder niks mee.
Betrouwbaarheidsanalyse
Voorwaarde voor betrouwbaarheidsanalyse is dat items parallel moeten zijn. Dit kun je
checken aan de hand van de SD-scores: bij parallelle items zijn de SD’s ongeveer gelijk aan
elkaar
Als de schalen andere antwoordcategorieën hebben, dan standaardiseren hier is het niet
nodig om te standaardiseren, want alle items hebben hetzelfde meetniveau (schaaltype).
Validiteit = meet je het bedoelde concept of ook nog iets anders (bias)
Betrouwbaarheid = komt er bij hermeting hetzelfde uit? (Geef een schatting hoe de index
gecorreleerd zou zijn met een volgende meting van die index)
Correlatieanalyse
r > 0.50 “Strong”
r > 0.30 “Moderate”
r > 0.10 “Weak”
Factoranalyse
1. Voorbereiding is door de items door een correlatieanalyse heen te halen
2. Is data geschikt? > KMO en Bartlett
a. KMO > .60 liefst >.80
b. BTS significant <.05
De communaliteiten geven de verklaarde variantie in elke indicator weer. Het is hiermee
gemakkelijk te spotten welke indicatoren slecht binnen de set passen. Wanneer de waardes
onder de 0.3 vallen, spreken we van te lage waardes.
- LET OP: Hoewel je altijd naar de communaliteiten kijkt, baseer je er nog geen
besluiten op. De items die nu opvallen, hou je tijdens de verdere analyse wel in de
gaten. Je zal dus nooit op basis van alleen een lage communaliteit besluiten om een
item uit de analyse te verwijderen. Het besluiten tot het verwijderen van items
gebeurt pas later tijdens de analyse
Factorladingen op basis van de factorladingen wordt besloten welk item onder welke
factor valt. Op basis van deze factoren worden de schalen gevormd (en op basis van de items
per factor, wordt er voor elke schaal de betrouwbaarheid berekend). Je wil een zo ‘simpel’
mogelijke oplossing: elk item laadt hoog op slechts één van de factoren, waarbij elke factor
uit liefst drie items of meer bestaat. Vaak is het beeld wat uit de factoranalyse komt, wat
onduidelijker en moet de factor analyse meerdere malen worden uitgevoerd om tot een
goede, ‘simpele’ oplossing te komen.
- Tabel SPSS: Pattern Matrix
Vervolgens bestaan er twee manieren van het ‘opschonen’ van de factoroplossing:
1. Statistische manier Hierbij wordt gekeken naar de hoogtes van de factorladingen
en of er kruisladingen zijn. ‘Rommelige’ items zijn items die laag scoren op de eigen
factor, of relatief hoog op een andere onbedoelde factor. Deze worden verwijderd
totdat de oplossing ‘simpel’ is. Een ‘simpele’ oplossing is in dit geval een oplossing
waarbij elk item hoog laadt op één factor, terwijl hij niet of heel laag (<.3) laadt op
alle andere factoren. Pas wanneer dit is gelukt, wordt er gekeken naar de inhoud van
de factoren: slaat deze combinatie van vragen ergens op? Deze tactiek wordt
eigenlijk alleen toegepast om nieuwe vragenlijsten te valideren
2. Bevestigende manier Deze manier wordt gebruikt door onderzoekers die met
bestaande vragenlijsten werken en willen weten of deze vragenlijsten ook valide zijn
in zijn of haar onderzoek sample. Dit is wat wij hier ook doen. Hierbij heb je al een
beeld van hoeveel factoren je wil vinden (namelijk gelijk aan het aantal vragenlijsten
, of sub schalen) en welke items je op elk van de factoren terug wil vinden (namelijk de
vragen die uit één vragenlijst of sub schaal komen). Bij het opschonen van de
factoranalyse zul je er dus eerder voor kiezen om een item weg te halen die hoog
laadt op een verkeerde factor (de zogenoemde kruislading), dan een item die zwak
laadt op zijn eigen factor (en tegelijkertijd minder sterk op een andere factor laadt).
Een ‘schone’ oplossing is hierbij een oplossing waarbij je per factor de (overgebleven)
items van de bestaande vragenlijsten hebt gegroepeerd.
De bevestigende manier is dus wat abstracter, je kijkt niet alleen of een item hoog
laadt op 1 factor en heel laag (<.30) laadt op andere factoren maar je kijkt
bijvoorbeeld ook naar het verschil tussen deze getallen. Een factor die
bijvoorbeeld .80 scoort op 1 factor en .35 scoort zou bijvoorbeeld alsnog
meegenomen kunnen worden in de analyse terwijl een factor die .40 scoort op 1
factor en .29 op een andere factor wel weggehaald zou kunnen worden. De
bevestigende manier maakt dus gebruik van inzicht i.p.v. harde regels
Factorcorrelaties In SPSS kan de factoranalyse op meerdere manieren worden uitgevoerd.
Eén van deze manieren is om de factoren toe te staan om onderling een relatie te hebben
(bij ‘scheve roteren’ van de assen). De factorladingen zijn daarbij vergelijkbaar met partiële
regressiecoëfficiënten. Een andere manier is om dit niet toe te staan, en de factoren vast te
zetten onder een vooraf bepaalde hoek (‘rechte rotatie’ van de assen). De assen van de
factoren worden dan onder een vaste hoek geplot op de puntenwolk. De factorladingen zijn
daarbij vergelijkbaar met correlaties. In werkelijkheid bestaat er vaak een relatie tussen de
verschillende factoren. Omdat dit in organisatiedata bijna altijd het geval is, gebruiken we
‘oblique rotatie’ (in SPSS heet dit: Direct Oblimin). Of dit werkelijk zo is, kan je zien door de
correlaties tussen de factoren te checken. Zolang deze correlaties niet 0 zijn, doen we er
verder niks mee.
Betrouwbaarheidsanalyse
Voorwaarde voor betrouwbaarheidsanalyse is dat items parallel moeten zijn. Dit kun je
checken aan de hand van de SD-scores: bij parallelle items zijn de SD’s ongeveer gelijk aan
elkaar
Als de schalen andere antwoordcategorieën hebben, dan standaardiseren hier is het niet
nodig om te standaardiseren, want alle items hebben hetzelfde meetniveau (schaaltype).