Verdieping in Onderzoeksmethoden en Statistiek (VOS)
Correlationeel
Hoorcollege 1 – factor analyse
Factor analyse = een verklarende factor die een verklaring is voor de antwoorden gegeven
door de respondent
Onderzoek validiteit
- Externe validiteit
- Interne validiteit
- Begripsvaliditeit
- Statistische validiteit
Instrumentele validiteit
= de mate waarin een test aan zijn doel beantwoord
- Inhoudsvaliditeit = representeert de test het domein dat de test beoogt te meten
beoordeeld door deskundigen : Indruk validiteit
- Begripsvaliditeit = meet de test het theoretische concept dat moet worden gemeten
relaties binnen test = interne structuur
relaties met andere variabele = externe structuur
- Criteriumvaliditeit = voorspelt de test gedrag of prestatie dat niet met test wordt
gemeten
Factor analyse hoort bij de begripsvaliditeit en de interne structuur
Twee doelen factoranalyse
1. Beoordelen dimensionaliteit van test
= vinden we het aantal theoretische veronderstelde dimensies (=factoren) binnen de
verzameling van testitems
Confirmerende factor analyse (CFA)
2. Realiseren van data reductie
= kunnen we informatie uit groot aantal variabelen samenvatten in een kleiner aantal
nieuw te construeren variabelen (=factoren)
explorerende factoranalyse (EFA) tegengesteld aan de confirmerende
hoofdcomponentenanalyse (PCA)
Factoranalyse uitvoeren
Stap 0 data screening = Is er een correlatie, er moet ergens en correlatie zijn (meer dan
0.3) om een factor analyse uit te voeren
Stap 1 Keuze factormodel
- Factormodel PCA (hoofdcomponentenanalyse) = hoe kan met zo weinig mogelijk
factoren zo veel mogelijk variantie (=spreiding scores op een variabelen) kunnen
representeren p
- EFA (explorerende analyse) = aantal factoren onbekend, pijlen andere kant op, met U
(=unieke factor)
- CFA (confirmerende factoranalyse) = aantal factoren bekend, pijlen als bij EFA, model
volgt verwachte structuur en met U (unieke factor)
,Geobserveerde variabele
X = individuele score op variabele
Zx = X getransformeerd naar z-score
Factorlading (a) = correlatie van variabele met factor worden geschat
Factor (F) = achterliggende verklaring voor variatie in en samenhang tussen de variabelen
in PCA spreken we van componenten in plaats van factoren
Unieke factor = unieke factor voor verklaring van specifieke en error variantie
Welk factor model kies
- Hoofdcomponenten analyse = als reductie het doel is
- Exploratieve analyse = als inhoudelijke interpretatie van nog onbekend aantal
factoren het doel is
- Confirmatieve analyse = als beoordeling van de verwachte interne structuur
(=validiteit) het doel is van de factoranalyse
Resultaat factoranalyse
- Schatting van de factorladingen (a)
- Factorscores
- Informatie voor keuze aantal en interpretatie van te onderscheiden factoren:
eigenwaarden, factor correlaties en verklaarde varianties
Vergelijking voor factorscore F
Fji= factor score op factor j voor
persoon i
Aij = factorlading a van
gestandaardiseerde variabele 1 voor factor j
Z1i = gestandaardiseerde score van persoon i op variabele 1
Factorscore F
- Voor ieder individu een score op elke factor
- Voor persoon i is Fji de gewogen som van k naar Z gestandaardiseerde variabelen
- F is een nieuwe variabele
- Voor verdeling van factorscores geldt:
gemiddelde M=0
standaard afwijking SD = 1
Factor analyse stap 2
, Bepalen aantal factoren
eigenwaarde criterium
knikcriterium
Aantal factoren?
- Maximaal aantal factoren is gelijk aan totaal aantal variabelen in de analyse
- Met zo weinig mogelijk factoren zo veel mogelijk variantie in variabelen verklaren
- Factor 1: verklaart zo groot mogelijk deel van testvariantie
- Factor 2: verklaart zo groot mogelijk deel van restvariantie
- Factor k: verklaart zo groot mogelijk deel van restvariantie
in een hoofdcomponenten analyse wordt alle verklaarde variantie verklaard
- Voorlopig keuze aantal factoren is gebaseerd op verklaarde variantie door factoren
(=statistisch criterium)
Eigenwaarde
= hoeveel variantie er door de factor wordt verklaard, de verklaarde variantie in k variabelen
door een factor
- Per variabele: variantie = s2 = 1
- Totale variantie: variantie van variabelen = k
Eigenwaarde-criterium (Kaiser-Guttman criterium)
= kies, in eerste instantie, voor aantal factoren met
eigenwaarde groter dan 1 (=vuistregel)
Scree-plot
Knik criterium: kies het aantal factoren gelijk aan aantal
voor de knik in de grafiek
1 factor selecteren
Factor analyse stap 3
Interpretatie factor
= wat is de inhoudelijke betekenis van de factor?
Aanpak:
- Orthogonale (rechte) rotatie = na de rotatie ongecorreleerde factoren, assen staan
na rotatie loodrecht op elkaar
interpretatie: Correlaties tussen factoren en variabelen in de analyse
- Oblique (scheve) rotatie = na rotatie meer of minder gecorreleerde factoren, assen
niet loodrecht op elkaar
Interpretatie: regressiegewichten in plaats van correlaties
gebruik vervolgens ladingen a van variabelen op de factoren en de inhoud van de
variabelen
variabele met hoogste lading is meest kenmerkend voor factor
loop variabelen in de aflopende lading af
gebruik de variabele met hoge lading: vuistregel = a > .3
Factoroplossing
Correlationeel
Hoorcollege 1 – factor analyse
Factor analyse = een verklarende factor die een verklaring is voor de antwoorden gegeven
door de respondent
Onderzoek validiteit
- Externe validiteit
- Interne validiteit
- Begripsvaliditeit
- Statistische validiteit
Instrumentele validiteit
= de mate waarin een test aan zijn doel beantwoord
- Inhoudsvaliditeit = representeert de test het domein dat de test beoogt te meten
beoordeeld door deskundigen : Indruk validiteit
- Begripsvaliditeit = meet de test het theoretische concept dat moet worden gemeten
relaties binnen test = interne structuur
relaties met andere variabele = externe structuur
- Criteriumvaliditeit = voorspelt de test gedrag of prestatie dat niet met test wordt
gemeten
Factor analyse hoort bij de begripsvaliditeit en de interne structuur
Twee doelen factoranalyse
1. Beoordelen dimensionaliteit van test
= vinden we het aantal theoretische veronderstelde dimensies (=factoren) binnen de
verzameling van testitems
Confirmerende factor analyse (CFA)
2. Realiseren van data reductie
= kunnen we informatie uit groot aantal variabelen samenvatten in een kleiner aantal
nieuw te construeren variabelen (=factoren)
explorerende factoranalyse (EFA) tegengesteld aan de confirmerende
hoofdcomponentenanalyse (PCA)
Factoranalyse uitvoeren
Stap 0 data screening = Is er een correlatie, er moet ergens en correlatie zijn (meer dan
0.3) om een factor analyse uit te voeren
Stap 1 Keuze factormodel
- Factormodel PCA (hoofdcomponentenanalyse) = hoe kan met zo weinig mogelijk
factoren zo veel mogelijk variantie (=spreiding scores op een variabelen) kunnen
representeren p
- EFA (explorerende analyse) = aantal factoren onbekend, pijlen andere kant op, met U
(=unieke factor)
- CFA (confirmerende factoranalyse) = aantal factoren bekend, pijlen als bij EFA, model
volgt verwachte structuur en met U (unieke factor)
,Geobserveerde variabele
X = individuele score op variabele
Zx = X getransformeerd naar z-score
Factorlading (a) = correlatie van variabele met factor worden geschat
Factor (F) = achterliggende verklaring voor variatie in en samenhang tussen de variabelen
in PCA spreken we van componenten in plaats van factoren
Unieke factor = unieke factor voor verklaring van specifieke en error variantie
Welk factor model kies
- Hoofdcomponenten analyse = als reductie het doel is
- Exploratieve analyse = als inhoudelijke interpretatie van nog onbekend aantal
factoren het doel is
- Confirmatieve analyse = als beoordeling van de verwachte interne structuur
(=validiteit) het doel is van de factoranalyse
Resultaat factoranalyse
- Schatting van de factorladingen (a)
- Factorscores
- Informatie voor keuze aantal en interpretatie van te onderscheiden factoren:
eigenwaarden, factor correlaties en verklaarde varianties
Vergelijking voor factorscore F
Fji= factor score op factor j voor
persoon i
Aij = factorlading a van
gestandaardiseerde variabele 1 voor factor j
Z1i = gestandaardiseerde score van persoon i op variabele 1
Factorscore F
- Voor ieder individu een score op elke factor
- Voor persoon i is Fji de gewogen som van k naar Z gestandaardiseerde variabelen
- F is een nieuwe variabele
- Voor verdeling van factorscores geldt:
gemiddelde M=0
standaard afwijking SD = 1
Factor analyse stap 2
, Bepalen aantal factoren
eigenwaarde criterium
knikcriterium
Aantal factoren?
- Maximaal aantal factoren is gelijk aan totaal aantal variabelen in de analyse
- Met zo weinig mogelijk factoren zo veel mogelijk variantie in variabelen verklaren
- Factor 1: verklaart zo groot mogelijk deel van testvariantie
- Factor 2: verklaart zo groot mogelijk deel van restvariantie
- Factor k: verklaart zo groot mogelijk deel van restvariantie
in een hoofdcomponenten analyse wordt alle verklaarde variantie verklaard
- Voorlopig keuze aantal factoren is gebaseerd op verklaarde variantie door factoren
(=statistisch criterium)
Eigenwaarde
= hoeveel variantie er door de factor wordt verklaard, de verklaarde variantie in k variabelen
door een factor
- Per variabele: variantie = s2 = 1
- Totale variantie: variantie van variabelen = k
Eigenwaarde-criterium (Kaiser-Guttman criterium)
= kies, in eerste instantie, voor aantal factoren met
eigenwaarde groter dan 1 (=vuistregel)
Scree-plot
Knik criterium: kies het aantal factoren gelijk aan aantal
voor de knik in de grafiek
1 factor selecteren
Factor analyse stap 3
Interpretatie factor
= wat is de inhoudelijke betekenis van de factor?
Aanpak:
- Orthogonale (rechte) rotatie = na de rotatie ongecorreleerde factoren, assen staan
na rotatie loodrecht op elkaar
interpretatie: Correlaties tussen factoren en variabelen in de analyse
- Oblique (scheve) rotatie = na rotatie meer of minder gecorreleerde factoren, assen
niet loodrecht op elkaar
Interpretatie: regressiegewichten in plaats van correlaties
gebruik vervolgens ladingen a van variabelen op de factoren en de inhoud van de
variabelen
variabele met hoogste lading is meest kenmerkend voor factor
loop variabelen in de aflopende lading af
gebruik de variabele met hoge lading: vuistregel = a > .3
Factoroplossing