dMultivariate Data-analyse: Samenvatting
= “gelijktijdige analyses van data met meer dan twee variabelen” of “meten, verklaren en voorspellen
van de mate van samenhang in gewogen combinaties van variabelen
! VOORBEELDVRAGEN: ZIE HOC9 lesopname, min 1.38.15 + pointcarre
Deel 1: Probleemstelling
Keuze techniek afhankelijk van onderzoeksvraag:
Analyse van probleemkenmerk
Analyse van probleemrelatie
Datareductie (veelheid van items/uitspraken)
1.1 Multivariate technieken:
a. Dependentietechnieken: afhankelijke vs. onafhankelijke variabelen: y = x-x-x-x (onderscheid)
ŷ= a + bx
! Altijd rekening houden met andere mogelijke variabelen: onderzoek verband tussen x en y
na controle voor ( = onder constanthouding van) verdere variabelen z
y = a + b1x1 + b2x2 + b3x3
, b. Interdependentietechnieken: geen onderscheid afhankelijke vs. onafhankelijke var.: x-x-x-x
Mogelijke techniek: principale componentenanalyse adhv likertschaal om componenten te
identificeren
Samenhang tussen variabelen zonder asymmetrie
Groepen van variabelen, uiting van latente factoren ( = moeilijk te meten/observeren
variabelen)
DUS:
Gemeenschappelijk: Relatie tussen meer dan 2 variabelen onderzoeken
Verschillend: y = x-x-x-x vs. x-x-x-x
1.2 Types variabelen:
(manifest = rechtstreeks)
Variabelen kan verklaren (afh.) of verklarend (onafh.) zijn:
Continue (interval of ratiomeetniveau)
Manifest opgemeten ( bv. Leeftijd)
Nominale of ordinale variabelen met 2 categorieën (dichotome variabelen)
Manifest opgemeten (bv. Geslacht)
Polytome categorische variabelen (nominaal of ordinaal) met 3 of meer categorieën
Manifest opgemeten bij analyse-eenheden (bv. Gewest/woonplaats)
Latente variabelen (interval of ratiomeetniveau)
Niet rechtstreeks opgemeten bij respondent (bv. Likerschaal)
1.3 Types samenhang:
Symmetrische samenhang tss 2 kenmerken zonder onderscheid afh. Vs. onafh.
, Asymmetrische samenhang met een lineair effect van onafh. variabele op de afh. Variabele
! Lineair effect: verandering in onafh. Variabele heeft dezelfde verandering in onafhankelijke
variabelen
Asymmetrische samenhang zonder lineair effect van onafh. Op afhankelijke variabele
! Niet-lineair effect: verandering in onafh. zorgt voor grotere of kleinere verandering in afh.
Interactie-effect: asymmetrische samenhang waarbij 2 of meer onafh. Variabelen een effect
uitoefenen op afh. Variabele
1.4 Variabelen en samenhang
1.5 Van probleem naar analyse
Verschillende fasen in sociaalwetenschappelijk onderzoek:
, 1.6 Sociaal – wetenschappelijke probleemstellingen
Centrale vraag: Bestaat er een (causale) samenhang tussen X en Y? en Hoe beïnvloedt X de uitkomst
van Y?
! Causale samenhang ≠ statistische samenhang
= Causaliteit tussen variabelen vs. variabelen veranderen samen maar hoe/waarom is niet geweten
DUS theoretische redenen nodig om te bepalen of er sprake is van een causale samenhang!
Types probleemstellingen:
a. Schijnbare causaliteit:
Er wordt geen/niet genoeg rekening gehouden met bepaalde variabelen
Data-analyse door:
o Beschrijvende analyse: kruistabellen vgl van afh. en onafh. 1 keer rekening houdend
met 3e variabelen, 1 keer zonder rekening met 3 e variabele
o Multivariate: regressietechnieken om verschillende modelspecificaties te vgl
Schijnbare samenhang als er geen statistische samenhang is na controle voor 3 e var.
c. Indirecte causaliteit:
= verklaring van het causale verband tussen X en Y middels een 3e variabele, de mediator M
Voorwaarden voor een mediator:
o X beïnvloedt Y EN M veroorzaakt Y
o M ligt causaal gezien TUSSEN X en Y
Data-analyse door:
o Verkennende analyse: kruistabellen vgl van afh. en onafh. zonder 3 e variabele en met
3e variabele
o Multivariate: lineaire regressie
= “gelijktijdige analyses van data met meer dan twee variabelen” of “meten, verklaren en voorspellen
van de mate van samenhang in gewogen combinaties van variabelen
! VOORBEELDVRAGEN: ZIE HOC9 lesopname, min 1.38.15 + pointcarre
Deel 1: Probleemstelling
Keuze techniek afhankelijk van onderzoeksvraag:
Analyse van probleemkenmerk
Analyse van probleemrelatie
Datareductie (veelheid van items/uitspraken)
1.1 Multivariate technieken:
a. Dependentietechnieken: afhankelijke vs. onafhankelijke variabelen: y = x-x-x-x (onderscheid)
ŷ= a + bx
! Altijd rekening houden met andere mogelijke variabelen: onderzoek verband tussen x en y
na controle voor ( = onder constanthouding van) verdere variabelen z
y = a + b1x1 + b2x2 + b3x3
, b. Interdependentietechnieken: geen onderscheid afhankelijke vs. onafhankelijke var.: x-x-x-x
Mogelijke techniek: principale componentenanalyse adhv likertschaal om componenten te
identificeren
Samenhang tussen variabelen zonder asymmetrie
Groepen van variabelen, uiting van latente factoren ( = moeilijk te meten/observeren
variabelen)
DUS:
Gemeenschappelijk: Relatie tussen meer dan 2 variabelen onderzoeken
Verschillend: y = x-x-x-x vs. x-x-x-x
1.2 Types variabelen:
(manifest = rechtstreeks)
Variabelen kan verklaren (afh.) of verklarend (onafh.) zijn:
Continue (interval of ratiomeetniveau)
Manifest opgemeten ( bv. Leeftijd)
Nominale of ordinale variabelen met 2 categorieën (dichotome variabelen)
Manifest opgemeten (bv. Geslacht)
Polytome categorische variabelen (nominaal of ordinaal) met 3 of meer categorieën
Manifest opgemeten bij analyse-eenheden (bv. Gewest/woonplaats)
Latente variabelen (interval of ratiomeetniveau)
Niet rechtstreeks opgemeten bij respondent (bv. Likerschaal)
1.3 Types samenhang:
Symmetrische samenhang tss 2 kenmerken zonder onderscheid afh. Vs. onafh.
, Asymmetrische samenhang met een lineair effect van onafh. variabele op de afh. Variabele
! Lineair effect: verandering in onafh. Variabele heeft dezelfde verandering in onafhankelijke
variabelen
Asymmetrische samenhang zonder lineair effect van onafh. Op afhankelijke variabele
! Niet-lineair effect: verandering in onafh. zorgt voor grotere of kleinere verandering in afh.
Interactie-effect: asymmetrische samenhang waarbij 2 of meer onafh. Variabelen een effect
uitoefenen op afh. Variabele
1.4 Variabelen en samenhang
1.5 Van probleem naar analyse
Verschillende fasen in sociaalwetenschappelijk onderzoek:
, 1.6 Sociaal – wetenschappelijke probleemstellingen
Centrale vraag: Bestaat er een (causale) samenhang tussen X en Y? en Hoe beïnvloedt X de uitkomst
van Y?
! Causale samenhang ≠ statistische samenhang
= Causaliteit tussen variabelen vs. variabelen veranderen samen maar hoe/waarom is niet geweten
DUS theoretische redenen nodig om te bepalen of er sprake is van een causale samenhang!
Types probleemstellingen:
a. Schijnbare causaliteit:
Er wordt geen/niet genoeg rekening gehouden met bepaalde variabelen
Data-analyse door:
o Beschrijvende analyse: kruistabellen vgl van afh. en onafh. 1 keer rekening houdend
met 3e variabelen, 1 keer zonder rekening met 3 e variabele
o Multivariate: regressietechnieken om verschillende modelspecificaties te vgl
Schijnbare samenhang als er geen statistische samenhang is na controle voor 3 e var.
c. Indirecte causaliteit:
= verklaring van het causale verband tussen X en Y middels een 3e variabele, de mediator M
Voorwaarden voor een mediator:
o X beïnvloedt Y EN M veroorzaakt Y
o M ligt causaal gezien TUSSEN X en Y
Data-analyse door:
o Verkennende analyse: kruistabellen vgl van afh. en onafh. zonder 3 e variabele en met
3e variabele
o Multivariate: lineaire regressie