Kwantitatieve onderzoeksmethoden: Data-analyse 1
Inleiding
Van probleem naar analyse
Multivariate data-analyse
= verzamelnaam voor groep van statistische technieken gericht op analyse van samenhang tss
meerdere variabelen
Sterk heterogeen qua opzet en finaliteit (heel verschillend dus):
- Analyse van probleemkenmerk of probleemrelaties
- Dependente versus niet-dependente technieken
- Meetniveau van afhankelijke variabele
- Meetniveau onafhankelijke variabelen
- Aantal dimensies
- Orthogonaliteit v dimensies
Keuze van techniek hangt af van de onderzoeksvraag
- Analyse van probleemkenmerk
o Welke factoren verklaren een bepaald kenmerk?
- Analyse van probleemrelatie
o Hoe kan een relatie tussen 2 kenmerken begrepen worden?
- Synthese/datareductie
o Welke achterliggende kenmerken worden gemeten door een set indicatoren?
o Bv. verschillende examens afleggen en zo kennis meten
- Voorbeeld: Steun voor activering van werklozen
o Analyse van probleemkenmerk
▪ Welke factoren versterken of ondermijnen steun voor activerend beleid?
▪ Welke self-interest factoren of ideologische drijfveren zijn relevant?
o Analyse van een probleemrelatie
▪ Hoe komt het dat lager opgeleiden vaker gewonnen zijn voor sterk
activeringsbeleid, hoewel dat tegen hun belangen ingaat?
▪ Welke factoren kunnen de relatie tss opleiding en steun voor activering
verklaren?
o Synthese/data-reductie
▪ Meten deze survey-items 1 achterliggende attitude-dimensie? Of omvatten ze
meerdere aspecten?
▪ Kunnen ze tot één index samengevoegd worden?
Types variabelen
- Continue variabele (interval- of ratiomeetniveau)
- Manifest opgemeten (bv. leeftijd v respondenten)
- Kan zowel rol van te verklaren (afhankelijke) variabele als verklarende
(onafhankelijke) variabele opnemen
- Nominale of ordinale variabele met twee categorieën (dichotome variabele)
- Manifest opgemeten (bv. gelsacht van respondenten)
- Kan zowel de rol v verklarende (onafhankelijke) variabele of te verklaren
(afhankelijke) variabele opnemen
- Polytome categorische variabele (nominaal of ordinaal) met 3 of meer categorieën
- Manifest opgemeten (bv. gewest/woonplaats respondent)
- Kan zowel rol van te verklaren (afhankelijke) variabele als verklarende
(onafhankelijke) variabele opnemen
Academiejaar 2023-2024 | Pagina 1
,Kwantitatieve onderzoeksmethoden: Data-analyse 1
- Latente variabele (interval- of ratiomeetniveau)
- Niet rechtstreeks opgemeten bij respondenten (bv. complexe schaal berekend op basis
van opgemeten items)
Meten en meetniveaus
Eigenschappen van variabelen
Onschendbaarheid = de variabele of meetschaal X is ordenbaar wnr, voor elk paar elementen x1 en
x2 ∈ X, kan besluiten
- x1 > x2 (“groter dan”)
- x1 ≤ x2 (“kleiner dan”)
Het bestaan van een meeteenheid: zelfde verschillen tss de waarden van X weerspiegelen zelfde
verschillen in de intensiteit van het bestudeerde kenmerken. Slechts van toepassing op kwantitatieve
variabelen
- Bv. temperatuur in °Celsius (°C) of °Fahrenheit (°F)
- Merk op
o De gekozen meeteenheid kan arbitrair zijn (bv. °C of °F)
o De aanwezigheid van een 0 heeft geen bijzondere betekenis (0°C wilt niet zeggen
dat temperatuur afwezig is)
▪ Ratio’s of verhoudingen zijn betekenisloos
▪ Bv. 10°C = 50 °F; 20°C = 68°F
▪ Ratio 20/10 ≠ ratio 68/50
Het bestaan van een absoluut nulpunt = een waarde (0) die de afwezigheid van het bestuurde
kenmerk weergeeft
- Bv. lengte: absoluut nulpunt (ie geen lengte)
- Bv. °Kelvin: absoluut nulpunt (ie afwezigheid v Brownse beweging)
- Merk op
o Negatieve waarden komen niet voor wanneer een absoluut nulpunt bestaat
o Ratios of verhoudingen zijn bepaald
▪ Bv. 1000 BEF = 24,79 EUR; 2000 BEF = 49,58 EUR
▪ Ratio 2000/1000 = ratio 49,58/24,79
Meten en meetniveaus
MEETNIVEAU INFORMATIE BETEKENIS VD WAARDEN
Kengetal, geen verdere
NOMINAAL bv. woonplaats Classificatie: =, ≠
wiskundige bewerkingen
Waarden weerspiegelen
ORDINAAL bv. diploma Ordening: <, =, > bestaande ordening; geen
wiskundige bewerkingen
Interval (A-B) is bepaald,
INTERVAL bv. °C, IQ Ordening + meeteenheid nulpunt is arbitrair; wiskundige
bewerkingen mogelijk
Ratio of verhouding A/B is
RATIO bv. inkomen, crime Ordening, meeteenheid &
bepaald; wiskundige
rates… absoluut nulpunt
bewerkingen mogelijk
Academiejaar 2023-2024 | Pagina 2
,Kwantitatieve onderzoeksmethoden: Data-analyse 1
GRAFISCHE
MEETNIVEAU CENTRALE TENDENS SPREIDING
VOORSTELLING
Histogram,
Nominaal Modus --
cirkeldiagram
Interkwantiel- Histogram, cumulatieve
Ordinaal Mediaan
afstanden frequentieverdeling
Rekenkundig Variantie/ Histogram, cumulatieve
Interval
gemiddelde Standaardafwijking frequantieverdeling
Rekenkundig,
meetkundig & Variantie/ Histogram, cumulatieve
Ratio
harmonisch Standaardafwijking frequentieverdeling
gemiddelde
Types samenhang
- Symmetrische samenhang tss twee kenmerken: er w geen onderscheid gemaakt tss te
verklaren (afhankelijk) en verklarende (onafhankelijk) variabelen
- Asymmetrische samenhang waarbij verklarende (onafhankelijke) variabele een
lineair (causaal) effect uitoefent op een te verklaren (afhankelijke) variabele
- Bij een lineair effect heeft eenzelfde verandering id onafhankelijk variabele steeds
eenzelfde verandering id afhankelijk variabele tot gevolg
- Asymmetrische samenhang waarbij onafhankelijke variabele niet-lineair effect
uitoefent op afhankelijke variabele
- Bij niet-lineair effect w verandering in afhankelijke variabele ten gevolge van
eenzelfde verandering in onafhankelijke variabele gradueel groter of kleiner
- Interactie-effect: asymmetrische samenhang waarbij de combinatie van twee of meer
onafhankelijke variabelen een causaal effect uitoefent op de afhankelijke variabele
Voorbeelden
Academiejaar 2023-2024 | Pagina 3
, Kwantitatieve onderzoeksmethoden: Data-analyse 1
Samenhang
2 categorische variabelen
Kruistabel = verschilt de conditionele verdeling 1 variabele (Y) binnen categorieën een andere
variabele (X) id steekproef
➔ Beschrijving v patroon in de date
Gaat het hier om een steekproeffluctuatie of een werkelijke samenhang id populatie
➔ Statistische inferentie/veralgemening
Kolompercentages
Is de samenhang een fluctuatie in onze steekproef of (waarschijnlijk) aanwezig in de populatie?
Chi-kwadraat toets
- Nulhypothese H0 : statistische onafhankelijkheid in de populatie
- Bereken de verwachte celfrequenties onder H0
(𝑅 × 𝐶 )
o 𝐸𝑖𝑗 = 𝑖 𝑁 𝑗
- Teststatistiek vergelijken met de Chi-kwadraat verdeling
(𝐸𝑖𝑗 −𝑂𝑖𝑗 )²
o 𝑋2 = ∑
𝐸𝑖𝑗
o 𝑑𝑓 = (𝑅 − 1)(𝐶 − 1)
Voorbeeld:
Chi-kwadraat verdeling (met kritische waarde X²*)
Academiejaar 2023-2024 | Pagina 4
Inleiding
Van probleem naar analyse
Multivariate data-analyse
= verzamelnaam voor groep van statistische technieken gericht op analyse van samenhang tss
meerdere variabelen
Sterk heterogeen qua opzet en finaliteit (heel verschillend dus):
- Analyse van probleemkenmerk of probleemrelaties
- Dependente versus niet-dependente technieken
- Meetniveau van afhankelijke variabele
- Meetniveau onafhankelijke variabelen
- Aantal dimensies
- Orthogonaliteit v dimensies
Keuze van techniek hangt af van de onderzoeksvraag
- Analyse van probleemkenmerk
o Welke factoren verklaren een bepaald kenmerk?
- Analyse van probleemrelatie
o Hoe kan een relatie tussen 2 kenmerken begrepen worden?
- Synthese/datareductie
o Welke achterliggende kenmerken worden gemeten door een set indicatoren?
o Bv. verschillende examens afleggen en zo kennis meten
- Voorbeeld: Steun voor activering van werklozen
o Analyse van probleemkenmerk
▪ Welke factoren versterken of ondermijnen steun voor activerend beleid?
▪ Welke self-interest factoren of ideologische drijfveren zijn relevant?
o Analyse van een probleemrelatie
▪ Hoe komt het dat lager opgeleiden vaker gewonnen zijn voor sterk
activeringsbeleid, hoewel dat tegen hun belangen ingaat?
▪ Welke factoren kunnen de relatie tss opleiding en steun voor activering
verklaren?
o Synthese/data-reductie
▪ Meten deze survey-items 1 achterliggende attitude-dimensie? Of omvatten ze
meerdere aspecten?
▪ Kunnen ze tot één index samengevoegd worden?
Types variabelen
- Continue variabele (interval- of ratiomeetniveau)
- Manifest opgemeten (bv. leeftijd v respondenten)
- Kan zowel rol van te verklaren (afhankelijke) variabele als verklarende
(onafhankelijke) variabele opnemen
- Nominale of ordinale variabele met twee categorieën (dichotome variabele)
- Manifest opgemeten (bv. gelsacht van respondenten)
- Kan zowel de rol v verklarende (onafhankelijke) variabele of te verklaren
(afhankelijke) variabele opnemen
- Polytome categorische variabele (nominaal of ordinaal) met 3 of meer categorieën
- Manifest opgemeten (bv. gewest/woonplaats respondent)
- Kan zowel rol van te verklaren (afhankelijke) variabele als verklarende
(onafhankelijke) variabele opnemen
Academiejaar 2023-2024 | Pagina 1
,Kwantitatieve onderzoeksmethoden: Data-analyse 1
- Latente variabele (interval- of ratiomeetniveau)
- Niet rechtstreeks opgemeten bij respondenten (bv. complexe schaal berekend op basis
van opgemeten items)
Meten en meetniveaus
Eigenschappen van variabelen
Onschendbaarheid = de variabele of meetschaal X is ordenbaar wnr, voor elk paar elementen x1 en
x2 ∈ X, kan besluiten
- x1 > x2 (“groter dan”)
- x1 ≤ x2 (“kleiner dan”)
Het bestaan van een meeteenheid: zelfde verschillen tss de waarden van X weerspiegelen zelfde
verschillen in de intensiteit van het bestudeerde kenmerken. Slechts van toepassing op kwantitatieve
variabelen
- Bv. temperatuur in °Celsius (°C) of °Fahrenheit (°F)
- Merk op
o De gekozen meeteenheid kan arbitrair zijn (bv. °C of °F)
o De aanwezigheid van een 0 heeft geen bijzondere betekenis (0°C wilt niet zeggen
dat temperatuur afwezig is)
▪ Ratio’s of verhoudingen zijn betekenisloos
▪ Bv. 10°C = 50 °F; 20°C = 68°F
▪ Ratio 20/10 ≠ ratio 68/50
Het bestaan van een absoluut nulpunt = een waarde (0) die de afwezigheid van het bestuurde
kenmerk weergeeft
- Bv. lengte: absoluut nulpunt (ie geen lengte)
- Bv. °Kelvin: absoluut nulpunt (ie afwezigheid v Brownse beweging)
- Merk op
o Negatieve waarden komen niet voor wanneer een absoluut nulpunt bestaat
o Ratios of verhoudingen zijn bepaald
▪ Bv. 1000 BEF = 24,79 EUR; 2000 BEF = 49,58 EUR
▪ Ratio 2000/1000 = ratio 49,58/24,79
Meten en meetniveaus
MEETNIVEAU INFORMATIE BETEKENIS VD WAARDEN
Kengetal, geen verdere
NOMINAAL bv. woonplaats Classificatie: =, ≠
wiskundige bewerkingen
Waarden weerspiegelen
ORDINAAL bv. diploma Ordening: <, =, > bestaande ordening; geen
wiskundige bewerkingen
Interval (A-B) is bepaald,
INTERVAL bv. °C, IQ Ordening + meeteenheid nulpunt is arbitrair; wiskundige
bewerkingen mogelijk
Ratio of verhouding A/B is
RATIO bv. inkomen, crime Ordening, meeteenheid &
bepaald; wiskundige
rates… absoluut nulpunt
bewerkingen mogelijk
Academiejaar 2023-2024 | Pagina 2
,Kwantitatieve onderzoeksmethoden: Data-analyse 1
GRAFISCHE
MEETNIVEAU CENTRALE TENDENS SPREIDING
VOORSTELLING
Histogram,
Nominaal Modus --
cirkeldiagram
Interkwantiel- Histogram, cumulatieve
Ordinaal Mediaan
afstanden frequentieverdeling
Rekenkundig Variantie/ Histogram, cumulatieve
Interval
gemiddelde Standaardafwijking frequantieverdeling
Rekenkundig,
meetkundig & Variantie/ Histogram, cumulatieve
Ratio
harmonisch Standaardafwijking frequentieverdeling
gemiddelde
Types samenhang
- Symmetrische samenhang tss twee kenmerken: er w geen onderscheid gemaakt tss te
verklaren (afhankelijk) en verklarende (onafhankelijk) variabelen
- Asymmetrische samenhang waarbij verklarende (onafhankelijke) variabele een
lineair (causaal) effect uitoefent op een te verklaren (afhankelijke) variabele
- Bij een lineair effect heeft eenzelfde verandering id onafhankelijk variabele steeds
eenzelfde verandering id afhankelijk variabele tot gevolg
- Asymmetrische samenhang waarbij onafhankelijke variabele niet-lineair effect
uitoefent op afhankelijke variabele
- Bij niet-lineair effect w verandering in afhankelijke variabele ten gevolge van
eenzelfde verandering in onafhankelijke variabele gradueel groter of kleiner
- Interactie-effect: asymmetrische samenhang waarbij de combinatie van twee of meer
onafhankelijke variabelen een causaal effect uitoefent op de afhankelijke variabele
Voorbeelden
Academiejaar 2023-2024 | Pagina 3
, Kwantitatieve onderzoeksmethoden: Data-analyse 1
Samenhang
2 categorische variabelen
Kruistabel = verschilt de conditionele verdeling 1 variabele (Y) binnen categorieën een andere
variabele (X) id steekproef
➔ Beschrijving v patroon in de date
Gaat het hier om een steekproeffluctuatie of een werkelijke samenhang id populatie
➔ Statistische inferentie/veralgemening
Kolompercentages
Is de samenhang een fluctuatie in onze steekproef of (waarschijnlijk) aanwezig in de populatie?
Chi-kwadraat toets
- Nulhypothese H0 : statistische onafhankelijkheid in de populatie
- Bereken de verwachte celfrequenties onder H0
(𝑅 × 𝐶 )
o 𝐸𝑖𝑗 = 𝑖 𝑁 𝑗
- Teststatistiek vergelijken met de Chi-kwadraat verdeling
(𝐸𝑖𝑗 −𝑂𝑖𝑗 )²
o 𝑋2 = ∑
𝐸𝑖𝑗
o 𝑑𝑓 = (𝑅 − 1)(𝐶 − 1)
Voorbeeld:
Chi-kwadraat verdeling (met kritische waarde X²*)
Academiejaar 2023-2024 | Pagina 4