DEEL 2 BESCHRIJVENDE BIVARIATE STATISTIEK
1) Doelstellingen
beschrijven van de samenhang tussen 2 categorische kenmerken (nominaal of
ordinaal) relaties tussen kenmerken/ variabelen
via analyse van de gezamenlijke frequentieverdelingen
o samenhang = verdeling van ene variabele verschilt naargelang de waarden
van de andere variabele
(conditionele verdelingen verschillen) leeftijd, politieke voorkeur, geslacht
o als ze verschillen van elkaar samenhang (conditie vrouw tv kijken en
conditie man tv kijken verschillen van elkaar we spreken van een
samenhang)
manier waarop is sterk afhankelijk van meetniveau:
o categorische variabelen: bivariate frequentietabel
-> associatiematen
o metrische variabelen: spreidingsdiagram
-> correlatie- en regressieanalyse
Type bivariate relaties
symmetrisch:
o wederzijdse samenhang
o x en y
o gebogen pijltje: we veronderstellen dat er een verband is maar je kan
niet bewijzen dat het een het ander beïnvloedt
a-symmetrisch:
o effect-relatie, beïnvloeding, ‘oorzaak-gevolg’
‘afhankelijke’ variabele Y en ‘onafhankelijke’
variabele X
o x heeft invloed op y, maar y niet op x
o psychoses worden beïnvloed door druggebruik, maar niet iedereen die
drugs gebruikt, heeft een psychose
x = de onafhankelijke variabele
y= afhankelijke variabele
,2) Relaties tussen categorische variabelen
A) Kruistabel en conditionele verdelingen
rij- en kolomvariabelen (r * k)
marginale verdelingen
celfrequenties
conditionele (voorwaardelijke) verdelingen
B) Percentageverschil
geeft verschil in percentagepunten tussen twee conditionele relatieve
verdelingen
samenhang = verschil in de conditionele relatieve verdelingen
berekening/interpretatie:
kolompercentages:
verticaal berekend, horizontaal vergeleken (dia 3-5)
rijpercentages:
horizontaal berekend, verticaal vergeleken
indien ‘effectrelatie’: percentages berekenen op ‘onafhankelijke
variabele’
a-symmetrische maat
altijd goed kijken waar de onafhankelijke en afhankelijke variabele
staat dan weten we of we rij of kolompercentages moeten
berekenen
C) Oddsratio
odds: andere manier om frequentieverdeling weer te geven dan
proporties
een verhouding van twee frequenties
BV: mensen die regelmatig tv kijken: 1456/1175 = 1.24
Er zijn 1.24x meer mensen die regelmatig tv kijken, dan mensen die niet
regelmatig tv kijken
, interpretatie:
hoeveel keer meer x1 dan x2
bij 45+: er zijn 1.49x meer mensen die regelmatig tv kijken, dan die
niet regelmatig tv kijken
[0,+] , 1 : gelijk aantal
associatiemaat: oddsratio (ratio van odds)
nadeel:
interpretatie in termen van verhouding
ongelijke schaal tussen [0,1] en [1,+]
0 0,25 1 4
oplossing: logodds = ln(odds)
- -1,39 0 1,39 +
probleem bij nulcellen (fi=0)
opletten: interpretatie afhankelijk van gekozen berekening
zie voorbeelden dia’s Powerpoint
D) Op Chi-kwadraat gebaseerde associatiematen
relatie tussen twee categorische kenmerken ?
r*k kruistabel
1) Doelstellingen
beschrijven van de samenhang tussen 2 categorische kenmerken (nominaal of
ordinaal) relaties tussen kenmerken/ variabelen
via analyse van de gezamenlijke frequentieverdelingen
o samenhang = verdeling van ene variabele verschilt naargelang de waarden
van de andere variabele
(conditionele verdelingen verschillen) leeftijd, politieke voorkeur, geslacht
o als ze verschillen van elkaar samenhang (conditie vrouw tv kijken en
conditie man tv kijken verschillen van elkaar we spreken van een
samenhang)
manier waarop is sterk afhankelijk van meetniveau:
o categorische variabelen: bivariate frequentietabel
-> associatiematen
o metrische variabelen: spreidingsdiagram
-> correlatie- en regressieanalyse
Type bivariate relaties
symmetrisch:
o wederzijdse samenhang
o x en y
o gebogen pijltje: we veronderstellen dat er een verband is maar je kan
niet bewijzen dat het een het ander beïnvloedt
a-symmetrisch:
o effect-relatie, beïnvloeding, ‘oorzaak-gevolg’
‘afhankelijke’ variabele Y en ‘onafhankelijke’
variabele X
o x heeft invloed op y, maar y niet op x
o psychoses worden beïnvloed door druggebruik, maar niet iedereen die
drugs gebruikt, heeft een psychose
x = de onafhankelijke variabele
y= afhankelijke variabele
,2) Relaties tussen categorische variabelen
A) Kruistabel en conditionele verdelingen
rij- en kolomvariabelen (r * k)
marginale verdelingen
celfrequenties
conditionele (voorwaardelijke) verdelingen
B) Percentageverschil
geeft verschil in percentagepunten tussen twee conditionele relatieve
verdelingen
samenhang = verschil in de conditionele relatieve verdelingen
berekening/interpretatie:
kolompercentages:
verticaal berekend, horizontaal vergeleken (dia 3-5)
rijpercentages:
horizontaal berekend, verticaal vergeleken
indien ‘effectrelatie’: percentages berekenen op ‘onafhankelijke
variabele’
a-symmetrische maat
altijd goed kijken waar de onafhankelijke en afhankelijke variabele
staat dan weten we of we rij of kolompercentages moeten
berekenen
C) Oddsratio
odds: andere manier om frequentieverdeling weer te geven dan
proporties
een verhouding van twee frequenties
BV: mensen die regelmatig tv kijken: 1456/1175 = 1.24
Er zijn 1.24x meer mensen die regelmatig tv kijken, dan mensen die niet
regelmatig tv kijken
, interpretatie:
hoeveel keer meer x1 dan x2
bij 45+: er zijn 1.49x meer mensen die regelmatig tv kijken, dan die
niet regelmatig tv kijken
[0,+] , 1 : gelijk aantal
associatiemaat: oddsratio (ratio van odds)
nadeel:
interpretatie in termen van verhouding
ongelijke schaal tussen [0,1] en [1,+]
0 0,25 1 4
oplossing: logodds = ln(odds)
- -1,39 0 1,39 +
probleem bij nulcellen (fi=0)
opletten: interpretatie afhankelijk van gekozen berekening
zie voorbeelden dia’s Powerpoint
D) Op Chi-kwadraat gebaseerde associatiematen
relatie tussen twee categorische kenmerken ?
r*k kruistabel