HC 1 – Multipele regressie analyse
Welke techniek kies je?
Welke techniek gekozen wordt, is afhankelijk van het meetniveau van de variabelen. In deze cursus
zijn 3 meetniveaus relevant:
1. Nominaal (NOM) – onderscheid alleen categorieën
a. Vb. Geen therapie, psychodynamisch, exposure
2. Interval (INT) – Wanneer de intervals betekenisvol zijn
a. Vb. gewicht, lengte, IQ-score, BDI score
3. Binair (BIN) – Heeft 2 categorieën (kunnen nominaal of interval zijn)
a. Vb. Pass/fail, man/vrouw
X1, X2 Y Techniek Afkorting
(onafhankelijk) (afhankelij
k)
INT INT Multiple regressie analyse MRA
NOM INT Analyse van variantie ANOVA
NOM + INT INT Analyse van covariantie ANCOVA
INT BIN Logistische regressie analyse LRA
Multipele regressie analyse
Onderzoeksvraag: kan Y voorspeld worden uit X1 en/of X2
Meetniveaus:
- Afhankelijke variabele Y Interval
- Onafhankelijke variabelen X1 en X2 Interval
Regressiemodel
¿ ¿
Simpele regressie Y i=b0 +b1 X 1 i +e i
¿ ¿ ¿ ¿
Multipele regressie Y i=b0 +b1 X 1 i +b2 X 2 i+ …+b k X ki +e i
Waarin:
- b ¿0 (populatie) regressie constante
- b ¿1, b ¿2, …, b ¿k (populatie) regressiecoëfficiënten
- X 1 i , X 2 i , … , X ki en Y i scores op X1, X2, …, Xk en Y van individu i
- e i residu (error)
, ¿ ¿ ¿ ¿
De parameters b 0, b 1, b 2, …, b k moeten worden bepaald vanuit de data (sample). Lineair model: least
squares estimation (e.g. SPSS)
Regressievergelijking
Y^ i is de weergave voor de voorspelling van Yi
Relatie: Y i=Y^ i + ei
Regressievergelijking:
- ^ =b +b X + e
Simpele regressie: Y
❑ ❑
i 0 1 1i i
- ^ =b +b X + b X + …+b X + e
Multipele regressie: Y
❑ ❑ ❑ ❑
i 0 1 1i 2 2i k ki i
Waarin:
¿ ¿ ¿ ¿
- b0, b1, b2, …, en bk schattingen zijn van b 0, b 1, b 2, …, b k
De beste schatting (minste kwadraten (least squares) is wanneer de som van de gekwadrateerde
verschillen minimaal is:
N N
∑ (Y i−Y^ i )2=∑ e 2i =minimaal
i=1 i=1
Regressielijn / plane
Wanneer er één voorspeller wordt gebruikt, wordt er een regressie lijn gefit. Hierbij wordt de lijn
zodanig gekozen dat de Sum of squares van de residuen (SS residual, de formule hierboven) minimaal is.
^ i=b❑
De regressielijn heeft het formaat: Y
❑
0 +b1 X 1 i
Wanneer je echter twee voorspellers hebt, wordt er een regressievlak (plane) gemaakt
Waarom een regressiemodel?
- Het beschrijft de relatie tussen Y en X1 en X2 in de populatie
- Het kan gebruikt worden om bijv. de depressiescore van individuen te voorspellen die niet in
de originele studie/sample zaten
Evalueren van het model
Hypothesen
¿ ¿ ¿
H0: b 1 = b 2=¿ … = b k = 0 (geen relatie tussen Y en X1, X2)
¿
Ha: ten minste één b k ≠ 0
Test H0 met:
MS Regressie SS regressie / df regressie
F= =
MS residual SS residu / df residu
Sum of squares related by:
SStotal = SSregressive + SSresidual
Welke techniek kies je?
Welke techniek gekozen wordt, is afhankelijk van het meetniveau van de variabelen. In deze cursus
zijn 3 meetniveaus relevant:
1. Nominaal (NOM) – onderscheid alleen categorieën
a. Vb. Geen therapie, psychodynamisch, exposure
2. Interval (INT) – Wanneer de intervals betekenisvol zijn
a. Vb. gewicht, lengte, IQ-score, BDI score
3. Binair (BIN) – Heeft 2 categorieën (kunnen nominaal of interval zijn)
a. Vb. Pass/fail, man/vrouw
X1, X2 Y Techniek Afkorting
(onafhankelijk) (afhankelij
k)
INT INT Multiple regressie analyse MRA
NOM INT Analyse van variantie ANOVA
NOM + INT INT Analyse van covariantie ANCOVA
INT BIN Logistische regressie analyse LRA
Multipele regressie analyse
Onderzoeksvraag: kan Y voorspeld worden uit X1 en/of X2
Meetniveaus:
- Afhankelijke variabele Y Interval
- Onafhankelijke variabelen X1 en X2 Interval
Regressiemodel
¿ ¿
Simpele regressie Y i=b0 +b1 X 1 i +e i
¿ ¿ ¿ ¿
Multipele regressie Y i=b0 +b1 X 1 i +b2 X 2 i+ …+b k X ki +e i
Waarin:
- b ¿0 (populatie) regressie constante
- b ¿1, b ¿2, …, b ¿k (populatie) regressiecoëfficiënten
- X 1 i , X 2 i , … , X ki en Y i scores op X1, X2, …, Xk en Y van individu i
- e i residu (error)
, ¿ ¿ ¿ ¿
De parameters b 0, b 1, b 2, …, b k moeten worden bepaald vanuit de data (sample). Lineair model: least
squares estimation (e.g. SPSS)
Regressievergelijking
Y^ i is de weergave voor de voorspelling van Yi
Relatie: Y i=Y^ i + ei
Regressievergelijking:
- ^ =b +b X + e
Simpele regressie: Y
❑ ❑
i 0 1 1i i
- ^ =b +b X + b X + …+b X + e
Multipele regressie: Y
❑ ❑ ❑ ❑
i 0 1 1i 2 2i k ki i
Waarin:
¿ ¿ ¿ ¿
- b0, b1, b2, …, en bk schattingen zijn van b 0, b 1, b 2, …, b k
De beste schatting (minste kwadraten (least squares) is wanneer de som van de gekwadrateerde
verschillen minimaal is:
N N
∑ (Y i−Y^ i )2=∑ e 2i =minimaal
i=1 i=1
Regressielijn / plane
Wanneer er één voorspeller wordt gebruikt, wordt er een regressie lijn gefit. Hierbij wordt de lijn
zodanig gekozen dat de Sum of squares van de residuen (SS residual, de formule hierboven) minimaal is.
^ i=b❑
De regressielijn heeft het formaat: Y
❑
0 +b1 X 1 i
Wanneer je echter twee voorspellers hebt, wordt er een regressievlak (plane) gemaakt
Waarom een regressiemodel?
- Het beschrijft de relatie tussen Y en X1 en X2 in de populatie
- Het kan gebruikt worden om bijv. de depressiescore van individuen te voorspellen die niet in
de originele studie/sample zaten
Evalueren van het model
Hypothesen
¿ ¿ ¿
H0: b 1 = b 2=¿ … = b k = 0 (geen relatie tussen Y en X1, X2)
¿
Ha: ten minste één b k ≠ 0
Test H0 met:
MS Regressie SS regressie / df regressie
F= =
MS residual SS residu / df residu
Sum of squares related by:
SStotal = SSregressive + SSresidual