Aantekeningen practicum 4 - webinar
Enkelvoudige lineaire regressie = voorspellen continue uitkomstmaat o.b.v. 1 variabele
Meervoudige lineaire regressie = voorspellen continue uitkomstmaat o.b.v. 2 ≥ variabele
Enkelvoudige lineaire regressie
- Y = uikomstvariabele —> moet continue zijn
- X = verklarende variabele —> in dit geval 1, kan continue en dichotoom zijn
Y = ax + b
Voorbeeld: waarin Y het tentamen cijfer is en X is aantal gestudeerde uren, ε is afwijking.
Aanname hierbij is dat de afwijkingen normaal verdeeld zijn met gemiddelde 0 en gelijke variantie
Yi = βi Xi + β0 Regressie behoort bij het aantal gestudeerde uren
Ingevuld: Yî = 0,14Xi + 3,05
Kan weergegeven worden in een lineaire lijn —> elke lijn heeft andere β1
Welke lijn het best past bij de meetpunten wordt bepaald door te kijken naar residuen.
Residuen = afwijkingen van geobserveerde tentamencijfers tot verwachte tentamencijfers
o.b.v. de lineaire regressie lijn.
De best passende regressielijn = de som van de gekwadrateerde residuen het kleinst is
(Yi − Y )2
∑
Totalen kwadratensom (SST): SST = —> Yi = geobserveerd meting
Y = gemiddelde van metingen
In voorbeeld: 224,306
(Yî − Y )2 Yî = regressievergelijking
∑
Model kwadratensom (SSM): SSM = —>
voorspelde meting
((0,14Xi + 3,05) − Y )2 = 130,59 Y = gemiddelde van metingen
∑
In voorbeeld:
e2î = (Yi − Yî )2 —> Yi = geobserveerde meting
∑ ∑
Residuen kwadratensom (SSR): SSR =
Yî = regressievergelijking
(Yi − (0,14Xi + 3,05))2 = 93,715 voorspelde meting
∑
In voorbeeld:
Proportie verklaarde variantie (R 2) geeft haan hoe goed het model de uitkomstvariabele kan
voorspellen. (SST = SSM + SSR) —> in voorbeeld hoe goed het aantal studeren het cijfer kan
voorspellen:
SSM 130,59
R2 = = 0,58
SST 224,306
In enkelvoudig lineair regressie model is F-test gelijk aan de t-test voor onafhankelijke variabele.
Aannames enkelvoudig lineair regressie model:
- Waarnemingen zijn onafhankelijk
- Residuen zijn normaal verdeeld
- De spreiding (variantie) van residuen is gelijk voor alle waarden van X (homoscedasticiteit)
Enkelvoudige lineaire regressie = voorspellen continue uitkomstmaat o.b.v. 1 variabele
Meervoudige lineaire regressie = voorspellen continue uitkomstmaat o.b.v. 2 ≥ variabele
Enkelvoudige lineaire regressie
- Y = uikomstvariabele —> moet continue zijn
- X = verklarende variabele —> in dit geval 1, kan continue en dichotoom zijn
Y = ax + b
Voorbeeld: waarin Y het tentamen cijfer is en X is aantal gestudeerde uren, ε is afwijking.
Aanname hierbij is dat de afwijkingen normaal verdeeld zijn met gemiddelde 0 en gelijke variantie
Yi = βi Xi + β0 Regressie behoort bij het aantal gestudeerde uren
Ingevuld: Yî = 0,14Xi + 3,05
Kan weergegeven worden in een lineaire lijn —> elke lijn heeft andere β1
Welke lijn het best past bij de meetpunten wordt bepaald door te kijken naar residuen.
Residuen = afwijkingen van geobserveerde tentamencijfers tot verwachte tentamencijfers
o.b.v. de lineaire regressie lijn.
De best passende regressielijn = de som van de gekwadrateerde residuen het kleinst is
(Yi − Y )2
∑
Totalen kwadratensom (SST): SST = —> Yi = geobserveerd meting
Y = gemiddelde van metingen
In voorbeeld: 224,306
(Yî − Y )2 Yî = regressievergelijking
∑
Model kwadratensom (SSM): SSM = —>
voorspelde meting
((0,14Xi + 3,05) − Y )2 = 130,59 Y = gemiddelde van metingen
∑
In voorbeeld:
e2î = (Yi − Yî )2 —> Yi = geobserveerde meting
∑ ∑
Residuen kwadratensom (SSR): SSR =
Yî = regressievergelijking
(Yi − (0,14Xi + 3,05))2 = 93,715 voorspelde meting
∑
In voorbeeld:
Proportie verklaarde variantie (R 2) geeft haan hoe goed het model de uitkomstvariabele kan
voorspellen. (SST = SSM + SSR) —> in voorbeeld hoe goed het aantal studeren het cijfer kan
voorspellen:
SSM 130,59
R2 = = 0,58
SST 224,306
In enkelvoudig lineair regressie model is F-test gelijk aan de t-test voor onafhankelijke variabele.
Aannames enkelvoudig lineair regressie model:
- Waarnemingen zijn onafhankelijk
- Residuen zijn normaal verdeeld
- De spreiding (variantie) van residuen is gelijk voor alle waarden van X (homoscedasticiteit)