Stap 1 : empirische specificatie,
hypothesen + data
Opdracht
In R :
loon.i<- lm(scholing_reg$loon
~scholing_reg$scholing +
scholing_reg$ervaring+
ervaring.square+
scholing_reg$ras+scholing_reg$regio+scholing_reg$woonplaats)
1) Variabelen
a. Scholing_reg$loon:
Eenheid = uurloon in dollarcent
b. Scholing_reg$scholing:
scholing.years<- lm(scholing ~ regio +
ras+afstand+woonplaats, data = scholing_reg)
scholing.years.2<- lm(scholing~ regio+ ras+ afstand+
woonplaats - 1 , data=scholing_reg)
Eenheid = aantal jaren scholing
c. Scholing_reg$ervaring
, Eenheid = aantal jaren ervaring
Ei= leeftijdi – Si − 6
Start op leeftijd 6 jaar
Data is geordend oplopend volgens aantal jaar ervaring
ervaring.square <- scholing_reg$ervaring^2 (We willen
kwadraat wegwerken0)
d. Dummies
Ras => 1 = blank; 0 = zwart
Regio => 1 = andere ; 0 = zuiden
Afstand => 1 = nabij ; 0 = afgelegen
Woonplaats => 1 = stad ; 0 = platteland
e. Afhankelijke en onafhankelijke variabelen voor loon.i
Afhankelijke variabele = loon
Onafhankelijke variabelen = scholing, ervaring, ras, regio en
woonplaats
f. Afhankelijke en onafhankelijke variabelen voor scholing.years
Afhankelijk variabele = scholing
Onafhankelijke variabelen = regio, ras, woonplaats en
afstand
Geen theoretische verwachtingen
Opm: scholing.years.2 heeft referentiekader = zwarte ras, uit
het zuiden, afgelegen en van het platteland ( = β1)
2) Interpretatie Coëfficiënten
β 1 =-520.088
is het intercept, wanneer alle variabelen gelijk aan nul zijn
hypothesen + data
Opdracht
In R :
loon.i<- lm(scholing_reg$loon
~scholing_reg$scholing +
scholing_reg$ervaring+
ervaring.square+
scholing_reg$ras+scholing_reg$regio+scholing_reg$woonplaats)
1) Variabelen
a. Scholing_reg$loon:
Eenheid = uurloon in dollarcent
b. Scholing_reg$scholing:
scholing.years<- lm(scholing ~ regio +
ras+afstand+woonplaats, data = scholing_reg)
scholing.years.2<- lm(scholing~ regio+ ras+ afstand+
woonplaats - 1 , data=scholing_reg)
Eenheid = aantal jaren scholing
c. Scholing_reg$ervaring
, Eenheid = aantal jaren ervaring
Ei= leeftijdi – Si − 6
Start op leeftijd 6 jaar
Data is geordend oplopend volgens aantal jaar ervaring
ervaring.square <- scholing_reg$ervaring^2 (We willen
kwadraat wegwerken0)
d. Dummies
Ras => 1 = blank; 0 = zwart
Regio => 1 = andere ; 0 = zuiden
Afstand => 1 = nabij ; 0 = afgelegen
Woonplaats => 1 = stad ; 0 = platteland
e. Afhankelijke en onafhankelijke variabelen voor loon.i
Afhankelijke variabele = loon
Onafhankelijke variabelen = scholing, ervaring, ras, regio en
woonplaats
f. Afhankelijke en onafhankelijke variabelen voor scholing.years
Afhankelijk variabele = scholing
Onafhankelijke variabelen = regio, ras, woonplaats en
afstand
Geen theoretische verwachtingen
Opm: scholing.years.2 heeft referentiekader = zwarte ras, uit
het zuiden, afgelegen en van het platteland ( = β1)
2) Interpretatie Coëfficiënten
β 1 =-520.088
is het intercept, wanneer alle variabelen gelijk aan nul zijn