HOOFDSTUK 1 ENKELVOUDIGE REGRESSIE ANALYSE
•What is econometrics? Combination of
▪ Mathematics
▪ Statistics
▪ Economics (economic theory)
➔ Influences from these 3 disciplines
•Econometrics can be treated very theoretically and technically (stressing mathematics and statistics)
or rather applied
▪ Econometrics is a technique to show or to reject (statistically significant) relations between
certain variables and to quantify this relationship.
▪ Graphically: drawing a curve in a scatter diagram ➔ HOWEVER: correlation does not
necessarily imply causality E.g. theory of the stork … (opzoeken)
▪ A decent underlying (economic) model is necessary to establish relevant relationsh
We gaan zoeken naar het beste economische model om bijvoorbeeld scatterplot gaan tekenen !
waarom gaan we dat doen ?
Om bijvoorbeeld voorspellingen te doen of gedrag te sturen door hoe hoog moeten wij vb de taks op
sigaretten zetten om de consumptie te gaan verminderen.
Of wat zijn de variabelen die de wisselkoers beïnvloeden ? en hoe gaat die wisselkoers dan zijn binnen
6 maanden bijvoorbeeld.
Wat valkuilen:
▪ ‘mechanical’ mimicking behaviour, without understanding what you are doing
▪ Correlation (or significant effect) does not imply causality
▪ Not relying on a decent underlying model
▪ Omitted variable bias
▪ Extreme observations (outliers)
, ▪ Not taking into account the data type (cross-section, time series, panel,...)
▪ Not taking into account the measurement level of dependent and independent variables
Omitted variable bias:
Correlaties die geen correlaties zijn en verbanden die eigenlijk geen nut hebben ! Gebruik een goed
onderliggend model anders kan je niets concluderen !
Andere zaken: cola verkoop en airco verkoop en kerstkaarten verkoop → negatief verband tussen cola
en kerstkaarten maar positief tussen airco en cola → hoe komt dit ? ja het seizoen natuurlijk !
Ook long kanker en roken → das een logisch verband
Omitted variables: meer asbakken dan zijn er meer mensen die roken dan is er hoger risico op
longkanker: roken is dan betere variabele dan aantal asbakken !
Reverse causality: gezondheid en inkomen (hoger inkomen is gezonder is niet helemaal waar !) Wil
zeggen wat je verwacht van verband in 2 richtingen kan gaan → gezondere mensen hebben hoger
inkomen (positief verband) want als je gezond bent ga je meer werken maar kan ook andersom,
mensen met een hoger inkomen zijn gezonder want ze geven meer uit aan gezondheidzorg (je kan dus
in twee richtingen een verband zien).
Extreme observaties: outliers, voorbeeld estimation of the relationship between number of hospital
days and total cost of a hospital
,Je ziet in die grafiek dat er een outlier is die die rode lijn scheef trekt, als die eruit is genomen dan krijg
je de groene lijn wat een veel betere regressie lijn !s !
Extreme observation: estimation of a consumption function:
Je kan dat in een formule gieten: y is totale kost = gelijk aan intercept + rico * aantal dagen !
Dan zie je dat groen en rood wel een ferm verschil geeft !
Intercept zie later voor de interpretatie ja is snijpunt met de as (ik denk y as maar komt later nog aan
bod !
Wat dus op je paper minpunten zou kunnen geven is als je de outliers erin laat !
Regressie lijn:
, Die regressielijn geldt voor het gemiddelde, gemiddeld gezien zal de hoogte van die kinderen stijgen
naarmate ze ouder worden, die regressielijn geldt dus eigenlijk puur voor het gemiddelde kind, het
verband is gemiddeld gezien, er zijn kinderen van 10 jaar die veel groter zijn dan kinderen van 11. En
nog wat voorbeelden met gewicht en lengte en uitgave en inkomen !
Schatten van een consumptiefunctie: