Hoofdstuk 1: an overview of regression analysis
Econometrie: de kwantitatieve meting en analyse van de echte economie en business
fenomenen. Het gebruiken van data om causale effecten te meten.
Discrete random variabele: random variabele met een eindigend aantal uitkomsten
(telbaar).
Continuous random variabele: random variabele die elke numerieke waarde in een interval
of collectie van intervallen kan aannemen.
Probability density function (pfd): functie die de mogelijkheden van verschillende
uitkomsten bevat. Dit is hetzelfde als de marginale distributie van een random variabele:
Pr (X = xi) = Pr (X = xi, G = 0) + Pr (X = xj, G = 1) f (xi) = ∑
Conditional distribution: verdeling van een random variabele X met een conditie van een
specifieke waarde van een andere random variabele G. Dit is de ratio van de joint
distribution en de marginale distributie.
|
Variantie:
∑
Regels:
- Var (c) = 0
- Var (X + c) = Var (X) + Var (c) = Var (X)
- Var (cX) = c2 Var (X)
- Bij onafhankelijke random variabelen geldt:
Var (X1 + X2) = Var (X1) + Var (X2). Oftewel: Var (∑ Xj) = ∑ Var (Xj)
- Bij afhankelijke random variabelen geldt:
Var (X1 + X2) = Var (X1) + Var (X2) + 2 Cov (X1X2). Oftewel: Var (∑ Xj) = ∑∑ Cov (Xj, Xk)
Var (X1 - X2) = Var (X1) + Var (X2) - 2 Cov (X1X2).
Joint distribution of two discrete random variabelen: de kans dat de random variabelen
bepaalde waarden tegelijk aannemen Pr (X = xi, G = gj).
Independence: als de verdeling van de ene variabele geen invloed heeft op een bepaalde
uitkomst van de andere variabele.
- Joint distribution = product van marginale distributie
Pr (X = xi, G = gi) = Pr (X = xi) * Pr (G = gj).
- Conditional distribution = marginal distribution Pr (X = xi, G = gi) = Pr (X = xi)
- Cov (X, G) = Corr (X, G) = 0
Conditional expectations: | ∑ ( | )
- E (cX|G = 0) = cE (X|G=0)
- E (h(G) X|G = 0) = h(0) E (X|G = 0)
, Covariantie: meting van de lineaire relatie tussen X en G. Cov (X, G) = E (X – EX) (G – EG) = E
(XG) – E (X) E(G).
- Cov (X, c) = 0
- Cov (aX, bG) = ab Cov (X, G)
- Cov (X, X) = E (X – EX)2 = Var(X)
Correlatie: meting van de lineaire relatie tussen X en G. Corr (X, G) = (Cov (X, G)) / (sd (X) sd
(G))
Regressie analyse: het maken van kwantitatieve schattingen van economische relaties die
voorheen alleen theoretisch waren. Het verklaart veranderingen in een variabele.
Causaliteit: een regressie resultaat kan nooit causaliteit bewijzen. Als event A en B statistisch
gerelateerd zijn betekent dit niet dat het ene ook het andere veroorzaakt.
Error term: de variatie in de afhankelijke variabele (Y) wordt beïnvloed door meer dan alleen
de variatie in de onafhankelijke variabele (X). Dit komt door omitted variabelen, foute
metingen, niet correcte functionele vormen of random (iets waarvan de waarde niet volledig
wordt gepaald door kans) en niet voorspelbare redenen. Al deze niet te verklaren variatie
door het model komt in de error term. (Y^i – Yi).
Multivariate regressie: lineaire regressie met meer dan een onafhankelijke variabele.
Hierdoor kan je de impact op Y van een verandering in een variabele isoleren van de impact
op Y van de andere variabelen. Als een variabele niet is opgenomen in de regressie wordt
deze dus niet als constant gezien bij het bekijken van de impact van de variabele in het
model.
Estimated regression equation: de gekwantificeerde versie van de theoretische regressie
vergelijking. Deze wordt gehaald uit een sample van data voor echte X’s en Y’s.
Residual: het verschil tussen de geschatte waarde en de echte waarde van de afhankelijke
variabele (ei = Yi – Y^i).
Cross-sectional data: data waarbij alle observaties van hetzelfde punt in tijd zijn genomen en
individuele economische eenheden representeren van dat punt in tijd.
Hoofdstuk 2: Ordinary least squares
Ordinary least squares (OLS): regressie schatting techniek die de β^s zo berekend dat de som
van de gekwadrateerde residuals wordt geminimaliseerd:
̂ ̂
̂ ̂ ̂
̂
∑ ∑ ̂ ∑ ̂ ̂
Redenen om OLS te gebruiken:
- Het is makkelijk om te gebruiken.