Essentie cursus econometrie (2024-2025)
Tiago Boeynaems
Hoofdstuk 1: econometrie vs. beschrijvende statistiek
1. Soorten data
Cross-sectionele data: Gegevens verzameld op één moment in de tijd over
verschillende eenheden (bijvoorbeeld individuen, bedrijven).
Tijdreeksdata: Gegevens verzameld over een langere periode voor één of
meerdere eenheden (bijvoorbeeld de ontwikkeling van aandelenkoersen).
Panel (longitudinale) data: Een combinatie van cross-sectionele en
tijdreeksdata; gegevens verzameld over meerdere eenheden gedurende
meerdere tijdsperiodes.
2. Datageneratieproces (DGP)
Het datageneratieproces is een theoretisch concept in statistiek en
econometrie.
Het beschrijft hoe data tot stand komen en helpt bij het begrijpen en
modelleren van de onderliggende structuren.
Doel: Het DGP zo goed mogelijk benaderen om betrouwbare voorspellingen en
inzichten te verkrijgen.
3. Onafhankelijk en gelijk verdeeld (iid)
Een cruciale aanname in het DGP is dat variabelen onafhankelijk en gelijk
verdeeld zijn.
o Onafhankelijk: De waarde van één observatie beïnvloedt geen andere
observatie.
o Gelijk verdeeld: Alle observaties komen uit dezelfde verdeling.
Dit maakt het mogelijk om veel statistische methoden correct toe te passen.
Hierdoor zelfde gemiddelde en zelfde variantie
Y is ook normaal verdeeld! Hierdoor kunnen we zeggen dat steekproefschatter
ook normaal verdeeld is. En zo kan je dus aan hypothesettoetsen doen.
4. Kleinste kwadratenschatting
De methode van kleinste kwadraten kiest een schatter die de gekwadrateerde
verschillen tussen de geobserveerde waarden en de voorspelde waarden
minimaliseert.
Doel: De som van de gekwadrateerde fouten (residuen) zo klein mogelijk
maken.
Onder sterke assumpties kan het steekproefgemiddelde aanzien worden als
de beste locatieschatter in termen van kleinste gekwadrateerde
voorspellingsfouten.
5. Herhaling
Econometrie is inferentieel: wat is het effect van een variabele op een ander
een hoe maken we voorspellingen
1
,Essentie cursus econometrie (2024-2025)
Tiago Boeynaems
Hoofdstuk 2: hypothesetoetsen
1. Hypotheses over populatieparameters
Hypotheses worden altijd opgesteld voor populatieparameters.
We voeren hypothesetoetsen uit omdat we op basis van steekproeven geen
directe uitspraak over de populatie kunnen doen.
2. Steekproef en assumpties
Met steekproefdata kunnen we:
1. Assumpties maken over het populatie DGP (datageneratieproces).
2. De verdeling van de steekproefschatter bepalen.
3. Nulhypothese & alternatieve hypothese
Nulhypothese (H0): Wordt aangenomen tot bewijs het tegendeel aantoont.
Alternatieve hypothese (HA): Geeft de waarden waarvoor bewijs gezocht
wordt.
4. Type 1 en Type 2 fouten
Type 1 fout (false positive): H0 wordt verworpen terwijl het juist is.
Type 2 fout (false negative): H0 wordt niet verworpen terwijl het fout is.
5. T-statistiek voor een parameter
Hoe extreem is de waarde dat we bekomen?
Intutitieve manier om uit te drukken; hoeveel standaarddeviaties is deze
waarde weg van het gemiddelde? Hoe meer SD’s die weg ligt van het
gemiddelde, hoe extremer de kans dat we die hadden tegengekomen. En
daarom dat we standaardiseren.
6. Standaardiseren van kansvariabele
Door standaardisatie krijgt een kansvariabele:
o Een verwachte waarde van 0.
o Een standaarddeviatie van 1.
o Dit maakt het mogelijk om normaal verdeelde schattingen te
analyseren.
7. Verwerpingsgebieden
Verwerpingsgebieden worden bepaald op basis van het significantieniveau
(α).
Dit is de kans op een Type 1 fout. Hoe hoger alfa, hoe meer type 1 fouten je
toelaat.
8. Eenzijdige en tweezijdige toetsen
Eenzijdig: Toets of een parameter groter of kleiner is dan een hypothese-
waarde.
2
, Essentie cursus econometrie (2024-2025)
Tiago Boeynaems
Tweezijdig: Toets of een parameter verschilt van een hypothese-waarde.
Hier is er geen richting, je bent opzoek naar extreme gevallen maar niet per
se groot of klein.
9. P-waarde
Hoe kleiner de p-waarde, hoe meer bewijs tegen de nulhypothese (H0).
Verwerpen als de p-waarde kleiner is dan het significantieniveau (α).
P-waarde is de kans dat de teststatistiek extremer is dan de waargenomen
waarde, gegeven dat H0 waar is.
10. Betrouwbaarheidsintervallen
Een interval waarin de populatieparameter met een bepaalde mate van
zekerheid (1−α) ligt.
Als de hypothese-waarde buiten het interval ligt, wordt H0 verworpen.
3
Tiago Boeynaems
Hoofdstuk 1: econometrie vs. beschrijvende statistiek
1. Soorten data
Cross-sectionele data: Gegevens verzameld op één moment in de tijd over
verschillende eenheden (bijvoorbeeld individuen, bedrijven).
Tijdreeksdata: Gegevens verzameld over een langere periode voor één of
meerdere eenheden (bijvoorbeeld de ontwikkeling van aandelenkoersen).
Panel (longitudinale) data: Een combinatie van cross-sectionele en
tijdreeksdata; gegevens verzameld over meerdere eenheden gedurende
meerdere tijdsperiodes.
2. Datageneratieproces (DGP)
Het datageneratieproces is een theoretisch concept in statistiek en
econometrie.
Het beschrijft hoe data tot stand komen en helpt bij het begrijpen en
modelleren van de onderliggende structuren.
Doel: Het DGP zo goed mogelijk benaderen om betrouwbare voorspellingen en
inzichten te verkrijgen.
3. Onafhankelijk en gelijk verdeeld (iid)
Een cruciale aanname in het DGP is dat variabelen onafhankelijk en gelijk
verdeeld zijn.
o Onafhankelijk: De waarde van één observatie beïnvloedt geen andere
observatie.
o Gelijk verdeeld: Alle observaties komen uit dezelfde verdeling.
Dit maakt het mogelijk om veel statistische methoden correct toe te passen.
Hierdoor zelfde gemiddelde en zelfde variantie
Y is ook normaal verdeeld! Hierdoor kunnen we zeggen dat steekproefschatter
ook normaal verdeeld is. En zo kan je dus aan hypothesettoetsen doen.
4. Kleinste kwadratenschatting
De methode van kleinste kwadraten kiest een schatter die de gekwadrateerde
verschillen tussen de geobserveerde waarden en de voorspelde waarden
minimaliseert.
Doel: De som van de gekwadrateerde fouten (residuen) zo klein mogelijk
maken.
Onder sterke assumpties kan het steekproefgemiddelde aanzien worden als
de beste locatieschatter in termen van kleinste gekwadrateerde
voorspellingsfouten.
5. Herhaling
Econometrie is inferentieel: wat is het effect van een variabele op een ander
een hoe maken we voorspellingen
1
,Essentie cursus econometrie (2024-2025)
Tiago Boeynaems
Hoofdstuk 2: hypothesetoetsen
1. Hypotheses over populatieparameters
Hypotheses worden altijd opgesteld voor populatieparameters.
We voeren hypothesetoetsen uit omdat we op basis van steekproeven geen
directe uitspraak over de populatie kunnen doen.
2. Steekproef en assumpties
Met steekproefdata kunnen we:
1. Assumpties maken over het populatie DGP (datageneratieproces).
2. De verdeling van de steekproefschatter bepalen.
3. Nulhypothese & alternatieve hypothese
Nulhypothese (H0): Wordt aangenomen tot bewijs het tegendeel aantoont.
Alternatieve hypothese (HA): Geeft de waarden waarvoor bewijs gezocht
wordt.
4. Type 1 en Type 2 fouten
Type 1 fout (false positive): H0 wordt verworpen terwijl het juist is.
Type 2 fout (false negative): H0 wordt niet verworpen terwijl het fout is.
5. T-statistiek voor een parameter
Hoe extreem is de waarde dat we bekomen?
Intutitieve manier om uit te drukken; hoeveel standaarddeviaties is deze
waarde weg van het gemiddelde? Hoe meer SD’s die weg ligt van het
gemiddelde, hoe extremer de kans dat we die hadden tegengekomen. En
daarom dat we standaardiseren.
6. Standaardiseren van kansvariabele
Door standaardisatie krijgt een kansvariabele:
o Een verwachte waarde van 0.
o Een standaarddeviatie van 1.
o Dit maakt het mogelijk om normaal verdeelde schattingen te
analyseren.
7. Verwerpingsgebieden
Verwerpingsgebieden worden bepaald op basis van het significantieniveau
(α).
Dit is de kans op een Type 1 fout. Hoe hoger alfa, hoe meer type 1 fouten je
toelaat.
8. Eenzijdige en tweezijdige toetsen
Eenzijdig: Toets of een parameter groter of kleiner is dan een hypothese-
waarde.
2
, Essentie cursus econometrie (2024-2025)
Tiago Boeynaems
Tweezijdig: Toets of een parameter verschilt van een hypothese-waarde.
Hier is er geen richting, je bent opzoek naar extreme gevallen maar niet per
se groot of klein.
9. P-waarde
Hoe kleiner de p-waarde, hoe meer bewijs tegen de nulhypothese (H0).
Verwerpen als de p-waarde kleiner is dan het significantieniveau (α).
P-waarde is de kans dat de teststatistiek extremer is dan de waargenomen
waarde, gegeven dat H0 waar is.
10. Betrouwbaarheidsintervallen
Een interval waarin de populatieparameter met een bepaalde mate van
zekerheid (1−α) ligt.
Als de hypothese-waarde buiten het interval ligt, wordt H0 verworpen.
3