Inhoudsopgave
1 Model specificatie ................................................................................................................ 2
1.1 Eerst de theorie ..................................................................................................................... 2
1.2 Klassieke enkelvoudige lineaire regressie ............................................................................. 2
1.3 Interpretatie van de parameters ........................................................................................... 3
1.4 Non-lineaire relaties .............................................................................................................. 3
1.5 Assumpties ............................................................................................................................ 4
2 Schat parameters in het model ............................................................................................. 4
2.1 Populatie versus geschat model ............................................................................................ 4
2.2 Kleinste kwadraten (𝑏0, 𝑏1) principe en standaardfout (𝑠) .................................................. 4
2.3 Random variabele (𝐵𝑖) .......................................................................................................... 5
2.4 Gauss Markov theorema ....................................................................................................... 5
2.5 Betrouwbaarheidsinterval voor 𝛽𝑖 ........................................................................................ 5
2.6 Hypothesetoetsen voor 𝛽𝑖 .................................................................................................... 6
3 Goodness of fit .................................................................................................................... 7
3.1 Goodness of fit maatstaven................................................................................................... 7
3.2 Decompositie van de variantie .............................................................................................. 7
3.3 R2 = determinatiecoëfficiënt ................................................................................................ 8
3.4 Mean squares ........................................................................................................................ 8
3.5 ANOVA F-toets: nagaan of model zinvol is............................................................................ 8
4 Check de assumpties op basis van de data ............................................................................ 9
4.1 Klassieke assumpties ............................................................................................................. 9
4.2 Enkele diagnostieken ............................................................................................................. 9
HERHALING: ENKELVOUDIGE LINEAIRE REGRESSIE 1 van 10
, HERHALING: Enkelvoudige lineaire regressie
- Illustratie:
• DOEL: Modelleer het effect van een onafhankelijke variabele 𝑋 op de afhankelijke variabele 𝑌
• VOORBEELD: Hamburger chain
o Populatie: restaurants van een hamburgerketen in verschillende steden
o Onderzoeksvraag: Welk effect heeft de prijs van de producten op de sales
o Afhankelijke variabele: maandelijkse verkopen in een stad (in $1.000)
o Onafhankelijke variabele: ‘gemiddelde’ prijs van alle producten (in $)
- Verschillende stappen:
1 Model specificatie: Suggereer een theoretisch model voor de populatie gebaseerd op de
kennis van een ‘expert’ (bv. literatuur)
dit houdt in dat er assumpties gemaakt worden die gecontroleerd worden
2 Schat parameters in het model:
• Fit het model op basis van de data
• Voer hypothese toetsen uit
3 Goodness of fit: Levert het theoretische model een goede fit op voor de data
4 Check de assumpties op basis van de data: Dit kan leiden tot een aangepaste model
specificatie
1 Model specificatie
1.1 Eerst de theorie
- Wat vertelt/vertellen de literatuur/experten over de relatie tussen 𝑋 en 𝑌?
VOORBEELD: Hamburger chain
= niet eenduidig
• als een prijsverlaging slechts leidt tot een kleine toename van de verkopen, zullen de
verkoopopbrengsten dalen (𝑃 ↘ 𝑇𝑂 ↘)
de vraag is prijsinelastisch
• als een prijsverlaging leidt tot een grote toename van de verkopen, zal dit leiden tot een
toename van de omzet (𝑃 ↘ 𝑇𝑂 ↗)
de vraag is prijselastisch
1.2 Klassieke enkelvoudige lineaire regressie
- Modelleer de relatie tussen 𝑋 en 𝑌 met een lineaire functie:
𝑌 = 𝛽0 + 𝛽1 𝑥 + 𝜀 met 𝜀 ~ 𝑁(0, 𝜎)
standaardfout van het model
VOORBEELD: Hamburger chain
Rode recht met vergelijking: 𝑦 = 122 − 8𝑥
HERHALING: ENKELVOUDIGE LINEAIRE REGRESSIE 2 van 10
1 Model specificatie ................................................................................................................ 2
1.1 Eerst de theorie ..................................................................................................................... 2
1.2 Klassieke enkelvoudige lineaire regressie ............................................................................. 2
1.3 Interpretatie van de parameters ........................................................................................... 3
1.4 Non-lineaire relaties .............................................................................................................. 3
1.5 Assumpties ............................................................................................................................ 4
2 Schat parameters in het model ............................................................................................. 4
2.1 Populatie versus geschat model ............................................................................................ 4
2.2 Kleinste kwadraten (𝑏0, 𝑏1) principe en standaardfout (𝑠) .................................................. 4
2.3 Random variabele (𝐵𝑖) .......................................................................................................... 5
2.4 Gauss Markov theorema ....................................................................................................... 5
2.5 Betrouwbaarheidsinterval voor 𝛽𝑖 ........................................................................................ 5
2.6 Hypothesetoetsen voor 𝛽𝑖 .................................................................................................... 6
3 Goodness of fit .................................................................................................................... 7
3.1 Goodness of fit maatstaven................................................................................................... 7
3.2 Decompositie van de variantie .............................................................................................. 7
3.3 R2 = determinatiecoëfficiënt ................................................................................................ 8
3.4 Mean squares ........................................................................................................................ 8
3.5 ANOVA F-toets: nagaan of model zinvol is............................................................................ 8
4 Check de assumpties op basis van de data ............................................................................ 9
4.1 Klassieke assumpties ............................................................................................................. 9
4.2 Enkele diagnostieken ............................................................................................................. 9
HERHALING: ENKELVOUDIGE LINEAIRE REGRESSIE 1 van 10
, HERHALING: Enkelvoudige lineaire regressie
- Illustratie:
• DOEL: Modelleer het effect van een onafhankelijke variabele 𝑋 op de afhankelijke variabele 𝑌
• VOORBEELD: Hamburger chain
o Populatie: restaurants van een hamburgerketen in verschillende steden
o Onderzoeksvraag: Welk effect heeft de prijs van de producten op de sales
o Afhankelijke variabele: maandelijkse verkopen in een stad (in $1.000)
o Onafhankelijke variabele: ‘gemiddelde’ prijs van alle producten (in $)
- Verschillende stappen:
1 Model specificatie: Suggereer een theoretisch model voor de populatie gebaseerd op de
kennis van een ‘expert’ (bv. literatuur)
dit houdt in dat er assumpties gemaakt worden die gecontroleerd worden
2 Schat parameters in het model:
• Fit het model op basis van de data
• Voer hypothese toetsen uit
3 Goodness of fit: Levert het theoretische model een goede fit op voor de data
4 Check de assumpties op basis van de data: Dit kan leiden tot een aangepaste model
specificatie
1 Model specificatie
1.1 Eerst de theorie
- Wat vertelt/vertellen de literatuur/experten over de relatie tussen 𝑋 en 𝑌?
VOORBEELD: Hamburger chain
= niet eenduidig
• als een prijsverlaging slechts leidt tot een kleine toename van de verkopen, zullen de
verkoopopbrengsten dalen (𝑃 ↘ 𝑇𝑂 ↘)
de vraag is prijsinelastisch
• als een prijsverlaging leidt tot een grote toename van de verkopen, zal dit leiden tot een
toename van de omzet (𝑃 ↘ 𝑇𝑂 ↗)
de vraag is prijselastisch
1.2 Klassieke enkelvoudige lineaire regressie
- Modelleer de relatie tussen 𝑋 en 𝑌 met een lineaire functie:
𝑌 = 𝛽0 + 𝛽1 𝑥 + 𝜀 met 𝜀 ~ 𝑁(0, 𝜎)
standaardfout van het model
VOORBEELD: Hamburger chain
Rode recht met vergelijking: 𝑦 = 122 − 8𝑥
HERHALING: ENKELVOUDIGE LINEAIRE REGRESSIE 2 van 10