Oplossingen oefeningen
logistische regressie:
Bij logistische regressie ga je een aanwezigheid of een afwezigheid van een kenmerk nagaan dus de
0,1 succes of mislukking
Voorwaarden: geen, er zijn geen werkhypothesen (het enige wat er is, de afhankelijk moet een
dummy zijn dus een binaire variabele)
Oefening 1
file: conflict
Belangrijk voor later de interpretatie is wat is onze succes en wat is onze mislukking?
1: ja, er is een conflict (succes)
0: nee, er is geen conflict
Endogene veranderlijke = conflict
Exogene veranderlijke = Gdcap, growth, poli
1) Het gemiddelde groeipercentage, het BBP en het regime zijn nu de exogene variabelen, gebruikt
om de kans te schatten dat er in een land een conflict zal ontstaan.
Analyze regression binary logistic
Dependent: ‘conflict’ (dummy is de endogene variabele)
Independent: ‘gdcap’, ‘growth’, ‘poli’ (dit zijn de covariaten)
Klik bij save op ‘probabilities’ (de kans om in een bepaalde groep te komen)
Klik bij options op ‘Hosmer-lemeshow goodness-of-fit’, ‘include constant in model’
Zolang dat de kans bij ‘probablities’ kleiner is dan 0,5 zal de groupmembership = 0; is de kans groter
dan 0,5 dan wordt het bij succes gerekend dus kom je in de groep 1 terecht
Hosmer-lemeshow goodness-of-fit’ je gaat hierbij nagaan of het model goed past bij de gegevens,
je gaat nagaan of er een verschil is tussen de voorspellingen en de waarnemingen en als de
verschillen klein zijn dan is het een goed passend model
Van de 405 waarnemingen hebben we er maar 170 over dus we hebben 235 missing values
1
, Nogmaals nakijken wat succes (ja er is een conflict) en mislukking (nee er is geen conflict) is.
Bij logistische regressie moeten we naar verschillende zaken kijken om te weten dat we een goed
passend model hebben. We beginnen bij block 0.
We moeten kijken naar Block 0: dit is enkel een constante in het model en we gaan classificeren. We
hebben 154 keer ‘neen’ waargenomen en ‘neen’ voorspeld. We hebben 16 keer ‘ja’ waargenomen
en ‘neen’ voorspeld dus totaal percentage van 90,6 correcte voorspellingen.
Vervolgens block 1:
3 vrijheidsgraden omdat we drie onafhankelijke veranderlijk opgenomen hebben in het model. Chi-
square is significant! Dus minstens 1 significante beta.
Interpreteren als gewone R² met gelimiteerd tussen 0 en 1 maar doorgaans waarden veel lager dan
gewone regressie determinatiecoëfficiënten.
2
logistische regressie:
Bij logistische regressie ga je een aanwezigheid of een afwezigheid van een kenmerk nagaan dus de
0,1 succes of mislukking
Voorwaarden: geen, er zijn geen werkhypothesen (het enige wat er is, de afhankelijk moet een
dummy zijn dus een binaire variabele)
Oefening 1
file: conflict
Belangrijk voor later de interpretatie is wat is onze succes en wat is onze mislukking?
1: ja, er is een conflict (succes)
0: nee, er is geen conflict
Endogene veranderlijke = conflict
Exogene veranderlijke = Gdcap, growth, poli
1) Het gemiddelde groeipercentage, het BBP en het regime zijn nu de exogene variabelen, gebruikt
om de kans te schatten dat er in een land een conflict zal ontstaan.
Analyze regression binary logistic
Dependent: ‘conflict’ (dummy is de endogene variabele)
Independent: ‘gdcap’, ‘growth’, ‘poli’ (dit zijn de covariaten)
Klik bij save op ‘probabilities’ (de kans om in een bepaalde groep te komen)
Klik bij options op ‘Hosmer-lemeshow goodness-of-fit’, ‘include constant in model’
Zolang dat de kans bij ‘probablities’ kleiner is dan 0,5 zal de groupmembership = 0; is de kans groter
dan 0,5 dan wordt het bij succes gerekend dus kom je in de groep 1 terecht
Hosmer-lemeshow goodness-of-fit’ je gaat hierbij nagaan of het model goed past bij de gegevens,
je gaat nagaan of er een verschil is tussen de voorspellingen en de waarnemingen en als de
verschillen klein zijn dan is het een goed passend model
Van de 405 waarnemingen hebben we er maar 170 over dus we hebben 235 missing values
1
, Nogmaals nakijken wat succes (ja er is een conflict) en mislukking (nee er is geen conflict) is.
Bij logistische regressie moeten we naar verschillende zaken kijken om te weten dat we een goed
passend model hebben. We beginnen bij block 0.
We moeten kijken naar Block 0: dit is enkel een constante in het model en we gaan classificeren. We
hebben 154 keer ‘neen’ waargenomen en ‘neen’ voorspeld. We hebben 16 keer ‘ja’ waargenomen
en ‘neen’ voorspeld dus totaal percentage van 90,6 correcte voorspellingen.
Vervolgens block 1:
3 vrijheidsgraden omdat we drie onafhankelijke veranderlijk opgenomen hebben in het model. Chi-
square is significant! Dus minstens 1 significante beta.
Interpreteren als gewone R² met gelimiteerd tussen 0 en 1 maar doorgaans waarden veel lager dan
gewone regressie determinatiecoëfficiënten.
2