-2 log-likelihood ratio → vergelijken modellen.
Ontplofte modellen: onstabiele modellen wegens een gebrek aan voldoen aan assumpties.
Logistisch regressiemodel SPSS: analyze → regression → binary logistic;
• Dependent = uitkomst & covariates = determinant(en).
• Indien (continue) determinant lineair → zo meenemen.
• Indien (continue) determinant niet lineair → categoriaal meenemen.
• Categorical → categoriale variabelen aangeven (indien 2+ groepen).
• Referentiegroep aangeven: first/last → change.
• Method: backward/forward LR (likelihood ratio).
• Options → CI for exp(B) + entry/removal en classification cutoff invullen.
Beoordelen kwaliteit modellen:
→ lineaire regressie = R-square / adjusted R-square.
→ logistische regressie = pseudo R-square (lastige interpretatie) → classificatietabel,
Hosmer-Lemeshow toets, ROC-curve.
Classificatietabel:
• Kruistabel die geobserveerde en voorspelde status tegen elkaar uit zet; o.b.v.
afkapwaarde en prevalentiegegevens.
• Persoon wordt geclassificeerd als uitkomst hebbende/niet uitkomst hebbende.
• Sommigen zullen correct/incorrect tot uitkomst hebbende/niet uitkomst hebbende
ingedeeld worden.
Eerste stap: maken van een predictiemodel, een classificatietabel kan mee opgevraagd
worden. Wel moet een afkapwaarde bepaald zijn; bepaalt welke cases wel/niet worden
meegenomen als uitkomst hebbende/niet uitkomst hebbende.
→ kans > afkapwaarde = wel uitkomst.
→ kan < afkapwaarde = niet uitkomst.
In hoeverre deze voorspelling overeenkomt met wat we observeren, bepaalt de kwaliteit van
het predictiemodel. De afkapwaarde wordt gebaseerd op prevalentiegegevens (van de
populatie dan wel uit de dataset). Bij PCO vaak 50/50 cases/controles. Prevalentiegegevens
uit de dataset kan je terugvinden in een frequentietabel.
SPSS:
• Door backwards selectie worden er een aantal ‘’steps’’ (modellen) beschreven;
laatste model is het best passend, hier wordt naar gekeken.
• Hier wordt de geobserveerde/voorspelde status beschreven (rij van links naar rechts
aflezen)
• Indien voorspeld als controle, maar is een patiënt → fout negatief.
• Indien voorspeld als patiënt, maar is een controle → fout positief.
• De laatste rij beschrijft het percentage correct voorspelde status.
• Percentage correct voorspelde cases → sensitiviteit.
• Percentage correct voorspelde controles → specificiteit.
• Er kan gekeken worden naar of de percentages verschillen onderling de modellen;
heeft het verwijderen van bepaalde variabelen de percentages
verbeterd/verslechterd.
• Of de percentages wel/niet goed zijn, hangt af van het beoogde doel; indien het doel
is zo goed mogelijk cases te voorspellen, wordt een hogere sensitiviteit beoogd.
Hosmer-Lemeshow toets: ‘’goodness of fit test’’
1
Ontplofte modellen: onstabiele modellen wegens een gebrek aan voldoen aan assumpties.
Logistisch regressiemodel SPSS: analyze → regression → binary logistic;
• Dependent = uitkomst & covariates = determinant(en).
• Indien (continue) determinant lineair → zo meenemen.
• Indien (continue) determinant niet lineair → categoriaal meenemen.
• Categorical → categoriale variabelen aangeven (indien 2+ groepen).
• Referentiegroep aangeven: first/last → change.
• Method: backward/forward LR (likelihood ratio).
• Options → CI for exp(B) + entry/removal en classification cutoff invullen.
Beoordelen kwaliteit modellen:
→ lineaire regressie = R-square / adjusted R-square.
→ logistische regressie = pseudo R-square (lastige interpretatie) → classificatietabel,
Hosmer-Lemeshow toets, ROC-curve.
Classificatietabel:
• Kruistabel die geobserveerde en voorspelde status tegen elkaar uit zet; o.b.v.
afkapwaarde en prevalentiegegevens.
• Persoon wordt geclassificeerd als uitkomst hebbende/niet uitkomst hebbende.
• Sommigen zullen correct/incorrect tot uitkomst hebbende/niet uitkomst hebbende
ingedeeld worden.
Eerste stap: maken van een predictiemodel, een classificatietabel kan mee opgevraagd
worden. Wel moet een afkapwaarde bepaald zijn; bepaalt welke cases wel/niet worden
meegenomen als uitkomst hebbende/niet uitkomst hebbende.
→ kans > afkapwaarde = wel uitkomst.
→ kan < afkapwaarde = niet uitkomst.
In hoeverre deze voorspelling overeenkomt met wat we observeren, bepaalt de kwaliteit van
het predictiemodel. De afkapwaarde wordt gebaseerd op prevalentiegegevens (van de
populatie dan wel uit de dataset). Bij PCO vaak 50/50 cases/controles. Prevalentiegegevens
uit de dataset kan je terugvinden in een frequentietabel.
SPSS:
• Door backwards selectie worden er een aantal ‘’steps’’ (modellen) beschreven;
laatste model is het best passend, hier wordt naar gekeken.
• Hier wordt de geobserveerde/voorspelde status beschreven (rij van links naar rechts
aflezen)
• Indien voorspeld als controle, maar is een patiënt → fout negatief.
• Indien voorspeld als patiënt, maar is een controle → fout positief.
• De laatste rij beschrijft het percentage correct voorspelde status.
• Percentage correct voorspelde cases → sensitiviteit.
• Percentage correct voorspelde controles → specificiteit.
• Er kan gekeken worden naar of de percentages verschillen onderling de modellen;
heeft het verwijderen van bepaalde variabelen de percentages
verbeterd/verslechterd.
• Of de percentages wel/niet goed zijn, hangt af van het beoogde doel; indien het doel
is zo goed mogelijk cases te voorspellen, wordt een hogere sensitiviteit beoogd.
Hosmer-Lemeshow toets: ‘’goodness of fit test’’
1