LOGISTISCHE REGRESSIE
Voorbeeldvraag:
• Gegeven: Pasgeboren met laag geboortegewicht (<2500g) hebben vaak meer zorg nodig dan
andere pasgeborenen.
• Vraag: Is zwangerschapsduur geassocieerd met laag geboortegewicht?
• ➔ kans op laag geboortegewicht?
dichotome uitkomstvariabele = laag geboortegewicht
we moeten opletten want dichotome variabele kan enkel waarde 0 en 1 aannemen
Outcome = continue variabele MAAR kans van 0 tot 1; dus werken met relatieve kans → ODDS (gaat
van 0 tot oneindig) → nood aan transformatie → natuurlijk logaritme van de odds (of logit)
• Kans op laag gewicht delen door kans op geen laag gewicht ➔ odds
• Odds is niet hetzelfde als kans
Logistische regressie:
• STAP 1: cleanen
• STAP 2: aanmaken van dichotome variabele
o Transform
o Recode into different
o Gebgw → gebgw_LAAG
o Old & new values
▪ Range, lowest through value 2499 ➔ value 1
▪ All other values ➔ value 0
o Controle via summarize cases
▪ Analyze
▪ Reports
▪ Case summaries
▪ Variables = gebgw
▪ Grouping variable = gebgw_laag
▪ Limit cases to first uitzetten
▪ Paste
▪ Zie output: zo zie je dat hier code 0 = hoog geboortegewicht en 1 = laag
o Variable labels gebgw_LAAG ‘laag geboortegewicht (<2500g)’.
o Value labels gebgw_LAAG 0 ‘geen laag geboortegewicht (>=2500g)’ 1 ‘laag
geboortewicht (<2500g)’.
o Formats gebgw_LAAG (F8.0).
o Variable level gebgw_LAAG (NOMINAL).
o Controle descriptive frequencies
• STAP 3: we gaan een nieuwe dataset aanmaken voor de grafische voorstelling
o Data
o Aggregate
▪ We gaan ervoor zorgen dat het laag geboortegewicht opgesteld wordt adhv
zwangerschapsduur
o Break variable = zwangerschapsduur
o Aggregated variable = gebgw_LAAG
o Number of cases aanzetten
o Save: create a new dataset containing only the aggregated variables
o Dataset name geven: logistische_FIGUUR
o Options for very large datasets: sort file before aggregating
, o Paste
o Nieuwe dataset nog eens opslaan!
o
▪ 3 kindjes met zwangerschapsduur 25 weken en gewicht code 1
▪ MAAR wat met de getallen tussen 1 en 0? ➔ dit omdat er zowel kindjes met
gewicht code 1 als code 2 zijn voor dat aantal weken zwangerschap
▪ Aan de hand hiervan kan je mooie figuur opstellen
o Variabele gebgw_LAAG_mean wordt automatisch aangemaakt
o Variable label gebgw_LAAG_mean ‘geobserveerde proportie laag geboortegewicht
(<2500g).
• STAP 4: grafiek aanmaken met nieuwe dataset
o Graphs
o Legacy dialogs
o Scatter
o Simple
o X-as = zwangerschapsduur
o Y-as = gebgw_LAAg
o Paste
o Elements: fit line at total ➔ properties: loess fit method
o
• STAP 5: logistische regressie
o We gaan terug naar de originele dataset
o Nu gaan we te werk met odds
o Analyze
o Regression
o Binary logistic
o Dependent = laag geboortegewicht
Voorbeeldvraag:
• Gegeven: Pasgeboren met laag geboortegewicht (<2500g) hebben vaak meer zorg nodig dan
andere pasgeborenen.
• Vraag: Is zwangerschapsduur geassocieerd met laag geboortegewicht?
• ➔ kans op laag geboortegewicht?
dichotome uitkomstvariabele = laag geboortegewicht
we moeten opletten want dichotome variabele kan enkel waarde 0 en 1 aannemen
Outcome = continue variabele MAAR kans van 0 tot 1; dus werken met relatieve kans → ODDS (gaat
van 0 tot oneindig) → nood aan transformatie → natuurlijk logaritme van de odds (of logit)
• Kans op laag gewicht delen door kans op geen laag gewicht ➔ odds
• Odds is niet hetzelfde als kans
Logistische regressie:
• STAP 1: cleanen
• STAP 2: aanmaken van dichotome variabele
o Transform
o Recode into different
o Gebgw → gebgw_LAAG
o Old & new values
▪ Range, lowest through value 2499 ➔ value 1
▪ All other values ➔ value 0
o Controle via summarize cases
▪ Analyze
▪ Reports
▪ Case summaries
▪ Variables = gebgw
▪ Grouping variable = gebgw_laag
▪ Limit cases to first uitzetten
▪ Paste
▪ Zie output: zo zie je dat hier code 0 = hoog geboortegewicht en 1 = laag
o Variable labels gebgw_LAAG ‘laag geboortegewicht (<2500g)’.
o Value labels gebgw_LAAG 0 ‘geen laag geboortegewicht (>=2500g)’ 1 ‘laag
geboortewicht (<2500g)’.
o Formats gebgw_LAAG (F8.0).
o Variable level gebgw_LAAG (NOMINAL).
o Controle descriptive frequencies
• STAP 3: we gaan een nieuwe dataset aanmaken voor de grafische voorstelling
o Data
o Aggregate
▪ We gaan ervoor zorgen dat het laag geboortegewicht opgesteld wordt adhv
zwangerschapsduur
o Break variable = zwangerschapsduur
o Aggregated variable = gebgw_LAAG
o Number of cases aanzetten
o Save: create a new dataset containing only the aggregated variables
o Dataset name geven: logistische_FIGUUR
o Options for very large datasets: sort file before aggregating
, o Paste
o Nieuwe dataset nog eens opslaan!
o
▪ 3 kindjes met zwangerschapsduur 25 weken en gewicht code 1
▪ MAAR wat met de getallen tussen 1 en 0? ➔ dit omdat er zowel kindjes met
gewicht code 1 als code 2 zijn voor dat aantal weken zwangerschap
▪ Aan de hand hiervan kan je mooie figuur opstellen
o Variabele gebgw_LAAG_mean wordt automatisch aangemaakt
o Variable label gebgw_LAAG_mean ‘geobserveerde proportie laag geboortegewicht
(<2500g).
• STAP 4: grafiek aanmaken met nieuwe dataset
o Graphs
o Legacy dialogs
o Scatter
o Simple
o X-as = zwangerschapsduur
o Y-as = gebgw_LAAg
o Paste
o Elements: fit line at total ➔ properties: loess fit method
o
• STAP 5: logistische regressie
o We gaan terug naar de originele dataset
o Nu gaan we te werk met odds
o Analyze
o Regression
o Binary logistic
o Dependent = laag geboortegewicht