MEERVOUDIGE LINEAIRE REGRESSIE
Voorbeeldvraag: Is – naast zwangerschapsduur – ook geslacht van de baby geassocieerd met
geboortegewicht
Start met grafische voorstelling Grouped scatterplot ➔ berust geobserveerd verschil op toeval of niet?
• STAP 1: cleanen
o Frequentietabel opvragen
• STAP 2: groepen maken, cases selecteren
o Recode into different – controle
o Data – select cases – if condition is satisfied – controle
• STAP 3: start met grafische voorstelling (indien mogelijk)
o Geeft al een visueel zicht op wat er aan de hand zou kunnen zijn
o Scatterplots
▪ Graphs
▪ Chart builder
▪ Scatterdot (eerste)
▪ X-as: duur zwangerschap
▪ Y-as: geboortegewicht
▪ Set color: geslacht kindpaste
o Elements – fit line at subgroups
▪ Properties: attach label to line wegLabel verwijderen
o Visualiseer de verschillende relaties ➔ geschatte regressierechten
o
• STAP 4: voorwaarde nagaan + evt dummyvariabelen aanmaken
o geslacht → categorische variabele ➔ VOORWAARDE: enkel code 0 of 1!
o Zie codeboek!!
o eventueel NOOD om eerst dummyvariabelen aan te maken
o Descriptive frequencies
o Transform
o Recode into different
▪ Nieuwe naam: jongen_RECODEDIFF
▪ Old & new
▪ Value 1 wordt value 1
▪ Value 2 wordt value 0
▪ Jongens blijven 1 want zo heet de variabele ➔ 1 is dan ja en 0 is dan nee
▪ Paste
▪ Controle descriptive frequencies
▪ Value labels (naamgeving aan codes)
▪ Formats (F8.0)
, • STAP 5: meervoudige lineaire regressie
o Analyze
o Regression
o Lineair regression
o Dependent = geboortegewicht
o Independent = duur zwangerschap + dummy van geslacht
o Statistics:
▪ Estimates
▪ Model fit
▪ Descriptives
▪ Colinearity diagnostics
o Paste
• STAP 6: verklarende variabelen centreren
o Hier: zwangerschapsduur + dummy van geslacht
o Descriptive frequencies
▪ Zoek gemiddelde zwangerschapsduur
o Transform
o Compute variable
o Target variable = drzw_centrering_prematuur
o Duur zwangerschap – gemiddelde (met punt ipv komma) (aftrekken van elkaar)
o Zelfde voor jongen_RECODEDIFF
o Descriptive frequencies
• STAP 6: meervoudige lineaire regressie met gecentreerde variabele
o ➔ alles centreren rond gemiddelde van verklarende variabele
o Analyze
o Regression
o Lineair regression
o Dependent = geboortegewicht
o Independent = zwangerschapsduur gecentreerd + dummy geslacht gecentreerd
o Statistics: estimates, confidence intervals, durbin-watson, model fit, descriptives,
o Paste
• Via formule kan je dan de gewichten bij andere zwangerschapsduren berekenen
o geschat geboortegewicht jongen (g) = 3273,475 + 180,770 × (zwangerschapsduur (w) −
39,04) + 146,696 × jongen
▪ jongen = 1
o geschat geboortegewicht (g) meisje = 3273,475 + 180,770 × (zwangerschapsduur (w) −
39,04) + 146,696 × meisje
▪ meisje = 0
o DUS: helling = (181g) MAAR intercept is verschillend (3273g voor meisje, 3444g voor
jongen)
o ZIE OUTPUT
• STAP 7: Scatterplot!
Voorbeeldvraag: Is – naast zwangerschapsduur – ook geslacht van de baby geassocieerd met
geboortegewicht
Start met grafische voorstelling Grouped scatterplot ➔ berust geobserveerd verschil op toeval of niet?
• STAP 1: cleanen
o Frequentietabel opvragen
• STAP 2: groepen maken, cases selecteren
o Recode into different – controle
o Data – select cases – if condition is satisfied – controle
• STAP 3: start met grafische voorstelling (indien mogelijk)
o Geeft al een visueel zicht op wat er aan de hand zou kunnen zijn
o Scatterplots
▪ Graphs
▪ Chart builder
▪ Scatterdot (eerste)
▪ X-as: duur zwangerschap
▪ Y-as: geboortegewicht
▪ Set color: geslacht kindpaste
o Elements – fit line at subgroups
▪ Properties: attach label to line wegLabel verwijderen
o Visualiseer de verschillende relaties ➔ geschatte regressierechten
o
• STAP 4: voorwaarde nagaan + evt dummyvariabelen aanmaken
o geslacht → categorische variabele ➔ VOORWAARDE: enkel code 0 of 1!
o Zie codeboek!!
o eventueel NOOD om eerst dummyvariabelen aan te maken
o Descriptive frequencies
o Transform
o Recode into different
▪ Nieuwe naam: jongen_RECODEDIFF
▪ Old & new
▪ Value 1 wordt value 1
▪ Value 2 wordt value 0
▪ Jongens blijven 1 want zo heet de variabele ➔ 1 is dan ja en 0 is dan nee
▪ Paste
▪ Controle descriptive frequencies
▪ Value labels (naamgeving aan codes)
▪ Formats (F8.0)
, • STAP 5: meervoudige lineaire regressie
o Analyze
o Regression
o Lineair regression
o Dependent = geboortegewicht
o Independent = duur zwangerschap + dummy van geslacht
o Statistics:
▪ Estimates
▪ Model fit
▪ Descriptives
▪ Colinearity diagnostics
o Paste
• STAP 6: verklarende variabelen centreren
o Hier: zwangerschapsduur + dummy van geslacht
o Descriptive frequencies
▪ Zoek gemiddelde zwangerschapsduur
o Transform
o Compute variable
o Target variable = drzw_centrering_prematuur
o Duur zwangerschap – gemiddelde (met punt ipv komma) (aftrekken van elkaar)
o Zelfde voor jongen_RECODEDIFF
o Descriptive frequencies
• STAP 6: meervoudige lineaire regressie met gecentreerde variabele
o ➔ alles centreren rond gemiddelde van verklarende variabele
o Analyze
o Regression
o Lineair regression
o Dependent = geboortegewicht
o Independent = zwangerschapsduur gecentreerd + dummy geslacht gecentreerd
o Statistics: estimates, confidence intervals, durbin-watson, model fit, descriptives,
o Paste
• Via formule kan je dan de gewichten bij andere zwangerschapsduren berekenen
o geschat geboortegewicht jongen (g) = 3273,475 + 180,770 × (zwangerschapsduur (w) −
39,04) + 146,696 × jongen
▪ jongen = 1
o geschat geboortegewicht (g) meisje = 3273,475 + 180,770 × (zwangerschapsduur (w) −
39,04) + 146,696 × meisje
▪ meisje = 0
o DUS: helling = (181g) MAAR intercept is verschillend (3273g voor meisje, 3444g voor
jongen)
o ZIE OUTPUT
• STAP 7: Scatterplot!