MRA wordt gebruikt bij meerdere interval voorspellers, die een intervalding voorspelt.
Calculate the Pearson correlations:
Analyze -> correlate -> bivariate -> pearson aanvinken
- Aflezen goede voorspeller: als er sprake van een hoge correlatie is, geeft dit aan een
goede predictor te zijn
Lineaire regressie op alle predictoren:
- ANALYZE -> Regression -> lineair. Dependent var Y. Independent var Xi.
- Vraag om: Statistics: part en partial correlations & collinearity diagnostics &
model fit
Save : cook’s distances & leverage values
Lineaire regressie op significante predictoren :
ANALYZE -> Regression -> linear. Dependent var Y. Sig Independent var Xi
Vraag om: Statistics -> model fit & part en partial corr. & collinearity diagnostics
Save -> Unstandardised en standardized residuals
Plots -> Y = ZPRED, X = ZRESID, aanvinken: Normal probability
plots
- Verwerpen 0-hypothese: Kijk significantie Anova tabel.
F(dfreg, dfresidual) = getal, p = getal
- Totaal verklaarde variantie: SSmodel/SStotaal. Ook aflezen Model Summary: Rsquare
- Uniek verklaarde variantie: SSspecifiek/SStotaal. Ook te berekenen Coefficients:
partCorrelations in het kwadraat
- Multicollineariteit in de predictoren: De maten waarin de variabele onderling
gecorreleerd zijn. Wanneer dit te hoog is, is er sprake van multicollineariteit. Aflezen
Coefficients tabel, Colinearity Stat: Wanneer tolerance < 0,10 OF VIF > 10, is bewijs
voor multicollinearity
- Uitbijters op een set: Cooks distances/ Leverage values
o Cooks distance moet kleiner zijn dan 1. Wanneer groter, sprake van
invloedbare uitbijters
o Leverage value max moet kleiner zijn dan 3(k+1)/n, anders sprake van
uitbijters
o Residuals: binnen -3 en 3, anders sprake van uitbijters.
Verwijderen uitbijter: sorteer dataset op hierboven benoemde punten, bij data
toevoegen aan dataset. Verzin een criterium waardoor ze er buiten vallen.
- Data -> select cases -> if condition is satisfied
- Non-lineariteit, heteroscedasticiteit, normaliteit van residuen
o Non-lineariteit: een bocht in de punten van de plot
o Homoscedasticiteit: gelijk bredige band
o Normaliteit residuen: de punten moeten zo veel mogelijk op de schuine lijn bij
normal P-P plot.
- Regressievergelijking aflezen: Coefficients tabel: Y= (constantB) + X1B*X1 +
X2B*X2 + …
, Voorspeller toevoegen in het 2de blok:
Analyze -> Regression -> Linear -> Dependent var : Y, Indep var : A & B, next C.
Vraag aan: Statistics: R squared change
- Verklaarde variantie van blok 1 en 2 aflezen: Model Summary Tabel, R square model
van 2
- Uniek verklaarde variantie blok 2: Model Summary Tabel, R square change van model
2
- Significante verbetering t.o.v. eerste model: Model Summary Tabel, aflezen sig F.
change: F change(dfmodel 2, dferror) = getal, p = getal.