Multipele regressieanalyse
1. Analyze
2. Regression
3. Lineair
4. Afhankelijke en onafhankelijke in de vakjes zetten
5. Assumpties controleren
a. Afwezigheid uitschieters:
Save: standardized residuals, mahalanobis en cook’s distances
b. Afwezigheid multicullineariteit
Statistics: collineairity diagnostics
c. Homoscedasticiteit:
Plots: *ZPRED (gestandaardiseerde predictoren) op X as en *ZRESID
(gestandaardiseerde residuen) op de Y as
d. Normaal verdeeld:
Plots: histogram
Voorwaarde multipele regressie
1. Meetniveau van minimaal interval:
• De afhankelijke variabele moet van minimaal interval meetniveau zijn
• De onafhankelijke variabele moet van minimaal interval meetniveau of dichotoom of
(nominaal met twee categorieën) of dummy’s zijn.
2. Lineaire verbanden tussen de afhankelijke variabele en alle onafhankelijke variabelen:
Twee spreidingsdiagrammen maken met een andere onafhankelijke variabele op de X as:
a. Graphs
b. Legacy Dialogs
c. Scatter/dot
d. Dubbelklik naar elements
e. Fit line aanklikken
3. Afwezigheid uitschieters
a. Kijken in de figuur of je uitschieten ziet
b. Verwijder de uitschieter uit de dataset
, R² van .060 naar .087, dus het verband wordt sterker na het verwijderen
4. Afwezigheid uitschieters:
a. Tabel residuals statistics:
• Standardized residuals (uitschieters in Y ruimte): tussen -3.3 en +3.3
• Mahalanobis distance: (uitschieters in X ruimte): lager dan 10 + 2 x onafhankelijk
variabelen
• Cook’s distance: (uitschieters in XY ruimte): lager dan 1
5. Afwezigheid multicollineariteit
a. Tabel coefficients
• Tolerance kleiner dan .2 duiden op een mogelijk probleem
• Tolerance kleiner dan .1 duiden op een probleem
• VIF groter dan 10 duiden op een probleem
6. Homoscedasticiteit
a. Scatter plot maken
b. Spreiding van residuen per x waarde ongeveer gelijk
7. Normaal verdeelde residuen
a. Histogram
b. Kijken of de afwijkingen niet te groot zijn