INHOUDSOPGAVE
Grasple lessen ............................................................................................................................. 2
MLR 1 – Controle assumpties ............................................................................................................ 2
MLR 2 – controle assumpties (statistisch) .......................................................................................... 5
MLR 3: MLR en hiërarchische MLR uitvoeren en interpreteren (frequentistisch en Bayesiaans) ............11
MLR 4: Multipele regressie met dummy's (frequentistisch) ................................................................13
Hoorcollege ................................................................................................................................ 15
Wat is multipele lineaire regressie? ..................................................................................................15
Bayesiaanse evaluatie .....................................................................................................................16
Assumpties van regressieanalyse ....................................................................................................16
Begrippenlijst .............................................................................................................................. 17
,GRASPLE LESSEN
MLR 1 – CONTROLE ASSUMPTIES
Assumptie 1: meetniveau ’s van variabelen
• Afhankelijke variabele een continue variabele moet zijn (interval of
ratio meetniveau).
• Onafhankelijke variabele(n) moet(en) continu (minimaal van
interval meetniveau) of dichotoom (nominaal met twee categorieën)
zijn.
Assumptie 2: Lineariteit
• Lineaire verbanden zijn tussen de afhankelijke variabele en
alle continue onafhankelijke variabelen.
• Gecheckt door scatterplots (spreidingsdiagrammen).
Scatterplot heeft (continue) onafhankelijke variabele op x-as + de
afhankelijke variabele op y-as à Er worden punten gebruikt om de
combinatie van x-y-scores voor elke observatie weer te geven.
Lineaire relatie = dat de scatterplot van de scores een ovale vorm heeft die
goed kan worden beschreven met een rechte (lineaire) lijn (d.w.z. geen
gebogen of s-vormige relatie).
Voorbeelden gebogen relatie en s-vormige relatie:
In bovenstaande scatterplots wordt er dus niet voldaan aan de assumptie
van lineariteit.
, Voor dichotoom variabel geldt NIET dat er een lineair verbad moet zijn
tussen afhankelijk en onafhankelijke variabele (e.g. Sekse en tevredenheid)
Assumptie 3: afwezigheid van uitschieters
Uitschieter = een observatie die sterk afwijkt van andere observaties.
• Dit kan op één variabele zijn
• Een combinatie van twee
• Op een combinatie van nog meer variabelen (dan is numerieke in
plaats van visuele inspectie gemakkelijker).
Hoe moet je met uitschieters omgaan?
Typefout (fout bij het invoeren van gegevens)à waarde corrigeren (als er
informatie beschikbaar is om dat te doen) of waarde verwijderen (omdat je
weet dat deze verkeerd is).
Heel belangrijk = transparantie over eventuele wijzigingen in de data (en de
reden daarvoor).
Wanneer je niet voldoet aan de assumpties:
Inzichtelijk gemaakt door het Kwartet van Anscombe (Anscombe, 1973) =
beschrijft vier datasets met dezelfde statistische eigenschappen. De
variabelen X en Y hebben in alle datasets hetzelfde gemiddelde en dezelfde
variantie. Ook is de correlatie en regressielijn voor alle datasets precies
gelijk.