1. DE REGRESSIELIJN
Criteriumvaria = variabele waarvoor voorspelling maken (afhankelijk)
bele
Predictorvaria = variabele obv waarvan voorspelling maken (onafhankelijk)
bele
1.1 WAT IS DE FORMULE VOOR DE REGRESSIELIJN?
1) Stellen samenhang tss 2 intervalvariabelen via spreidingsdiagram
(scatterplot)
2) Zoeken wiskundige formule vr rechte die beste tendens v/ samenhang in
spreidingsdiagram weergeeft
DUS regressieanalyse (welke rechte is best passende lijn vr puntenwolk?)
I. Welke rechte best passende lijn vr puntenwolk?
Vergelijking rechte: Y = a + bX
A = uitslag vr Y indien X = 0
B = welke wijze Y veranderen als X met 1 eenheid vermeerderd
II. Hoe goed regressielijn in staat om Y-waarde voorspellen op grond v/ X-
waarde
A = waar regressierechte Y-as snijdt
ALS + rechte snijdt Y-as boven nulpunt
ALS - rechte snijdt Y-as beneden nulpunt
B = info helling rechte
ALS + rechte loopt v/ linksonder nr rechtsboven + ⬆ X samen
met ⬆ Y
ALS - rechte loopt v/ linksboven nr rechtsonder + ⬆ X samen met
↓Y
B geeft verandering aan in Y ALS X ⬆ met 1 eenheid
Symmetrisch / niet-symmetrisch regressieanalyse !!
In gedragswet. Bijna nooit perfecte samenhang
Vb. samenhang IQ, schoolresultaten = lager dan 1 HIERDOOR
onnauwkeurigheden regressieanalyse aangeven hoe groot onnauwkeurigheid
in voorspelling
Formule 1 pg 284 = helings / richtings / regressie coefficient (slope)
Correlatie tss beide variabelen * verhouding tss beide standaarddeviaties
Standaarddeviatie criteriumvariabele = teller
Standaarddeviatie predictor = noemer
1
, Formule constante (intercept) waarde kan berekend worden door gem.
criteriumvariabele – product rekenkundig gem predictorvariabele,
richtingscoëfficiënt
ALS laatste formules ingepast in algemene formule Y = a + bX DAN regressielijn
via formule 2:
Minimaliseerd voorspellingsfouten DUS best passende lijn gezocht
DOOR gekwadrateerde afstanden tss feitelijke observaties +
regressielijn minimaliseren
= methode v/d kleinste kwadraten
ALS geen perfecte voorspelling kunnen maken algemene formule (pg 285)
Fout = residu: geeft aan dat voorspelling op grond v/ regressielijn beperkt
(v/ andere dingen ook afhankelijk)
Grootte residu geeft aanduiding v/ waarde regressielijn
Verdeling = normaalverdeling + gem. 0
Variantie geeft meer info over waarde regressiemodel
1.2 WAT IS DE WAARDE VAN DE REGRESSIELIJN?
Waarde = recht evenredig met Pearson-correlatie tss 2 variabelen
2 maten om kwaliteit voorspelling nagaan:
Determinantiecoeffici = geeft aan hvl % v/d variantie in criteriumvariabele
ent verklaard door verschillen in predictorvariabele
Berekenen kwadraat Pearson-correlatie
Vb. correlatie .40 tss IQ, schoolresultaten 16%
verschillen in schoolresultaten door verschillen in IQ
MAAR 84% v/ verschillen resultaat door andere
factoren
Standaardschattingsf Nagaan verschil tss feitelijke score
outen, standaardfout criteriumvariabele + verwachte score op grond
v/ estimatie regressielijn
DAARNA standaarddeviatie v/ fouten bepaald
= maat v/ onnauwkeurigheid
Normale verdeling 2/3 v/ gevallen =
fout kleiner dan
standaardschattingsfout
Omgekeerd evenredig met Pearson-
correlatie
Recht evenredig met standaarddeviatie
v/ Y-variabele
2. HOE KAN JE VIA SPSS EEN REGRESSIEANALYSE UITVOEREN?
3. DE MEERVOUDIGE REGRESSIETECHNIEK
2