Statistiek 2 overzicht
Residuen
Dit is het marginale gemiddelde van (onconditioneel –
dus niet afhankelijk van waarde )
– De afstand van elk punt tot de lijn (het gemiddelde)
geeft de voorspelfout
= − y^ = residu
boven lijn = positieve
fout
Onder lijn= negatieve
fout
Beste regressielijn schatten via methode van kleinste
kwadraten (OLS) door fouten te minimaliseren:
– Minimaliseer de sum of squared errors
lineaire (enkelvoudige) regressievergelijking en geeft dus het verband tussen en
het gemiddelde van
is de spreiding van de -waarden rond de regressielijn
Conditioneel = afhankelijk van xen
Gegeven een -waarde hebben de scores van een verdeling met gemiddelde
( ) en constante SD >>> Aanname: normaleverdeling
Staat in ANOVA tabel : regression error
SD is wortel uit variantie
Residuen standaard error = s :
conditionele SD van gegeven
R Square: correlatie in het
kwadraat 2 = proportie verklaarde
variantie in
R: correlatie tussen en
𝑒 𝑦𝑦
𝜎
𝐸 𝑟 𝑦𝑟 𝑥 𝑦𝑦𝑦𝜎 𝑦 𝑥 𝑥 𝑦 𝑦 𝑥
, Relatie tussen 2 continue variabelen >
Gestandaardiseerde co ci nt = correlatie
– geldt alleen voor enkelvoudige regressie
= de stijging in (in SDs) als n eenheid
(SD) stijgt (en andersom)
= proportionele
afname in fouten
Zonder x
Met x
geeft de marginale variantie van
geeft de conditionele variantie van gegeven
2 is de proportionele afname van de fouten
= de proportionele afname van de variantie in
= de proportie verklaarde variantie door
de normale verdeling: =Ongeveer 95% van de scores binnen gemiddelde ± 1,96 SD
Hoe kleiner des te sterker is het bewijs
tegen de nulhypothese
( ) is de
SD van de
schatter
− 2 dfs
Gaat er vanuit dat fouten normaal verdeeld zijn
2 is tenminste gelijk aan de grootste 2-waarde in n van de afzonderlijke bivariate modellen
– De enkelvoudige 2-en zijn (meestal) niet samen gelijk aan de multipele 2: 2 2 , 1+ 2 , 2
𝑇𝑆𝑆𝑏
𝑟𝑆𝑆𝐸
𝑆𝐸
𝑛
𝑅
𝑏 𝑃 𝑦 𝑟 ëffi ë𝑥 éé 𝑦 𝑟 𝑦𝑥 𝑦 𝑥éé 𝑅 𝑅 ≠ 𝑟 𝑦 𝑥 𝑟 𝑦𝑥
Residuen
Dit is het marginale gemiddelde van (onconditioneel –
dus niet afhankelijk van waarde )
– De afstand van elk punt tot de lijn (het gemiddelde)
geeft de voorspelfout
= − y^ = residu
boven lijn = positieve
fout
Onder lijn= negatieve
fout
Beste regressielijn schatten via methode van kleinste
kwadraten (OLS) door fouten te minimaliseren:
– Minimaliseer de sum of squared errors
lineaire (enkelvoudige) regressievergelijking en geeft dus het verband tussen en
het gemiddelde van
is de spreiding van de -waarden rond de regressielijn
Conditioneel = afhankelijk van xen
Gegeven een -waarde hebben de scores van een verdeling met gemiddelde
( ) en constante SD >>> Aanname: normaleverdeling
Staat in ANOVA tabel : regression error
SD is wortel uit variantie
Residuen standaard error = s :
conditionele SD van gegeven
R Square: correlatie in het
kwadraat 2 = proportie verklaarde
variantie in
R: correlatie tussen en
𝑒 𝑦𝑦
𝜎
𝐸 𝑟 𝑦𝑟 𝑥 𝑦𝑦𝑦𝜎 𝑦 𝑥 𝑥 𝑦 𝑦 𝑥
, Relatie tussen 2 continue variabelen >
Gestandaardiseerde co ci nt = correlatie
– geldt alleen voor enkelvoudige regressie
= de stijging in (in SDs) als n eenheid
(SD) stijgt (en andersom)
= proportionele
afname in fouten
Zonder x
Met x
geeft de marginale variantie van
geeft de conditionele variantie van gegeven
2 is de proportionele afname van de fouten
= de proportionele afname van de variantie in
= de proportie verklaarde variantie door
de normale verdeling: =Ongeveer 95% van de scores binnen gemiddelde ± 1,96 SD
Hoe kleiner des te sterker is het bewijs
tegen de nulhypothese
( ) is de
SD van de
schatter
− 2 dfs
Gaat er vanuit dat fouten normaal verdeeld zijn
2 is tenminste gelijk aan de grootste 2-waarde in n van de afzonderlijke bivariate modellen
– De enkelvoudige 2-en zijn (meestal) niet samen gelijk aan de multipele 2: 2 2 , 1+ 2 , 2
𝑇𝑆𝑆𝑏
𝑟𝑆𝑆𝐸
𝑆𝐸
𝑛
𝑅
𝑏 𝑃 𝑦 𝑟 ëffi ë𝑥 éé 𝑦 𝑟 𝑦𝑥 𝑦 𝑥éé 𝑅 𝑅 ≠ 𝑟 𝑦 𝑥 𝑟 𝑦𝑥