Referenties
Darlington, R. B., & Hayes, A. F. (2016). Regression analysis and linear models: Concepts,
applications, and implementation. Guilford Publications.
Field, A. (2017). Discovering statistics using IBM SPSS statistics. sage.
Inhoud
Darlington & Hayes:
- H1: Hele hoofdstuk
- H2: Hele hoofdstuk
- H3: 3.1, 3.2, 3.3.3
- H4: 4.1.2, 4.2, 4.3, 4.4, 4.7
- H5: 5.1
- H7: 7.3
- H8: 8.1, 8.3
- H9: Hele hoofdstuk
- H11: Hele hoofdstuk
- H13: Hele hoofdstuk
- H14: 14.3, 14.4.1, 14.4.4, 14.4.5
- H15: 15.3.1, 15.3.2, 15.3.3
- H16: Hele hoofdstuk
Field:
- H15: 15.1 t/m 15.3
- H16: Hele hoofdstuk
- H17: Hele hoofdstuk
1
,Darlington & Hayes
H1: Statistical control and linear models
1.1 Statistical control
Variabelen:
- Afhankelijk
- Onafhankelijk
- Covariaat = derde variabele
Onderzoeken van verbanden zonder je zorgen te maken over covariaties:
- t-test:
o Dichotome onafhankelijke variabele
o Twee categorieën
- ANOVA:
o Multicategoriale onafhankelijke variabele
o Meer dan twee categorieën
- Pearson/rank-order correlatie:
o Numerieke onafhankelijke variabele
o Continue dimensie
Methoden van controle van covariaties:
1. Willekeurige toewijzing van participanten aan de onafhankelijke variabele
2. Exclusion of cases = niet alle participanten in het onderzoek meenemen
3. Manipulatie van covariaties = trainen van participanten om bepaalde evaluatie
standaarden toe te passen
4. Andere types van randomization = willekeurige afhankelijke variabelen selecteren
5. Statistische controle = geen manipulatie nodig en geen data weggelaten
Methoden van experimentele controle:
- Nummer 1, 3 en 4 = niet exclusion of cases
- Nodig om de situatie te manipuleren op een bepaalde manier in plaats van observeren
Nadelen van statistische controle:
- Niet altijd duidelijk welke variabelen gecontroleerd moeten worden
- Covariaties moeten gemeten worden = verkeerde meting verkeerde controle
1.2 An overview of linear models
Lineare regressieanalyse:
- Lineair model = schatten van de afhankelijke variabele Y van een set predictor
variabelen/regressors X
2
, - Regressiecoëfficiënt/helling:
o b
o Bepalen hoeveel de vergelijking gebruikmaakt van waarden op een variabele
om de schatting van Y te produceren
Vereisten van de methode van het lineaire model:
1. Er moet een set participanten/units/cases zijn
2. Elke participant moet waarden/metingen hebben op twee of meer variabelen:
o Numeriek
o Dichotoom
o Multicategoriaal
3. Elke variabele moet gerepresenteerd worden door een enkele kolom met getallen
o 0 voor vrouw en 1 voor man bijvoorbeeld
4. Elke analyse moet ten minste één afhankelijke variabele hebben
o Er mogen meerdere onafhankelijke variabelen en covariaties zijn
5. De afhankelijke variabele moet numeriek zijn
o Leeftijd of inkomen bijvoorbeeld
6. Statistische gevolgtrekking van lineaire modellen vereist aanvullende assumpties
o Later beschreven (H4.1.2 en 16)
Lineaire modellen zijn flexibel:
1. Variabele kan een natuurlijk kenmerk van de participant zijn of een kenmerk dat
gemanipuleerd is in een experiment
2. Meerdere analyses uit dezelfde data nemen = ene keer is een variabele de afhankelijke
variabele, dan weer de onafhankelijke
3. Computer maakt geen onderscheid tussen onafhankelijke en afhankelijke variabelen
en covariaties
4. Elke onafhankelijke variabele of covariatie kan dichotoom, multicategoriaal of
numeriek zijn
5. Onafhankelijke variabelen en covariaties kunnen allemaal onderlinge correlatie
hebben
6. Onafhankelijke variabelen en covariaties kunnen interacteren om invloed te hebben
op de afhankelijke variabele
7. Lineaire regressie/model kunnen gemakkelijk uitgebreid worden naar curvilineaire
verbanden tussen variabelen
8. Assumpties voor statistische gevolgtrekking zijn niet heel erg gelimiteerd
Mathematische vergelijking/partialing:
- Automatisch proces door lineaire regressieanalyse
- Verder uitgelegd in H3
Betekenis X:
- xi = deviation score
3
, - Xi = raw score
- X (met streep erboven) = sample mean
- Var(X) = gemiddelde van de deviation scores in het kwadraat
- μ = populatiegemiddelde
- r = correlatiecoëfficiënt
- β en b = verschillend gebruikt door onderzoekers:
o Population regressie weight
o Goed opletten
o Beta
H2: The simple regression model
2.1 Scatterplots and conditional distributions
Scatterplot:
- Een figuur bestaande uit verschillende punten die over een diagram verdeeld zijn
- Je kan een rechte lijn trekken door middel van de gemiddelden
Conditionele distributie (conditional distribution):
- Verdeling van een aantal punten binnen een scatterplot
- Conditioneel gemiddelde (conditional mean) = het gemiddelde van een aantal punten
van een conditionele distributie
Intercept:
- De waarde van X of Y waar de lijn in aanraking komt met de X of Y-as
- Y-intercept:
o Waarde van Y als deze in aanraking komt met de Y-as
o Waarde van Y als X = 0
- Rechte lijn:
o Y = b + mX
o Y = b0 + b1X
- b0 = Y-intercept
- b1 = helling van de lijn
Residu/schattingserror (residual/error in estimate):
- e
- Y – Y-dakje (hat Y) = score – de geschatte score
- Het gemiddelde van de error is altijd 0
Som van de gekwadrateerde fouten (sum of squared errors/residuals/SSresidual):
- e2
- Meting van accuraatheid
- Formule
- Yi = waarde van Y
- Yi-dakje = schatting van de vergelijking
- N = grootte van de steekproef
4