Correlationeel
H2
Correlatie → maatstaf van richting van een lineair verband tussen twee interval/ ratio
variabelen
Betrouwbaarheid → consistentie
- Test-hertest betrouwbaarheid
- Interbeoordelaarsbetrouwbaarheid
- Interne betrouwbaarheid (hangen de constructen uit het meetinstrument met elkaar
samen en meten ze hetzelfde?)
Validiteit → accuraatheid
- Convergente validiteit (correleert het met uitkomsten ander meetinstrument wat
hetzelfde meet)
- Content validiteit (is meetinstrument geschikt voor beoogde doel → meet je wat je wil
meten → met je alle aspecten van het construct)
- Face validity
- Divergente validiteit
- Criteria validity (does it predict an outcome)
Cronbach’s alpha meet interne consistentie (in hoeverre correleren de termen binnen een
survey?) → ????
- a < 0.7 → poor
- a > 0.8 → goed
- Afhankelijk van gebruik survey. Als consequenties hoger zijn wil je een
hogere alpha. Op individueel niveau. Op groepsniveau is het soms minder
relevant.
Betrouwbaarheidsanalyses → alles moet in dezelfde richting worden gecodeerd
- Check correlaties tussen individuele items en de schaal zonder dat item
- Item-rest correlation of item-total correlation
- Rit < 0.20 → item mag weg
- Check wat er gebeurd met Cronbach's alpha als de schaal zonder dat item zou zijn
- Cronbach's alpha if item deleted
- a increases the most → item mag weg → behalve als de vraag heel relevant
is, dan kan je ‘ m niet verwijderen
- bijv. depressie → slaap
Voorspellen → scatterplot
- Samenhang boven diagonale hetzelfde als onder diagonale
NHST stappen
1. Formuleer hypotheses H0 en Ha
2. Data verzamelen
3. P-waarde berekenen
4. Keuze H0 wel of niet verwerpen
,Als je een hogere p-waarde vindt en je verwerpt H0 niet dan ga je door onder de aanname
dat H0 waar is, maar dit is geen bewijs voor H0 → gevaar
Correlatie wordt gebruikt om de sterkte en richting van lineaire relaties te meten.
Regressie wordt gebruikt om de vergelijking van de lineaire relatie te beschrijven
en voorspellingen te doen met behulp van deze vergelijkingen.
- Variabele die voorspelt wordt is afhankelijke variabele (x)
- y → onafhankelijke variabele
Regressielijn
Hoe bepaal je welke lijn het beste past? → Least squares regression (minste kwadraten)
- Door negatieve getallen te kwadrateren worden ze positief. Zo worden de residuen
die verder weg liggen zwaarder meegenomen dan de punten die dichtbij liggen
- Lijn met de kleinste som van opgetelde kwadraten (residuen) is de beste lijn
Hoe minder spreiding, hoe kleiner de residuen en hoe accurater de voorspelling
- Als er weinig spreiding is om de regressielijn dan zijn de residuen vaak klein
(waarden?) en zijn de voorspellingen die aan de hand van deze regressielijn worden
gemaakt accuraat
- Als er veel spreiding is om de regressielijn dan zijn de residuen vaak groot en zijn de
voorspellingen die aan de hand van deze regressielijn worden gemaakt een stuk
minder accuraat
Standard error of the estimate (SD) → meetinstrument om te meten hoe accuraat de
voorspellingen zijn
- Gemiddelde fout die er wordt gemaakt bij maken voorspellingen a.d.h.v. regressielijn
Hoe kleiner de SD, hoe accurater de voorspellingen
De regressievergelijking wordt gemaakt door de SSR (smallest sum of squared residuals) en
kan gebruikt worden om voorspellingen te maken.
ŷ = b0 + b1x
→ ŷ = b0 + b1*x (b1 keer waarde van x)
- b0 → ŷ intercept = constante
- b1 → slope
- hierbij kijk je in tabel coefficients → unstandardized B
“ Ik heb een waarde voor de voorspeller (x). Hoeveel verandering is er dan in de uitkomst
(productiviteit op werk) als ik 1 stapje meet ptsd score heb?” → krijg je uit formule
- Bij positief getal gaat lijn omhoog, bij negatief getal omlaag. Hoe sterk is afhankelijk
van b1.
y → afhankelijke variabele die je wil voorspellen
x → onafhankelijke variabele die je gebruikt om voorspelling te doen
b0 → interceptie of startpunt van de regressielijn op de y-as
b1 → regressiecoëfficiënt of helling van de regressielijn → geeft aan hoeveel de afhankelijke
variabele y verandert voor elke eenheid toename in de onafhankelijke variabele x. Als b1
bijv. gelijk is aan 2, dan zal voor elke eenheid toename in x, y gemiddeld met 2 toenemen
, R → absolute waarde: positieve getallen blijven positief en negatieve getallen worden
positief (je vormt de variabele om in SPSS → compute variabele)
- De multiple correlatiecoëfficiënt (R) geeft de sterkte en richting weer van de lineaire
relatie tussen de voorspelde variabele (afhankelijke variabele) en de voorspellende
variabelen (onafhankelijke variabelen) in een regressiemodel. De score varieert
tussen -1 en 1, waarbij -1 een perfecte negatieve lineaire relatie aangeeft, 1 een
perfecte positieve lineaire relatie aangeeft en 0 een afwezigheid van een lineaire
relatie aangeeft.
- 0,3 vaak zwak en 0,7 vaak sterk
R square → correlatie, maar dan gekwadrateerd → measure of fit
- Geeft indicatie van de hoeveelheid verklaarde variantie. Geeft aan hoeveel
variabiliteit in de afhankelijke variabele (voorspelde variabele) wordt verklaard door
de voorspellende variabelen (onafhankelijke variabelen) in een regressiemodel.
Varieert tussen 0 en 1 waarbij 0 aangeeft dat de voorspellende variabelen geen
enkele invloed hebben op de afhankelijke variabele en 1 aangeeft dat alle variabiliteit
in de afhankelijke variabele volledig wordt verklaard door de voorspellende
variabelen.
- Bijv. een R2 waarde van 0,70 geeft aan dat 70% van de variantie in de afhankelijke
variabele wordt verklaard door de voorspellende variabelen in het regressiemodel,
terwijl de overige 30% wordt toegeschreven aan andere factoren die niet in het
model zijn opgenomen
H2
Correlatie → maatstaf van richting van een lineair verband tussen twee interval/ ratio
variabelen
Betrouwbaarheid → consistentie
- Test-hertest betrouwbaarheid
- Interbeoordelaarsbetrouwbaarheid
- Interne betrouwbaarheid (hangen de constructen uit het meetinstrument met elkaar
samen en meten ze hetzelfde?)
Validiteit → accuraatheid
- Convergente validiteit (correleert het met uitkomsten ander meetinstrument wat
hetzelfde meet)
- Content validiteit (is meetinstrument geschikt voor beoogde doel → meet je wat je wil
meten → met je alle aspecten van het construct)
- Face validity
- Divergente validiteit
- Criteria validity (does it predict an outcome)
Cronbach’s alpha meet interne consistentie (in hoeverre correleren de termen binnen een
survey?) → ????
- a < 0.7 → poor
- a > 0.8 → goed
- Afhankelijk van gebruik survey. Als consequenties hoger zijn wil je een
hogere alpha. Op individueel niveau. Op groepsniveau is het soms minder
relevant.
Betrouwbaarheidsanalyses → alles moet in dezelfde richting worden gecodeerd
- Check correlaties tussen individuele items en de schaal zonder dat item
- Item-rest correlation of item-total correlation
- Rit < 0.20 → item mag weg
- Check wat er gebeurd met Cronbach's alpha als de schaal zonder dat item zou zijn
- Cronbach's alpha if item deleted
- a increases the most → item mag weg → behalve als de vraag heel relevant
is, dan kan je ‘ m niet verwijderen
- bijv. depressie → slaap
Voorspellen → scatterplot
- Samenhang boven diagonale hetzelfde als onder diagonale
NHST stappen
1. Formuleer hypotheses H0 en Ha
2. Data verzamelen
3. P-waarde berekenen
4. Keuze H0 wel of niet verwerpen
,Als je een hogere p-waarde vindt en je verwerpt H0 niet dan ga je door onder de aanname
dat H0 waar is, maar dit is geen bewijs voor H0 → gevaar
Correlatie wordt gebruikt om de sterkte en richting van lineaire relaties te meten.
Regressie wordt gebruikt om de vergelijking van de lineaire relatie te beschrijven
en voorspellingen te doen met behulp van deze vergelijkingen.
- Variabele die voorspelt wordt is afhankelijke variabele (x)
- y → onafhankelijke variabele
Regressielijn
Hoe bepaal je welke lijn het beste past? → Least squares regression (minste kwadraten)
- Door negatieve getallen te kwadrateren worden ze positief. Zo worden de residuen
die verder weg liggen zwaarder meegenomen dan de punten die dichtbij liggen
- Lijn met de kleinste som van opgetelde kwadraten (residuen) is de beste lijn
Hoe minder spreiding, hoe kleiner de residuen en hoe accurater de voorspelling
- Als er weinig spreiding is om de regressielijn dan zijn de residuen vaak klein
(waarden?) en zijn de voorspellingen die aan de hand van deze regressielijn worden
gemaakt accuraat
- Als er veel spreiding is om de regressielijn dan zijn de residuen vaak groot en zijn de
voorspellingen die aan de hand van deze regressielijn worden gemaakt een stuk
minder accuraat
Standard error of the estimate (SD) → meetinstrument om te meten hoe accuraat de
voorspellingen zijn
- Gemiddelde fout die er wordt gemaakt bij maken voorspellingen a.d.h.v. regressielijn
Hoe kleiner de SD, hoe accurater de voorspellingen
De regressievergelijking wordt gemaakt door de SSR (smallest sum of squared residuals) en
kan gebruikt worden om voorspellingen te maken.
ŷ = b0 + b1x
→ ŷ = b0 + b1*x (b1 keer waarde van x)
- b0 → ŷ intercept = constante
- b1 → slope
- hierbij kijk je in tabel coefficients → unstandardized B
“ Ik heb een waarde voor de voorspeller (x). Hoeveel verandering is er dan in de uitkomst
(productiviteit op werk) als ik 1 stapje meet ptsd score heb?” → krijg je uit formule
- Bij positief getal gaat lijn omhoog, bij negatief getal omlaag. Hoe sterk is afhankelijk
van b1.
y → afhankelijke variabele die je wil voorspellen
x → onafhankelijke variabele die je gebruikt om voorspelling te doen
b0 → interceptie of startpunt van de regressielijn op de y-as
b1 → regressiecoëfficiënt of helling van de regressielijn → geeft aan hoeveel de afhankelijke
variabele y verandert voor elke eenheid toename in de onafhankelijke variabele x. Als b1
bijv. gelijk is aan 2, dan zal voor elke eenheid toename in x, y gemiddeld met 2 toenemen
, R → absolute waarde: positieve getallen blijven positief en negatieve getallen worden
positief (je vormt de variabele om in SPSS → compute variabele)
- De multiple correlatiecoëfficiënt (R) geeft de sterkte en richting weer van de lineaire
relatie tussen de voorspelde variabele (afhankelijke variabele) en de voorspellende
variabelen (onafhankelijke variabelen) in een regressiemodel. De score varieert
tussen -1 en 1, waarbij -1 een perfecte negatieve lineaire relatie aangeeft, 1 een
perfecte positieve lineaire relatie aangeeft en 0 een afwezigheid van een lineaire
relatie aangeeft.
- 0,3 vaak zwak en 0,7 vaak sterk
R square → correlatie, maar dan gekwadrateerd → measure of fit
- Geeft indicatie van de hoeveelheid verklaarde variantie. Geeft aan hoeveel
variabiliteit in de afhankelijke variabele (voorspelde variabele) wordt verklaard door
de voorspellende variabelen (onafhankelijke variabelen) in een regressiemodel.
Varieert tussen 0 en 1 waarbij 0 aangeeft dat de voorspellende variabelen geen
enkele invloed hebben op de afhankelijke variabele en 1 aangeeft dat alle variabiliteit
in de afhankelijke variabele volledig wordt verklaard door de voorspellende
variabelen.
- Bijv. een R2 waarde van 0,70 geeft aan dat 70% van de variantie in de afhankelijke
variabele wordt verklaard door de voorspellende variabelen in het regressiemodel,
terwijl de overige 30% wordt toegeschreven aan andere factoren die niet in het
model zijn opgenomen