WEEK 1
Psychometrie is de tak van psychologie die zich bezighoudt met de ontwikkeling en het gebruik van
psychologische tests en het toepassen van statistische technieken op het gebied van psychologische
testen.
Meten van psychologische eigenschappen
Een psychologisch construct kun je eigenlijk niet
echt waarnemen, maar het observeerbare deel
(gedrag) kan je gebruiken om iets te zeggen over dat
construct. Zo’n psychologisch construct kan
namelijk het gedrag beïnvloeden. Bijv. bij
depressie: wil je de mate van depressie weten
(psychologisch construct) dan kan je dat meten door
vragen te stellen (observeerbaar gedrag).
- Observeerbaar gedrag dat gevoelig is voor variaties in het psychologische construct
- Door een systematische verzameling
- Doel: vergelijkingen maken
Tussen verschillende personen interindividuele verschillen
Binnen personen intra-individuele verschillen
Schaling
- Het toekennen van numerieke waarden aan psychologische eigenschappen
- In de praktijk: hoe een testscore of categorie bepaald wordt
Meetniveaus
- Nominaal – identiteit
Uitputtend – iedereen moet in min. 1 categorie vallen
Uitsluitend – Iedereen kan in max. 1 categorie vallen
- Ordinaal – + rangordening
- Interval – + kwantiteit (
Afstand tussen de punten is even groot
Met binaire variabelen kun je soms ook rekenen als een interval variabele. Als er
namelijk maar 1 interval is, is dat interval sowieso gelijk aan zichzelf.
- Ratio – + absoluut nulpunt
Normen
- Voor de interpretatie van testscores
- Relatieve normen
Gebaseerd op testscores van een representatieve normgroep (referentiesteekproef)
(schatting van) gemiddelde en standaarddeviatie in target populatie
ₓ Onder/boven gemiddelde?
ₓ Hoe ver van het gemiddelde?
Transformatie ruwe score X naar relatieve normscore (z, T, percentielen)
- Absolute normen
Vaste standaard/grens
,Kenmerken
- Een test moet voldoen aan meerdere kenmerken, wat beoordeelt wordt door de COTAN. Voor
normen zijn er ook wat eisen:
Zijn de normen actueel?
ₓ Na 15 jaar ‘verouderd’, na 20 jaar ‘niet meer bruikbaar’
Zijn de normgroepen groot genoeg?
ₓ N tenminste 200 of 300
Zijn de normgroepen representatief?
ₓ Wat betreft leeftijd, geslacht, etniciteit, geloofsovertuiging
ₓ Aselecte steekproef?
ₓ In de praktijk vaak gelegenheidssteekproeven
- Meerderheid van tests worden ‘onvoldoende’ beoordeeld op het kwaliteitsonderdeel normen
Z-score
- Standaardscore ZX
Aantal standaarddeviaties van het gemiddelde
Zegt dus of iemand boven of onder het gemiddelde zit, en ook hoe extreem dan
Zowel positieve als negatieve waarden
Gemiddelde = 0, Sd = 1
Z-scores zijn in relatie tot een bepaalde groep, dus wel heel afhankelijk van de groep.
Het gemiddelde kan namelijk weer verschillen per groep en de z-score bereken je met
het gemiddelde.
x−x
Z x=
s dx
Betekenis van standaarddeviaties bij normaalverdeling:
Getransformeerde standaardscore Tx
- Makkelijker te begrijpen / ‘vriendelijker dan z-scores
Het camoufleert een beetje. Zo kun je mensen een score geven, zonder ze te
beledigen. Bijv. bij IQ, zodat je geen negatieve IQ hebt
- Alleen positieve waarden
- In de formule is de gekozen sd 10 en het gekozen gem 50
T X =10 ⋅ Z X +50
Percentielen PX
- Percentage van scores lager of gelijk aan een specifieke test score
- Omzetten X PX
Relatieve positie van score X
, In oplopende frequentietabel van geobserveerde scores
= cumulatieve percentage van score X (als je bijv. SPSS tabel krijgt)
Dus voor X=10 is de percentiel het percentage personen met een score van 10 of lager
SPSS
- Voor z-scores
Minimum: -3
Maximum: 3
Gemiddelde: 0
- Voor T-scores
Minimum: 20
Maximum: 80
Gemiddelde: 50
- Voor percentiel scores
Minimum: 1
Maximum: 100
Gemiddelde: iets boven 50
WEEK 2 - Betrouwbaarheid
Betrouwbaarheid
- In hoeverre zijn individuele verschillen in testscores een functie van werkelijke individuele
verschillen (ware scores)
- In welke mate is de test vrij van random meetfouten (error)?
Validiteit
- In hoeverre meet een test wat hij beoogt te meten?
- In welke mate is de test vrij van systematische meetfouten (bias)?
Error random
Bias systematisch
Klassieke testtheorie (KTT)
- Voor elke persoon is de geobserveerde score gelijk aan de som van de ware score en random
error
- Ware score
Niet direct observeerbaar: latente variabele, die moet geschat worden
- Error
, Verschil tussen geobserveerde score en ware score
ₓ Xe = Xo - Xt
Kan positief of negatief zijn
ₓ Als Xo resp. te hoog of te laag is in vergelijking met Xt
Latente variabele
Assumpties KTT
Formule Xo = Xt + Xe heeft op zichzelf geen praktisch nut, want zowel X t als Xe zijn ongeobserveerd
(latent). Daarom zijn er aanvullende assumpties nodig.
1. μe =0 - Gemiddelde error in populatie is nul
a. Geen systematische over- of onderschatting van ware scores voor populatie als geheel
r
2. et =0 - Errors zjin volledig ongecorreleerd met ware scores
a. Geen systematische over- of onderschatting van ware scores in deelpopulaties
3. r e e =0 - Errors zijn volledig ongecorreleerd met elkaar
i j
a. Error van persoon 1 zegt niets over error van persoon 2
b. Error van test 1 zegt niets over error van test 2
c. Error op tijdstip 1 zegt niets over error op tijdstip 2 etc.
Variantie
Variantie van Xo als samengestelde variabele (Xo = Xt + Xe):
s2o =s 2t + s 2e + 2r te st s e
Omdat rte=0 (assumptie 2). Is variantie van geobserveerde scores gelijk aan variantie van ware scores
plus variantie van errors
s2o =s 2t + s 2e
Kwaliteit van test in termen van varianties
2 2
- Ideale test: test zonder error, alle geobserveerde variantie is ware scorevariantie ( so =s t )
-
2 2
- Slechtste test: test met alleen maar error, alle geobserveerde variantie is errorvariantie ( so =s e
)
-
- Echte test: ergens tussen die twee extremen in
Betrouwbaarheidscoëfficiënt
De betrouwbaarheidscoëfficiënt (Rxx) is de proportie variantie van geobserveerde scores die
verklaard worden door ware scores. Het is dus het oranje deel van de cirkel (of 1 – grijze deel).
s 2t s2e
R xx = 2
=1−
so s 2o
Als de KTT-assumpties kloppen, moet altijd gelden: 0 ≤ R xx ≤1
Proportie verklaarde variantie is ook gekwadrateerde correlatie. Daarom alternatieve definitie van
betrouwbaarheid: gekwadrateerde correlatie van geobserveerde scores met ware scores
2 2
R xx =r ot =1−r oe
Psychometrie is de tak van psychologie die zich bezighoudt met de ontwikkeling en het gebruik van
psychologische tests en het toepassen van statistische technieken op het gebied van psychologische
testen.
Meten van psychologische eigenschappen
Een psychologisch construct kun je eigenlijk niet
echt waarnemen, maar het observeerbare deel
(gedrag) kan je gebruiken om iets te zeggen over dat
construct. Zo’n psychologisch construct kan
namelijk het gedrag beïnvloeden. Bijv. bij
depressie: wil je de mate van depressie weten
(psychologisch construct) dan kan je dat meten door
vragen te stellen (observeerbaar gedrag).
- Observeerbaar gedrag dat gevoelig is voor variaties in het psychologische construct
- Door een systematische verzameling
- Doel: vergelijkingen maken
Tussen verschillende personen interindividuele verschillen
Binnen personen intra-individuele verschillen
Schaling
- Het toekennen van numerieke waarden aan psychologische eigenschappen
- In de praktijk: hoe een testscore of categorie bepaald wordt
Meetniveaus
- Nominaal – identiteit
Uitputtend – iedereen moet in min. 1 categorie vallen
Uitsluitend – Iedereen kan in max. 1 categorie vallen
- Ordinaal – + rangordening
- Interval – + kwantiteit (
Afstand tussen de punten is even groot
Met binaire variabelen kun je soms ook rekenen als een interval variabele. Als er
namelijk maar 1 interval is, is dat interval sowieso gelijk aan zichzelf.
- Ratio – + absoluut nulpunt
Normen
- Voor de interpretatie van testscores
- Relatieve normen
Gebaseerd op testscores van een representatieve normgroep (referentiesteekproef)
(schatting van) gemiddelde en standaarddeviatie in target populatie
ₓ Onder/boven gemiddelde?
ₓ Hoe ver van het gemiddelde?
Transformatie ruwe score X naar relatieve normscore (z, T, percentielen)
- Absolute normen
Vaste standaard/grens
,Kenmerken
- Een test moet voldoen aan meerdere kenmerken, wat beoordeelt wordt door de COTAN. Voor
normen zijn er ook wat eisen:
Zijn de normen actueel?
ₓ Na 15 jaar ‘verouderd’, na 20 jaar ‘niet meer bruikbaar’
Zijn de normgroepen groot genoeg?
ₓ N tenminste 200 of 300
Zijn de normgroepen representatief?
ₓ Wat betreft leeftijd, geslacht, etniciteit, geloofsovertuiging
ₓ Aselecte steekproef?
ₓ In de praktijk vaak gelegenheidssteekproeven
- Meerderheid van tests worden ‘onvoldoende’ beoordeeld op het kwaliteitsonderdeel normen
Z-score
- Standaardscore ZX
Aantal standaarddeviaties van het gemiddelde
Zegt dus of iemand boven of onder het gemiddelde zit, en ook hoe extreem dan
Zowel positieve als negatieve waarden
Gemiddelde = 0, Sd = 1
Z-scores zijn in relatie tot een bepaalde groep, dus wel heel afhankelijk van de groep.
Het gemiddelde kan namelijk weer verschillen per groep en de z-score bereken je met
het gemiddelde.
x−x
Z x=
s dx
Betekenis van standaarddeviaties bij normaalverdeling:
Getransformeerde standaardscore Tx
- Makkelijker te begrijpen / ‘vriendelijker dan z-scores
Het camoufleert een beetje. Zo kun je mensen een score geven, zonder ze te
beledigen. Bijv. bij IQ, zodat je geen negatieve IQ hebt
- Alleen positieve waarden
- In de formule is de gekozen sd 10 en het gekozen gem 50
T X =10 ⋅ Z X +50
Percentielen PX
- Percentage van scores lager of gelijk aan een specifieke test score
- Omzetten X PX
Relatieve positie van score X
, In oplopende frequentietabel van geobserveerde scores
= cumulatieve percentage van score X (als je bijv. SPSS tabel krijgt)
Dus voor X=10 is de percentiel het percentage personen met een score van 10 of lager
SPSS
- Voor z-scores
Minimum: -3
Maximum: 3
Gemiddelde: 0
- Voor T-scores
Minimum: 20
Maximum: 80
Gemiddelde: 50
- Voor percentiel scores
Minimum: 1
Maximum: 100
Gemiddelde: iets boven 50
WEEK 2 - Betrouwbaarheid
Betrouwbaarheid
- In hoeverre zijn individuele verschillen in testscores een functie van werkelijke individuele
verschillen (ware scores)
- In welke mate is de test vrij van random meetfouten (error)?
Validiteit
- In hoeverre meet een test wat hij beoogt te meten?
- In welke mate is de test vrij van systematische meetfouten (bias)?
Error random
Bias systematisch
Klassieke testtheorie (KTT)
- Voor elke persoon is de geobserveerde score gelijk aan de som van de ware score en random
error
- Ware score
Niet direct observeerbaar: latente variabele, die moet geschat worden
- Error
, Verschil tussen geobserveerde score en ware score
ₓ Xe = Xo - Xt
Kan positief of negatief zijn
ₓ Als Xo resp. te hoog of te laag is in vergelijking met Xt
Latente variabele
Assumpties KTT
Formule Xo = Xt + Xe heeft op zichzelf geen praktisch nut, want zowel X t als Xe zijn ongeobserveerd
(latent). Daarom zijn er aanvullende assumpties nodig.
1. μe =0 - Gemiddelde error in populatie is nul
a. Geen systematische over- of onderschatting van ware scores voor populatie als geheel
r
2. et =0 - Errors zjin volledig ongecorreleerd met ware scores
a. Geen systematische over- of onderschatting van ware scores in deelpopulaties
3. r e e =0 - Errors zijn volledig ongecorreleerd met elkaar
i j
a. Error van persoon 1 zegt niets over error van persoon 2
b. Error van test 1 zegt niets over error van test 2
c. Error op tijdstip 1 zegt niets over error op tijdstip 2 etc.
Variantie
Variantie van Xo als samengestelde variabele (Xo = Xt + Xe):
s2o =s 2t + s 2e + 2r te st s e
Omdat rte=0 (assumptie 2). Is variantie van geobserveerde scores gelijk aan variantie van ware scores
plus variantie van errors
s2o =s 2t + s 2e
Kwaliteit van test in termen van varianties
2 2
- Ideale test: test zonder error, alle geobserveerde variantie is ware scorevariantie ( so =s t )
-
2 2
- Slechtste test: test met alleen maar error, alle geobserveerde variantie is errorvariantie ( so =s e
)
-
- Echte test: ergens tussen die twee extremen in
Betrouwbaarheidscoëfficiënt
De betrouwbaarheidscoëfficiënt (Rxx) is de proportie variantie van geobserveerde scores die
verklaard worden door ware scores. Het is dus het oranje deel van de cirkel (of 1 – grijze deel).
s 2t s2e
R xx = 2
=1−
so s 2o
Als de KTT-assumpties kloppen, moet altijd gelden: 0 ≤ R xx ≤1
Proportie verklaarde variantie is ook gekwadrateerde correlatie. Daarom alternatieve definitie van
betrouwbaarheid: gekwadrateerde correlatie van geobserveerde scores met ware scores
2 2
R xx =r ot =1−r oe