Psychometrie – Samenvatting
Michelle van Zwieten
S2549522
College 1 – meting, schaling en normen
Psychometrie =
= de wetenschap die zich bezighoudt met het meten van mentale eigenschappen en processen. Hierbij
zijn de volgende attributen belangrijk: het type data (scores), de betrouwbaarheid en de validiteit van
de psychologische testen.
= tak van de psychologie die zich bezighoudt met de ontwikkeling en het gebruik van psychologische
tests iets meer de definitie van psychodiagnostiek
= toepassen van statistische technieken op het gebied van psychologische testen
kernwoorden die horen bij psychometrie :
kwaliteit van de meting
theoretische uitgangspunten
kwaliteit van het testmateriaal
kwaliteit van de handleiding
normen : wat betekent de testscore
betrouwbaarheid : zijn metingen consistent, komt er altijd dezelfde uitkomst uit
validiteit : meet de test wat ie moet meten, dus niet consistent het verkeerde
Probleem: veel psychologische constructen zijn latente variabelen, dat wil zeggen, dat ze niet direct
observeerbaar zijn. Deze latente variabelen kunnen wel indirect worden geobserveerd, dit komt door
de gedachte dat deze latente variabelen invloed hebben op observeerbaar gedrag = operationele
definities.
Dus: psychologische construct observeerbaar gedrag
maar we willen dat het ook omgekeerd mogelijk wordt, dus observeerbaar gedrag (bijv. ik ben
verdrietig) psychologisch construct (bijv. mate van depressie)
Wat hebben we hiervoor nodig? observeerbaar gedrag dat gevoelig is voor variaties in het
psychologische construct.
Hoe pak je dit aan? Hoe kom je aan deze benodigdheid? systematische verzameling maken (bijv.
antwoorden op vragen van een test)
Wat is het doel? vergelijkingen maken, 2 mogelijke vergelijkingen
tussen verschillende personen = interindividuele verschillen bijv. Rogier heeft meer
zelfvertrouwen dan Bas
binnen personen = intra-individuele verschillen bijv. Novak was minder depressief na
therapie dan voor de start van de therapie
Dus : psychologische test = systematische verzameling gedrag
Bijv. set van 10 zelfrapportage items (score 1 - 5)
Doel van psychologische test: vergelijkingen maken
Herhaling van inleiding methoden en technieken: vier verschillende meetniveaus
1
, Meetniveau Eigenschap
Nominaal Identiteit : uitputtend en wederzijds uitsluitend
Ordinaal + ordening/volgorde
Interval + kwantiteit : stapsgrootte is iedere keer even
groot
(Bijv. verschil tussen 4 en 3 is gelijk aan het
verschil tussen 6 en 5)
Ratio + absoluut nulpunt
(Bijv. je kunt 2x zo lang zijn als iemand anders,
maar je kunt niet 2x zo intelligent zijn als
iemand anders, omdat intelligentie geen vast
nulpunt heeft)
Schaling = het toekennen van numerieke waarden aan psychologische eigenschappen. In andere
woorden: het toekennen van kwantitatieve testscores
Bijv. som van de itemscores (10 - 50)
In de praktijk: hoe wordt een testscore of categorie bepaald aan de hand van de observaties?
Normen = interpretatie van die testscores
Bijv. james scoort 22. Wat betekent dat ..?
2 verschillende soorten normen:
relatieve normen = vergelijking van de scores met scores van een representatieve normgroep
(achteraf vastgestelde normwaarde)
Bijv. Hoe verhoudt James’ score van 22 zich tot scores van relevante anderen
absolute normen = vergelijking van de scores met een vaste / standaard grens
(vooraf vastgestelde normwaarde)
Bijv. Hoe verhoudt James’ score van 22 zich tot een vaste standaard
Interpretatie van testscores
x−M x
Standaardscore ZX = =
S Dx
Wat zegt het? Aantal standaarddeviaties dat ie afwijkt van het gemiddelde
zowel positieve als negatieve waarden
gemiddelde = 0 en SD = 1
Getransformeerde standaard score TX = 10∗z x +50
makkelijker te begrijpen / “vriendelijker” dan Z-scores
alleen positieve waarden
gemiddelde = 50 SD = 10
Percentiele scores (= percentile ranks) : PX = percentages van scores dat lager of gelijk aan
een specifieke testscore is. (bijv. een percentiel van 46, dan betekent dit dat 46 % van de
mensen een zelfde score of een lagere score heeft. (denk aan entree- en citotoetsen)
Omzetten van X PX
Relatieve positie van score X
Frequentietabel maken in volgorde van laagste score naar hoogste score.
In SPSS kijk naar cumulatieve percentage van score X
Kwaliteit van de testen : wordt gedaan door COTAN : commissie testaangelegenheden
Nederland : waar wordt naar gekeken? kwaliteit van de meting
theoretische uitgangspunten
2
, kwaliteit van het testmateriaal
kwaliteit van de handleiding
normen : wat betekent de testscore (meerderheid van de tests worden ‘onvoldoende’
beoordeeld op het kwaliteitsonderdeel normen)
zijn de normen actueel? na 15 jaar ‘verouderd’, na 20 jaar ‘niet meer bruikbaar’
zijn de normgroepen groot genoeg? N ten minste 200 of 300
zijn de normgroepen representatief?
o leeftijd, geslacht, etniciteit, geloofsovertuiging etc.
o aselecte steekproef
o in de praktijk vaak gelegenheidssteekproeven
betrouwbaarheid : zijn metingen consistent, komt er altijd dezelfde uitkomst uit
validiteit : meet de test wat ie moet meten, dus niet consistent het verkeerde
Wat is de betekenis van de standaarddeviatie? Als er sprake is van een normaalverdeling, dan:
Bij 1 standaarddeviatie ligt ongeveer 34.1 % ligt tussen het gemiddelde en 1 standaarddeviatie
daarboven. En 68 % van de mensen ligt tussen -1 SD en +1 SD. etc.
Herhaling van Formules:
3
, College 2 – Betrouwbaarheid geobserveerde score = is direct te
Betrouwbaarheid = observeren ware score + random error :
ware score = niet direct observeerbaar :
= in hoeverre geven mijn metingen altijd dezelfde uitkomst? latente variabele, die geschat moet
worden
= hoe consistent meet een test wat hij meet?
= hoe precies is mijn meting?
= in hoeverre zijn individuele verschillen in testscores een functie van werkelijke individuele
verschillen (ware scores, niet direct observeerbare scores)?
= In welke mate zijn testscores een functie van ware scores?
= in welke mate is de test vrij van random meetfouten (error)?
validiteit =
= in hoeverre meet een test wat hij beoogt te meten?
= in welke mate is de test vrij van systematische meetfouten (bias)?
Klassieke testtheorie (= KTT) = voor elke persoon is de geobserveerde score gelijk aan de som
van de ware score en de random error
x O=x t + x e
Xo = geobserveerde score
Xt = ware score / true score (latente variabele)
Xe = error = verschil tussen geobserveerde score en ware score ; kan positief of negatief
zijn (als Xo resp. te hoog of te laag is in vergelijking met Xt). (latente variabele)
Doel van KTT = erachter komen wat de betrouwbaarheid / meetprecisie is van de testscore is
√
geeft de standaardmeetfout : sem = s0 ( 1−R xx )
Assumpties van KTT. Formule x O=x t + x e heeft op zichzelf geen praktisch nut, want zowel
Xt als Xe zijn ongeobserveerd (beide latente variabelen). Hierom zijn er aanvullende
assumpties nodig.
3 Assumpties over errors:
μe =0 gemiddelde error in populatie is 0
geen systematische over- of onderschatting van ware scores voor populatie als geheel
r et =0 Errors zijn volledig ongecorreleerd met ware scores
geen systematische over- of onderschatting van ware scores in deelpopulaties (bijv.
mensen met lage ware scores)
r e e =0 errors zijn volledig ongecorreleerd met elkaar
i j
error van persoon 1 zegt niets over error van persoon 2; error van test 1 zegt niets over
error van test 2; error op tijdstip 1 zegt niet over error op tijdstip 2; etc.
2 2 2
Kwaliteit van test in termen van varianties: S0 =S t + S e
ideale test : alle geobserveerde variantie is ware score variantie (S 02 = St2)
absolute baggertest : alle geobserveerde variantie is errorvariantie (S 02 = Se2)
echte test : ergens tussen deze twee extremen
4
Michelle van Zwieten
S2549522
College 1 – meting, schaling en normen
Psychometrie =
= de wetenschap die zich bezighoudt met het meten van mentale eigenschappen en processen. Hierbij
zijn de volgende attributen belangrijk: het type data (scores), de betrouwbaarheid en de validiteit van
de psychologische testen.
= tak van de psychologie die zich bezighoudt met de ontwikkeling en het gebruik van psychologische
tests iets meer de definitie van psychodiagnostiek
= toepassen van statistische technieken op het gebied van psychologische testen
kernwoorden die horen bij psychometrie :
kwaliteit van de meting
theoretische uitgangspunten
kwaliteit van het testmateriaal
kwaliteit van de handleiding
normen : wat betekent de testscore
betrouwbaarheid : zijn metingen consistent, komt er altijd dezelfde uitkomst uit
validiteit : meet de test wat ie moet meten, dus niet consistent het verkeerde
Probleem: veel psychologische constructen zijn latente variabelen, dat wil zeggen, dat ze niet direct
observeerbaar zijn. Deze latente variabelen kunnen wel indirect worden geobserveerd, dit komt door
de gedachte dat deze latente variabelen invloed hebben op observeerbaar gedrag = operationele
definities.
Dus: psychologische construct observeerbaar gedrag
maar we willen dat het ook omgekeerd mogelijk wordt, dus observeerbaar gedrag (bijv. ik ben
verdrietig) psychologisch construct (bijv. mate van depressie)
Wat hebben we hiervoor nodig? observeerbaar gedrag dat gevoelig is voor variaties in het
psychologische construct.
Hoe pak je dit aan? Hoe kom je aan deze benodigdheid? systematische verzameling maken (bijv.
antwoorden op vragen van een test)
Wat is het doel? vergelijkingen maken, 2 mogelijke vergelijkingen
tussen verschillende personen = interindividuele verschillen bijv. Rogier heeft meer
zelfvertrouwen dan Bas
binnen personen = intra-individuele verschillen bijv. Novak was minder depressief na
therapie dan voor de start van de therapie
Dus : psychologische test = systematische verzameling gedrag
Bijv. set van 10 zelfrapportage items (score 1 - 5)
Doel van psychologische test: vergelijkingen maken
Herhaling van inleiding methoden en technieken: vier verschillende meetniveaus
1
, Meetniveau Eigenschap
Nominaal Identiteit : uitputtend en wederzijds uitsluitend
Ordinaal + ordening/volgorde
Interval + kwantiteit : stapsgrootte is iedere keer even
groot
(Bijv. verschil tussen 4 en 3 is gelijk aan het
verschil tussen 6 en 5)
Ratio + absoluut nulpunt
(Bijv. je kunt 2x zo lang zijn als iemand anders,
maar je kunt niet 2x zo intelligent zijn als
iemand anders, omdat intelligentie geen vast
nulpunt heeft)
Schaling = het toekennen van numerieke waarden aan psychologische eigenschappen. In andere
woorden: het toekennen van kwantitatieve testscores
Bijv. som van de itemscores (10 - 50)
In de praktijk: hoe wordt een testscore of categorie bepaald aan de hand van de observaties?
Normen = interpretatie van die testscores
Bijv. james scoort 22. Wat betekent dat ..?
2 verschillende soorten normen:
relatieve normen = vergelijking van de scores met scores van een representatieve normgroep
(achteraf vastgestelde normwaarde)
Bijv. Hoe verhoudt James’ score van 22 zich tot scores van relevante anderen
absolute normen = vergelijking van de scores met een vaste / standaard grens
(vooraf vastgestelde normwaarde)
Bijv. Hoe verhoudt James’ score van 22 zich tot een vaste standaard
Interpretatie van testscores
x−M x
Standaardscore ZX = =
S Dx
Wat zegt het? Aantal standaarddeviaties dat ie afwijkt van het gemiddelde
zowel positieve als negatieve waarden
gemiddelde = 0 en SD = 1
Getransformeerde standaard score TX = 10∗z x +50
makkelijker te begrijpen / “vriendelijker” dan Z-scores
alleen positieve waarden
gemiddelde = 50 SD = 10
Percentiele scores (= percentile ranks) : PX = percentages van scores dat lager of gelijk aan
een specifieke testscore is. (bijv. een percentiel van 46, dan betekent dit dat 46 % van de
mensen een zelfde score of een lagere score heeft. (denk aan entree- en citotoetsen)
Omzetten van X PX
Relatieve positie van score X
Frequentietabel maken in volgorde van laagste score naar hoogste score.
In SPSS kijk naar cumulatieve percentage van score X
Kwaliteit van de testen : wordt gedaan door COTAN : commissie testaangelegenheden
Nederland : waar wordt naar gekeken? kwaliteit van de meting
theoretische uitgangspunten
2
, kwaliteit van het testmateriaal
kwaliteit van de handleiding
normen : wat betekent de testscore (meerderheid van de tests worden ‘onvoldoende’
beoordeeld op het kwaliteitsonderdeel normen)
zijn de normen actueel? na 15 jaar ‘verouderd’, na 20 jaar ‘niet meer bruikbaar’
zijn de normgroepen groot genoeg? N ten minste 200 of 300
zijn de normgroepen representatief?
o leeftijd, geslacht, etniciteit, geloofsovertuiging etc.
o aselecte steekproef
o in de praktijk vaak gelegenheidssteekproeven
betrouwbaarheid : zijn metingen consistent, komt er altijd dezelfde uitkomst uit
validiteit : meet de test wat ie moet meten, dus niet consistent het verkeerde
Wat is de betekenis van de standaarddeviatie? Als er sprake is van een normaalverdeling, dan:
Bij 1 standaarddeviatie ligt ongeveer 34.1 % ligt tussen het gemiddelde en 1 standaarddeviatie
daarboven. En 68 % van de mensen ligt tussen -1 SD en +1 SD. etc.
Herhaling van Formules:
3
, College 2 – Betrouwbaarheid geobserveerde score = is direct te
Betrouwbaarheid = observeren ware score + random error :
ware score = niet direct observeerbaar :
= in hoeverre geven mijn metingen altijd dezelfde uitkomst? latente variabele, die geschat moet
worden
= hoe consistent meet een test wat hij meet?
= hoe precies is mijn meting?
= in hoeverre zijn individuele verschillen in testscores een functie van werkelijke individuele
verschillen (ware scores, niet direct observeerbare scores)?
= In welke mate zijn testscores een functie van ware scores?
= in welke mate is de test vrij van random meetfouten (error)?
validiteit =
= in hoeverre meet een test wat hij beoogt te meten?
= in welke mate is de test vrij van systematische meetfouten (bias)?
Klassieke testtheorie (= KTT) = voor elke persoon is de geobserveerde score gelijk aan de som
van de ware score en de random error
x O=x t + x e
Xo = geobserveerde score
Xt = ware score / true score (latente variabele)
Xe = error = verschil tussen geobserveerde score en ware score ; kan positief of negatief
zijn (als Xo resp. te hoog of te laag is in vergelijking met Xt). (latente variabele)
Doel van KTT = erachter komen wat de betrouwbaarheid / meetprecisie is van de testscore is
√
geeft de standaardmeetfout : sem = s0 ( 1−R xx )
Assumpties van KTT. Formule x O=x t + x e heeft op zichzelf geen praktisch nut, want zowel
Xt als Xe zijn ongeobserveerd (beide latente variabelen). Hierom zijn er aanvullende
assumpties nodig.
3 Assumpties over errors:
μe =0 gemiddelde error in populatie is 0
geen systematische over- of onderschatting van ware scores voor populatie als geheel
r et =0 Errors zijn volledig ongecorreleerd met ware scores
geen systematische over- of onderschatting van ware scores in deelpopulaties (bijv.
mensen met lage ware scores)
r e e =0 errors zijn volledig ongecorreleerd met elkaar
i j
error van persoon 1 zegt niets over error van persoon 2; error van test 1 zegt niets over
error van test 2; error op tijdstip 1 zegt niet over error op tijdstip 2; etc.
2 2 2
Kwaliteit van test in termen van varianties: S0 =S t + S e
ideale test : alle geobserveerde variantie is ware score variantie (S 02 = St2)
absolute baggertest : alle geobserveerde variantie is errorvariantie (S 02 = Se2)
echte test : ergens tussen deze twee extremen
4