Grondslagen Psychologische Diagnostiek en Testtheorie
Item-responsetheorie
Inhoud college
Onvolkomenheden van klassieke testtheorie
Item-responstheorie (model)
Dominantie en preferentiegegevens
Deterministisch en probabilistische model
Item-responsfunctie
Giskans, moeilijkheid, discriminatie
Globale afhankelijkheid
Lokale afhankelijkheid
Mokkenmodellen
o Monotone homogeniteit
o Dubbele monotonie
Informatiefunctie
Onvolkomenheden van de klassieke testtheorie
Testscore X (testscore) wordt bepaald door de latente of de ware score T en de toevallige meetfout E.
Schatting betrouwbaarheid testscore
o Afhankelijk van populatie
Theorie over testscores
o Weinig informatief over afzonderlijke items
Aanname over toevallige meetfout
o meetfout is onafhankelijk van niveau respondent
Aanname over meetniveau testscore
o Niet statistisch te toetsen (‘meten bij fiat’)
Beperkingen in vergelijken respondenten
o Betrouwbaar voor middengroepen
o Ontwikkeling (Xt2 – Xt1) lastig vast te stelle
Inefficiëntie
o Alle respondenten moeten hele test maken
Item-responstheorie (IRT)
De IRT komt tegemoet aan de onvolkomenheden KTT.
Schatting van psychometrische kenmerken van items en testscore is onafhankelijk van de
populatie (sample free of sample independent)
Theorie over itemscores in plaats van testscores
, Grondslagen Psychologische Diagnostiek en Testtheorie
Nauwkeurigheid van schatting (= betrouwbaarheid) kan binnen IRT variëren tussen
respondenten
Aannames over model(len) statistisch toetsbaar (‘meten bij implicatie’)
Op IRT gebaseerde tests maken beoordeling ontwikkeling beter mogelijk
Schatting vaardigheid onafhankelijk van verzameling items:
o Dit maakt testafname op maat (adaptief testen) mogelijk
Meetmodel voor itemscores
T = θ = theta
Factormodel voor
discrete en ordinale
itemresponsen.
Waargenomen itemscore Xk wordt bepaald door latente variabele T (latente trek of lattente klasse).
Continu Discreet
Item-responsfuncties
Kans op item goed (P (Xg = 1)) afgezet tegen latente trek θ .
Item-responsetheorie
Inhoud college
Onvolkomenheden van klassieke testtheorie
Item-responstheorie (model)
Dominantie en preferentiegegevens
Deterministisch en probabilistische model
Item-responsfunctie
Giskans, moeilijkheid, discriminatie
Globale afhankelijkheid
Lokale afhankelijkheid
Mokkenmodellen
o Monotone homogeniteit
o Dubbele monotonie
Informatiefunctie
Onvolkomenheden van de klassieke testtheorie
Testscore X (testscore) wordt bepaald door de latente of de ware score T en de toevallige meetfout E.
Schatting betrouwbaarheid testscore
o Afhankelijk van populatie
Theorie over testscores
o Weinig informatief over afzonderlijke items
Aanname over toevallige meetfout
o meetfout is onafhankelijk van niveau respondent
Aanname over meetniveau testscore
o Niet statistisch te toetsen (‘meten bij fiat’)
Beperkingen in vergelijken respondenten
o Betrouwbaar voor middengroepen
o Ontwikkeling (Xt2 – Xt1) lastig vast te stelle
Inefficiëntie
o Alle respondenten moeten hele test maken
Item-responstheorie (IRT)
De IRT komt tegemoet aan de onvolkomenheden KTT.
Schatting van psychometrische kenmerken van items en testscore is onafhankelijk van de
populatie (sample free of sample independent)
Theorie over itemscores in plaats van testscores
, Grondslagen Psychologische Diagnostiek en Testtheorie
Nauwkeurigheid van schatting (= betrouwbaarheid) kan binnen IRT variëren tussen
respondenten
Aannames over model(len) statistisch toetsbaar (‘meten bij implicatie’)
Op IRT gebaseerde tests maken beoordeling ontwikkeling beter mogelijk
Schatting vaardigheid onafhankelijk van verzameling items:
o Dit maakt testafname op maat (adaptief testen) mogelijk
Meetmodel voor itemscores
T = θ = theta
Factormodel voor
discrete en ordinale
itemresponsen.
Waargenomen itemscore Xk wordt bepaald door latente variabele T (latente trek of lattente klasse).
Continu Discreet
Item-responsfuncties
Kans op item goed (P (Xg = 1)) afgezet tegen latente trek θ .