TESTTHEORIE/PSYCHOMETRIE
Semester 1 – blok 2
COLLEGE 1
STATISTIEK BASISKENNIS
SIMPELE MATEN
Gemiddelde (x̄ ): alle scores opgeteld, gedeeld door N (aantal) scores
Deviatiescore ( x ¿ : afwijking van score van gemiddelde
zegt nog niks over of afwijking van gemiddelde groot of niet is
GESTANDAARDISEERDE MATEN
Sum of squares (SS): opgetelde gekwadrateerde deviatiescores = ∑ x 2
2
Variantie ( s x): het verschil/de spreiding in scores van de groep
2
= sum of squares gedeeld door N =
∑x
N
Bij steekproef niveau: delen door N
populatie niveau: delen door N-1
Standaarddeviatie ( s x): de gemiddelde afwijking van het gemiddelde
= wortel van variantie =
√ ∑
x2
N
Z-score ( z x ¿: hoeveel standaarddeviaties iemand afwijkt van een gemiddelde
x
= deviatiescore gedeeld door standaarddeviatie =
sx
SAMENHANG TUSSEN VERSCHILLENDE VARIABELEN
Covariantie ( S XY /C XY ¿: verschillen mensen op een manier die consistent is
= deviatie scores op X en Y keer elkaar, optellen van alle personen, en dan delen
door N
∑ xi y i
= probleem; ongestandaardiseerde maat, kan niks zeggen over of
N
variatie veel is of niet
Correlatie: gestandaardiseerde variant van covariantie
= covariantie gedeeld door standaarddeviatie van x keer standaarddeviatie van y
S XY
=
S X × SY
Variantie-covariantiematrix: tabel met varianties op de diagonale elementen
(linksboven naar rechtsonder) en covariantie op de buiten diagonale elementen
positive manifold: alle waardes in variantie-covariantiematrix zijn positief
Correlatiematrix: tabel met 1 op de diagonale elementen, en correlaties op de buiten
diagonale elementen
,COLLEGE 2
EIGENSCHAPPEN VAN TESTS EN ITEMS
PSYCHOLOGISCHE TESTEN
Cronbach: “a systematic procedure for comparing the behaviour of two or more people”
Vormen van een procedure:
Multiple choice vaardigheidstest
Open-ended persoonlijkheidsvragenlijst
Systematische gedragsobservatie
Rorschach inktvlekkentest
Cruciale eigenschappen:
Gericht op gedragsmeting (observeerbaar)
Systematisch (objectief); gericht en volgens een vast kader de meting
voortzetten
Vergelijken van verschillende personen/personen over tijd
TYPE TESTS
Tests voor prestatieniveau vs. gedragswijze: maximum versus typische performance
Prestatieniveautests voor meten vaardigheden
Gedragswijzetests voor meten o.a. persoonlijkheidseigenschappen & attitudes
Grote verschillen voor de aanpak bij de testontwikkeling
Nauwelijks verschillen voor statistische analyse van testscores
Types prestatieniveau testen: powertest en speedtest
Powertests meten vaardigheid zonder tijdsdruk
meer-vaardige personen maken meer vragen goed
Speedtests meten prestaties onder zware tijdsdruk; vragen zijn van triviale
moeilijkheid
meer-vaardige personen beantwoorden meer vragen
Bourdon dot concentration test: voorbeeld van speed test
zo snel mogelijk omcirkelen welke groepjes uit 4 punten bestaan
Normgericht vs. criteriumgerichte testen:
Normgerichte tests vergelijken personen met de rest van de populatie
goede normgegevens over deze populatie van groot belang
Criteriumgerichte tests vergelijken personen met een absolute standaard
testoordeel staat los van prestatieniveau in de populatie
bijv. een tentamen
WAT HOORT ER BIJ EEN PSYCHOLOGISCHE TEST?
3 componenten bij elke serieuze test:
1) Testmateriaal
2) Testformulieren; scoreblad
Itemscores worden zo bepaald dat ze indicatief zijn voor het te meten
construct: hogere itemscore = “hoger” op eigenschap
Beoordeling: van antwoord naar score
3) Testhandleiding
, Exacte testinstructie
Verwerkingsprocedure
Normtabellen
Bespreking van wetenschappelijke kwaliteiten
Testscore: is vaak de optelsom van itemscores
Belangrijkste uitkomst van de test die gebruikt wordt
Testhandleiding geeft instructies hoe de score geïnterpreteerd moet worden
Bij normgerichte tests zullen normgegevens geraadpleegd moeten worden
Meetniveau’s testscore:
o Nominaal: categorisatie, maar geen ordening van categorieën
bijv. persoonlijkheidstypes
o Ordinaal: categorisatie met ordening, maar geen duidelijkheid over afstand
tussen categorieën
bijv. korte Likertschalen
o Interval: kwantitatieve meting; er wordt waarde aan getallen toegekend, zonder
nulpunt
een toename van 1 punt moet altijd dezelfde toename in de te meten eigenschap
weerspiegelen
bijv. lange Likertschalen?
Eigenlijk bestaat deze niet in de praktijk, maar doen we alsof een testscore
van interval is
o Ratio: kwantitatief met betekenisvol nulpunt
bijv. Bourdon dot test?
Spreiding:
Testscore moet verschillen tussen mensen blootleggen; kan alleen als mensen in
testscores verschillen
Hoge mate van variantie in testscores is wenselijk
Testscore is opgebouwd uit de itemscores:
Hoge variantie op itemscores ook wenselijk
Hoge covariantie tussen itemscores ook wenselijk
Composiete score: samengestelde score; itemscores bij elkaar optellen testscore
2
Testscore-variantie: s x
2 2 2 2 2
s x= s x1 + s x2 + 2 s x1 s x 2
2 2 2 2 2 2 2 2 2 2
Of bij meer dan 2 variabelen: s x= s x1+ s x2 + s x3 + 2 s x1 s x 2 + 2 s x1 s x 3+ 2 s x2 s x 3
Testscore-variantie gaat omhoog als itemscore-variantie toeneemt
Vooronderzoek bij multiple-choice items:
MC items zijn dichotoom gescoord: goed = 1, fout = 0
P-waarde van een item geeft proportie correcte antwoorden aan
p = gemiddelde itemscore
q = 1 – p proportie incorrecte antwoorden op het item
q = a1 + a2 + a3
Idealiter p = q = 0.5 want dan maximale itemscore-variantie
P-waarde = gemiddelde itemscore
Semester 1 – blok 2
COLLEGE 1
STATISTIEK BASISKENNIS
SIMPELE MATEN
Gemiddelde (x̄ ): alle scores opgeteld, gedeeld door N (aantal) scores
Deviatiescore ( x ¿ : afwijking van score van gemiddelde
zegt nog niks over of afwijking van gemiddelde groot of niet is
GESTANDAARDISEERDE MATEN
Sum of squares (SS): opgetelde gekwadrateerde deviatiescores = ∑ x 2
2
Variantie ( s x): het verschil/de spreiding in scores van de groep
2
= sum of squares gedeeld door N =
∑x
N
Bij steekproef niveau: delen door N
populatie niveau: delen door N-1
Standaarddeviatie ( s x): de gemiddelde afwijking van het gemiddelde
= wortel van variantie =
√ ∑
x2
N
Z-score ( z x ¿: hoeveel standaarddeviaties iemand afwijkt van een gemiddelde
x
= deviatiescore gedeeld door standaarddeviatie =
sx
SAMENHANG TUSSEN VERSCHILLENDE VARIABELEN
Covariantie ( S XY /C XY ¿: verschillen mensen op een manier die consistent is
= deviatie scores op X en Y keer elkaar, optellen van alle personen, en dan delen
door N
∑ xi y i
= probleem; ongestandaardiseerde maat, kan niks zeggen over of
N
variatie veel is of niet
Correlatie: gestandaardiseerde variant van covariantie
= covariantie gedeeld door standaarddeviatie van x keer standaarddeviatie van y
S XY
=
S X × SY
Variantie-covariantiematrix: tabel met varianties op de diagonale elementen
(linksboven naar rechtsonder) en covariantie op de buiten diagonale elementen
positive manifold: alle waardes in variantie-covariantiematrix zijn positief
Correlatiematrix: tabel met 1 op de diagonale elementen, en correlaties op de buiten
diagonale elementen
,COLLEGE 2
EIGENSCHAPPEN VAN TESTS EN ITEMS
PSYCHOLOGISCHE TESTEN
Cronbach: “a systematic procedure for comparing the behaviour of two or more people”
Vormen van een procedure:
Multiple choice vaardigheidstest
Open-ended persoonlijkheidsvragenlijst
Systematische gedragsobservatie
Rorschach inktvlekkentest
Cruciale eigenschappen:
Gericht op gedragsmeting (observeerbaar)
Systematisch (objectief); gericht en volgens een vast kader de meting
voortzetten
Vergelijken van verschillende personen/personen over tijd
TYPE TESTS
Tests voor prestatieniveau vs. gedragswijze: maximum versus typische performance
Prestatieniveautests voor meten vaardigheden
Gedragswijzetests voor meten o.a. persoonlijkheidseigenschappen & attitudes
Grote verschillen voor de aanpak bij de testontwikkeling
Nauwelijks verschillen voor statistische analyse van testscores
Types prestatieniveau testen: powertest en speedtest
Powertests meten vaardigheid zonder tijdsdruk
meer-vaardige personen maken meer vragen goed
Speedtests meten prestaties onder zware tijdsdruk; vragen zijn van triviale
moeilijkheid
meer-vaardige personen beantwoorden meer vragen
Bourdon dot concentration test: voorbeeld van speed test
zo snel mogelijk omcirkelen welke groepjes uit 4 punten bestaan
Normgericht vs. criteriumgerichte testen:
Normgerichte tests vergelijken personen met de rest van de populatie
goede normgegevens over deze populatie van groot belang
Criteriumgerichte tests vergelijken personen met een absolute standaard
testoordeel staat los van prestatieniveau in de populatie
bijv. een tentamen
WAT HOORT ER BIJ EEN PSYCHOLOGISCHE TEST?
3 componenten bij elke serieuze test:
1) Testmateriaal
2) Testformulieren; scoreblad
Itemscores worden zo bepaald dat ze indicatief zijn voor het te meten
construct: hogere itemscore = “hoger” op eigenschap
Beoordeling: van antwoord naar score
3) Testhandleiding
, Exacte testinstructie
Verwerkingsprocedure
Normtabellen
Bespreking van wetenschappelijke kwaliteiten
Testscore: is vaak de optelsom van itemscores
Belangrijkste uitkomst van de test die gebruikt wordt
Testhandleiding geeft instructies hoe de score geïnterpreteerd moet worden
Bij normgerichte tests zullen normgegevens geraadpleegd moeten worden
Meetniveau’s testscore:
o Nominaal: categorisatie, maar geen ordening van categorieën
bijv. persoonlijkheidstypes
o Ordinaal: categorisatie met ordening, maar geen duidelijkheid over afstand
tussen categorieën
bijv. korte Likertschalen
o Interval: kwantitatieve meting; er wordt waarde aan getallen toegekend, zonder
nulpunt
een toename van 1 punt moet altijd dezelfde toename in de te meten eigenschap
weerspiegelen
bijv. lange Likertschalen?
Eigenlijk bestaat deze niet in de praktijk, maar doen we alsof een testscore
van interval is
o Ratio: kwantitatief met betekenisvol nulpunt
bijv. Bourdon dot test?
Spreiding:
Testscore moet verschillen tussen mensen blootleggen; kan alleen als mensen in
testscores verschillen
Hoge mate van variantie in testscores is wenselijk
Testscore is opgebouwd uit de itemscores:
Hoge variantie op itemscores ook wenselijk
Hoge covariantie tussen itemscores ook wenselijk
Composiete score: samengestelde score; itemscores bij elkaar optellen testscore
2
Testscore-variantie: s x
2 2 2 2 2
s x= s x1 + s x2 + 2 s x1 s x 2
2 2 2 2 2 2 2 2 2 2
Of bij meer dan 2 variabelen: s x= s x1+ s x2 + s x3 + 2 s x1 s x 2 + 2 s x1 s x 3+ 2 s x2 s x 3
Testscore-variantie gaat omhoog als itemscore-variantie toeneemt
Vooronderzoek bij multiple-choice items:
MC items zijn dichotoom gescoord: goed = 1, fout = 0
P-waarde van een item geeft proportie correcte antwoorden aan
p = gemiddelde itemscore
q = 1 – p proportie incorrecte antwoorden op het item
q = a1 + a2 + a3
Idealiter p = q = 0.5 want dan maximale itemscore-variantie
P-waarde = gemiddelde itemscore