Drenth & Sijtsma
Hoofdstuk: 1, 2, 5, 6, 7, 8 en 9
Field
Hoofdstuk: 17
Tentamen donderdag 12 maart 13.30 – 16.30
,Hoofdstuk 1 Historische ontwikkeling van het testen
Al duizenden jaren voor Christus zijn voorbeelden te vinden van testonderzoek
Bijv. Gideon: reduceert zijn leger door zelfbeoordeling (angstige weg) en door een test voor
gedragswijze water drinken uit beek door likken of met handen. Likken is moedig dus die bleven.
In begin twintigste eeuw ontstaat meer wetenschappelijke aandacht voor tests, gaat om een
systematische bestudering en ook een empirische fundering van het instrument dat voor die
oordeelsvorming wordt gebruikt.
Onderscheid in vier perioden, waarbij elke periode ingeluid wordt door een voor de ontwikkeling van
testen belangrijke gebeurtenis:
Periode van het verschijnen van de Binet-Simon test
Ontwikkelingen die vooraf gingen aan de eerste waardevolle intelligentietest, de Binet-Simon-test.
- Vanuit de psychiatrie: Er kwam meer aandacht voor geestenzieken en krankzinnige, dat deze
mensen niet ziek of misdadig waren. Bekende namen: Pinel, Esquirol, Séguin, Charcot, Janet,
Ribot, Rieger, Kraepelin, Ebbinghaus en uiteindelijk Alfred Binet.
- Experimentele psychologie:
Stimulans voor testpsychologie door waarde hechten aan de exacte beschrijving van
experimenteerconditites, controle van de variabelen en de nauwkeurige verwerking van de
uitkomsten. Maar remmende werking omdat de experimentator de verschillen tussen
proefpersonen vervelend vond, deze werden toegeschreven aan fouten in plaats van aan
verschillen in vaardigheid tussen de proefpersonen (waar het om gaat!).
Later gelukkig wel aandacht voor systematisch onderzoek van individuele verschillen.
- Genetica: interesse in de lichamelijke, sensorische en geestelijke functies. Galton: ook
geïnteresseerd in de erfelijkheid van psychische eigenschappen. Drie elementen in zijn wijze
van onderzoeken die een pijler van het wetenschappelijk testonderzoek zouden gaan
vormen:
1. de wenselijkheid van het onderzoek van individuele verschillen
2. De noodzaak van systematisering van de onderzoekstechnieken
3. de resultaten van onderzoeken uit te drukken in termen van afwijkingen van het
gemiddelde.
(Pearson raakte geïnspireerd door Galton en heeft veel voor statistiek betekent)
Periode tussen het verschijnen van de Binet-Simon-Test en de Eerste Wereldoorlog
In 1904 ontwikkelde Binet een test om onderscheid te maken tussen luie kinderen en incapabele
kinderen. Zijn benadering was nieuw, omdat: hij accentueerde complexe i.p.v. eenvoudige mentale
processen, hij toetste zijn ideeën aan empirie en het stelde voor om een totaalscore te gebruiken om
het intelligentieniveau weer te geven. In 1908 is een tweede en in 1911 een derde versie verschenen.
Stanford-Binet test (1916): er werden standaardinstructies geformuleerd en er werden normen
geconstrueerd.
Het testen op grote schaal (klassikaal) en valideringsonderzoek, waarin de samenhang van
testuitslagen met latere prestaties wordt onderzocht en waarbij men op basis daarvan tests
selecteert en weegt, was voor de Eerste Wereldoorlog nog geen sprake.
,Periode van het begin van de Eerste tot de Tweede Wereldoorlog
Door oorlog noodzaak om grote groepen mensen te selecteren voor functies en opleidingen in het
leger, kwam ontwikkeling van testen in een stroomversnelling.
Door WO1 erkenning van de psychologische test als een instrument dat een positieve bijdrage kan
leveren in velerlei beslissingssituaties.
Individuele testen waren tijdrovend, om snel en efficiënt te tesen ontwikkelde groepsgewijze af te
nemen tests.
Observatietests omdat door Gestaltpsychologie, personalisme en fenomenologie de wijze waarop
proefpersonen de taak verrichten (werkhouding, houding tegenover prestaties) net zo belangrijk is
als prestatie zelf.
Niet-verbale tests, omdat er immigranten waren die een test af moesten leggen, maar de taal van de
test niet kenden. Betrouwbaarheid was minder.
Thurstone (1931) kwantificeerbaarheid van de testprestatie werd een noodzakelijke voorwaarde
voor nuttig testgebruik.
Ontwikkeling van de persoonlijkheidstest:
- Observatietests: om inzicht te geven in de kwalitatieve aspecten van de prestatie.
- Persoonlijkheidsvragenlijsten
- Projectietests: persoon wordt stimulus aangeboden waarop hij vrij mag reageren. De
psycholoog interpreteert de reacties.
Periode van het begin van de Tweede Wereldoorlog tot heden
Expansie op alle terreinen; aantal beschikbare tests nam toe en er vond een sterke kritische
bezinning plaats op de methodologische grondslagen van testgebruik.
1947 Educational Testing Service (ETS): met deze organisatie tegemoetkomen aan de behoeften van
het Amerikaanse onderwijs veld wat betreft toelating tot en evaluatie van het onderwijs.
De Nederlandse CITO was geïnspireerd door ETS.
Samen met de groei van het aantal tests ging ook een diepgaande bezinning op de theoretische
achtergronden gepaard, vele tijdschriften en boeken zijn verschenen.
Een andere oorzaak van de versnelde testontwikkeling en testresearch is de ontwikkeling en uitbouw
van de verwerking van testgegevens per computer.
Ontwikkelingen in Europa, vooral in Nederland
In de jaren veertig en vijftig oriëntatie van de psychologie op intuïtie van psycholoog en nauwelijks
ruimte voor een objectieve, kwantitatieve benadering.
Testtheorie kreeg een impuls door de vele onderzoekers en boeken die ervan verschenen (Kouwer,
De Groot, Van deGeer, Van der Heijden, Sijtsma, Van der Giessen, Kouwers, Linschotens, Drenth).
De beoordeling van schoolprestaties vond eerst plaats door proefwerken, de landelijke examens
hadden waren geen goede schoolvorderingentest. CITO zorgt voor toetsconstructie op grote
schaal.
Constatering: de testtheorie, de testconstructie en het testgebruik in Nederland hebben vanaf de
jaren zestig van de twintigste eeuw een hoge vlucht genomen. Daarmee heeft de psychologische test
definitief een wetenschappelijk verdedigbare plaats veroverd in de Nederlandse psychologie.
,Hoofdstuk 2 Definitie, kenmerken en toepassingen van de test
Een test bestaat uit:
- Testmateriaal: testboekje, puzzelmateriaal, tekenpapier, vrije discussie
- Testformulieren: hierop worden de antwoorden, reacties of gedragsgegevens verzameld.
- Testhandleiding, die bevat: testinstructie, verwerkingsprocedure, normtabellen en
bespreking van de wetenschappelijke kwaliteiten van de test.
De bedoeling van het testonderzoek is het doen van een uitspraak die een voorspelling, classificatie
of beschrijving met betrekking tot het onderzochte individu behelst.
Psychologische test: een systematisch onderzoek van gedrag met behulp van speciaal geselecteerde
vragen of opgaven, met de bedoeling inzicht te krijgen in een psychologisch kenmerk van de
onderzochte in vergelijking met anderen.
Maar is het wel nodig om een test te gebruiken terwijl er in de dagelijkse praktijk zoveel andere
methoden bestaan die een bijdrage leveren tot het inzicht in de eigenschappen van een persoon?
Kenmerken van een test
Door ervaring kent men vaak al juiste oordelen zonder dat deze op een test zijn gebaseerd. Maar het
gebruik van een test is gerechtvaardigd al dit een juister beeld oplevert, of een aanvulling of
verbetering.
Zes kenmerken van een goede test
- Efficiëntie: men hoeft niet te wachten op een toevallige situatie waaruit een aanwijzing voor
gedrag blijkt, maar kan met een test onderzoeken of dit gedrag aanwezig is.
- Standaardisatie: bij een goede test wordt vergelijkbaarheid van prestaties bereikt door de
condities en invloeden die op de testprestatie kunnen inwerken zo veel mogelijk te
standaardiseren. Een test heeft een standaardisatie eis.
- Normering: het exact vergelijken is bij een voorwetenschappelijke beoordeling lastig,
daarom normeringsonderzoek. De eenvoudigste vorm is rangorde, van goede tot slechte
prestaties.
De rangorde verdeling zou benadert kunnen worden als een normaalverdeling met een
gemiddelde en een spreiding (stand. Dev).
De beschikbaarheid voor normen is meestal een noodzakelijke voorwaarde voor het gebruik
van een test.
- Objectiviteit: de onafhankelijkheid van storende invloeden vanuit de persoon van de
waarnemer, beoordelaar of interpretator.
Bij objectiviteit is het resultaat van het onderzoek onafhankelijk van degene die de gegevens
verzameld of uitwerkt. Het moet dus niet uitmaken die de beoordelaar is en objectiviteit
impliceert openheid en reproduceerbaarheid van de test en evaluatieprocedure.
Onafhankelijkheid betekent dat beoordelaars niet overleggen en geen weet hebben van
elkaars oordelen. De mate van overeenstemming van hun resultaten,
interbeoordelaarsbetrouwbaarheid, geeft dan de mate van objectiviteit van de procedure
aan.
Interbeoordelaarsbetrouwbaarheid: Twee beoordelaars beoordelen 40 kinderen
, Interbeoordelaarsbetrouwbaarheid uitdrukken in rangcorrelatie, wanneer beide
beoordelaars een rangorde produceren. Hiervoor kan Spearmans rangcorrelatie
gebruikt worden.
Interbeoordelaarsbetrouwbaarheid uitdrukken in Cohens kappa.
Po = kans op overeenstemming 25x met elkaar eens Po = 25/40 = .0625
Pt = toevalskans, kans op overeenstemming als er geen samenhang zou zijn en
beoordelaars hun persoonlijke frequentieverdelingen aanhouden.
K = Po – Pt Maximum is 1, dan is er perfecte overeenstemming
1 – Pt
- Betrouwbaarheid: een test is betrouwbaar als bij herhaalde metingen steeds (ongeveer)
dezelfde resultaten naar voren komen. We gaan ervan uit dat herhaling onder dezelfde
condities plaatsvinden.
Kwantitatieve maat voor betrouwbaarheid: rangordes met elkaar vergelijken en uit drukken
in rangcorrelatie. Een hoge correlatie wijst dan op hoge betrouwbaarheid.
- Validiteit: meet de test daadwerkelijk wat je wilt weten?
Meten van eigenschappen door middel van tests
Meten: zodra getallen volgens een consistente procedure aan objecten worden toegekend.
Vier meetniveaus:
- Nominale schaal: er worden getallen aan categorieën of objecten toegekend om
onderscheid te maken. Met deze getallen mag je niet zomaar rekenen!
Bijv. rugnummers bij voetballers, mannen en vrouwen met 0 en 1, groepen onderscheiden
met 1 (concentratiestoornis), 2 (dyslexie) en 3 (geen stoornis).
- Ordinale schaal: deze schaal geeft een rangorde aan, de keuze van getallen is vrij zolang de
rangorde juist blijft. Ook hier mogen niet zomaar alle rekenkundige bewerkingen uitgevoerd
worden.
- Intervalschaal: de verschillende posities zijn geordend en de afstanden tussen de
verschillende posities hebben betekenis.
De intervalschaal heeft geen absoluut maar een arbitrair nulpunt. 0 is het punt ten opzichte
waarvan men zich als het ware oriënteert. Bijv. de temperatuurschalen Celsius en Fahrenheit,
bij Celsius is 0 graden het bevriespunt van water. Temperatuur kan ook onder 0 liggen.
De meetwaarden van vaste paren van objecten blijft constant als men het nulpunt van de
schaal over een afstand a zou verschuiven en de eenheid met een factor b zou
vermenigvuldigen.
Bewerkingen als optellen, aftrekken, gemiddelde, variantie en correlatie berekenen kan met
testscores op intervalschaal. Ook kunnen meetwaarden zich verhouden tot elkaar binnen
een specifieke schaal, 10 graden Celsius is twee keer zo warm als 5 graden Celsius.
- Verhoudingsschaal: ratioschaal: deze schaal heeft eenheden waarmee afstanden kunnen
worden aangegeven en het nulpunt is absoluut. Hierdoor zijn alle rekenkundige bewerkingen
toegestaan. Voor verhoudingsschalen geldt transformatie Y =bX
Stok van 80 cm is 2x zo lang als een stok van 40 cm. En een stok van 8 dm is nog steeds 2x zo
langs als een stok van 4 dm.
Procedure voor het meten van psychologische eigenschappen
Je kan pas van meten spreken als vanuit een telling een conclusie volgt over de eigenschap in