Samenvatting Testtheorie
Maud Noordhuis
Samenvatting van Testtheorie: Inleiding in de theorie van de psychologische test en
zijn toepassingen van professor Drenth & Sijtsma inclusief alle belangrijke informatie
uit de colleges
H1 - Historische ontwikkeling van het testen
Testdiagnostiek
20e eeuw in bloei, maar ook in de oudheid al vormen van testgebruik
- in het oude testament staat zelfs een voorbeeld van een persoonlijkheidstest
- in de middeleeuwen probeerden mensen intellectuele en
karaktereigenschappen te meten via fysieke uiterlijke kenmerken
pas in de 20e eeuw kwam er een wetenschappelijke aandacht voor testen om in
plaats van intuïtief een systematisch oordeel te vellen
Vier perioden in het ontstaan van wetenschappelijk testen
1. Periode tot het verschijnen van de Binet-Simon Test
Binet-Simon Test: de eerste waardevolle intelligentietest in 1905
- Voordat deze ontstond waren er verschillende ontwikkelingen vanuit de
psychiatrie
- 1794: Pinet verwijderde boeien en ketens van krankzinnigen, met het
idee dat ze geen criminelen waren maar ziek
- 1838: Esquirol schreef over geestesziekten en maakte onderscheid
tussen krankzinnigen en zwakzinnigen
- 1848: Seguin probeerde zwakzinnige kinderen te trainen via
motorische en sensorische functies
- hieruit otstond de performance test = Seguin Form Board
- 1885: Rieger doet voorstel tot een algemeen toepasbare methode voor
intelligentieonderzoek
- 1897: Ebbinghaus probeert psychologische vermoeidheid te meten met
een test die functioneerde als intelligentietest
- Andere ontwikkelingen verliepen via de experimentele psychologie, vooral in
Duitsland wat de werking op testpsychologie zowel stimuleerde als remde
- Dit komt doordat Experimentele psychologie vooral exacte controle
wilde en verschillen tussen proefpersonen zag als ruis, terwijl
testpsychologie juist geïnteresseerd is in die verschillen
- 1879: Wundt start zijn experimentele laboratorium in Leipzig wat de
start van systematisch experimenteel onderzoek was
- problemen bleven generaliseerbaarheid van testresultaten en
beperkt onderzoek tot sensorische en motorische functies enkel
- hogere cognitieve processen bleven buiten beschouwing
, - 1890: Cattell publiceerde een artikel in Mind waarin voor het eerst het
woord test voorkwam waaruit belangstelling voor individuele verschillen
ontstond
- 1893: een commissie ontstaat binnen de American Psychological
Association met als doel het registreren van test en formuleren van
gebruiksmogelijkheden
- Een derde lijn van ontwikkelingen heeft betrekking tot de genetica
- 1882: Galton de bioloog verrichte antropometrische onderzoekingen
gericht op lichamelijke, sensorische en geestelijke functies
- Galton werd geïnspireerd door de interesse van Cattell in
individuele verschillen
- Ook zag hij de noodzaak van systematisering van
onderzoekstechnieken
- Galton deed een eerste poging om onderzoeksresultaten uit te
drukken in termen van ‘afwijkingen van het gemiddelde’, dus in
statistische termen
- Pearson: jongere collega van Galton bedacht de correlatiecoëfficiënt
- 1859: Darwin beschrijft in het boek the origin of species het probleem
van erfelijkheid van lichamelijke eigenschappen (Galton was zijn neef!)
Samengevat wordt deze periode dus gekenmerkt door de behoefte van psychiatrie
aan diagnosemogelijkheden, de voorkeur van experimentele psychologie voor een
gestandaardiseerde onderzoeksprocedure en de interesse van de genetica in
individuele verschillen
2. Periode tussen het verschijnen van Binet-Simon test en de eerste wereldoorlog
In 1904 kreeg Binet (directeur laboratorium) een verzoek om onderzoek te doen naar
differentiatie tussen luie en incapabele kinderen door het ministerie van onderwijs
- Binet en zijn medewerker Simon maakten dertig opgaven die een beroep
deden op praktische, alledaagse, schoolse kwaliteiten van kinderen in plaats
van pure basisvaardigheden
- bijvoorbeeld het benoemen van objecten, aanvullen van zinnen en het
begrijpen van verhaaltjes
Deze Binet-Simon test is vernieuwend omdat:
- accentuatie op complexe in plaats van eenvoudige mentale processen
- aandacht op begrip, geheugen, probleemoplossen en verbeelding
- empirisch uitgangspunt
In de tweede versie van de test kwam als eerste het begrip ‘mentale leeftijd’ naar
voren wat erg praktisch nuttig bleek als indicatie van geestelijke groei
Andere ontwikkelingen die volgden na het ontstaan van deze test:
- 1924: Claparede stichtte het Jean Jaques Rousseau instituut dat testen
ontwikkelde en toepaste
- Bobertag vertaalde de Binet-Simon test in het Duits
- Terman: hoogleraar aan de universiteit van Stanford maakte een
Amerikaanse versie van deze test
, - de Stanford-Binet test: met standaardinstructies (generaliseerbaarheid)
en constructie van normen gebaseerd op een representatieve
steekproef = erg belangrijk
- ook kwam de praktische indicatie van de mentale leeftijd die iets kon
zeggen over het intelligentieniveau van het onderzochte kind
Binets test was vooral praktisch toepasbaar voor intelligentieonderzoek en niet perse
theoretisch.
- het was het begin van onderzoek naar een algemene intelligentiefactor =
g-factor
Theoretisch onderzoek van Spearman leidde tot een belangrijke theorie:
- de twee-factorentheorie (g-factor en s-factor)
- die later door Thurstone met een multi factorentheorie werd bestreden
- Thorndike en Burt kwamen met de eerste onderwijs-prestatietests om slecht
presterende leerlingen te kunnen vergelijken
Grote vooruitgang werd geboekt door de ideeën van Binet en Simon, maar
grootschalig klassikaal testen en systematisch valideringsonderzoek kwamen pas na
de Eerste Wereldoorlog op gang.
3. Periode van begin eerste wereldoorlog tot de tweede wereldoorlog
Door WO1 kwam er heel snel heel veel testontwikkeling omdat mensen geselecteerd
moesten worden voor functies en opleidingen van defensie.
- denk aan chauffeurs, piloten en vliegtuigherkenners
- voor het eerst werd psychologie heel veel toegepast buiten het laboratorium
en speelde het een rol in de beslissingsproblematiek van selectie en plaatsing
- het leidde tot de eerste bedrijfspsycholoog Münsterberg
- Er zat veel haast achter het testen maar het moest wel efficient dus ontstond
de Army Alpha
- rekenopgaven, denksommen en aangeven van woordbetekenissen om
heel snel het intelligentieniveau van grote groepen deelnemers te
bepalen
- bleek een betrouwbare test
Na de wereldoorlog waren Europa en Amerika gefocust op verschillende onderdelen
van de psychologie:
- Europa: filosofische klimaat, gedomineerd door Gestaltpsychologie,
personalisme en fenomenologie, de individuele diagnostiek
- Engeland: tussenpositie VS en Europa met nadruk op groepstests met veel
aandacht voor objectieve evaluatie van schoolprestaties via meerkeuzetests
in plaats van open vragen (subjectief)
- constructie en normering van tests verschoof van docenten naar
specialisten
- Amerika: behavioristisch-positivistische achtergrond, praktische behoefte, het
accent ligt op kwantitatief verwerkbare groepstests
- ook door het toenemend aantal immigranten die rationeel in de
maatschappij moesten worden geïntegreerd
, - maar hoe kun je een generaliseerbare test maken voor immigranten
als zij een andere taal spreken? -> behoefte aan cross-culturele tests
- Army Beta: geïnstrueerd via gebaren en geen beroep op enige taal- kennis of
verbale vaardigheid.
- ideaal voor algemeen vergelijkend onderzoek tussen
bevolkingsgroepen, wel minder betrouwbaar dan verbale tests
Deze tests vormden weer de basis voor onderzoek naar verschillen tussen volken
maar ook in intelligentieonderzoek van gehandicapten
Belangrijkste testen die in deze tijd ontstonden in Amerika (weliswaar individuele
tests):
- Terman Merrill (de versie uit 1937 van de Stanford-Binet),
- de Wechsler series (wais, wisc; publicaties van Wechsler, 1949; 1955a, b).
Veel tests werden al gebruikt zonder duidelijke theoretische achtergrond
- Thurstone: benadrukt belang van kritische evaluatie van tests
- tests moeten betrouwbare scores opleveren en een voorspelling doen
van gedrag buiten de testsituatie = criteriumgedrag
- Hierdoor werd statistiek belangrijk in de testpsychologie
- vooral met het oog op de kwantificeerbaarheid van prestaties voor
zinvol testgebruik
- Belangrijke invloeden:
- Kelly (1923), Guilford (1936) -> statistiekboeken
- Thurstone (1931, 1935) -> publicaties over factoranalyse
Er kwam een nieuwe dimensie in intelligentieonderzoek: groepsfactoren
- Onderzoekers (Kelly, Thurstone, Guilford, Thomson, Holzinger & Harman)
introduceerden groepsfactoren waardoor er een analyse kon worden
gedaan van intelligentie per factor in plaats van 1 totaalscore voor intelligentie
- intelligentie is een complex geheel van alle algemene factoren,
specifieke factoren en groepsfactoren
- groepsfactor: gemeenschappelijk aan sommige, maar niet alle tests,
een structurele opvatting van intelligentie
- Thurstone's groepsfactoren: Verbal comprehension, Word fluency, Number
facility, Spatial visualization, Associative memory, Perceptual speed,
Reasoning
- deze spelen nog steeds een rol in testbatterijen voor intelligentie
Het ontstaan en de ontwikkeling van persoonlijkheidstest: 3 manieren
1. Observatiemethode (vooral in West Europa):
- gericht op de kwalitatieve aspecten van prestaties en gedrag en het
observeren van typerend gedrag van de proefpersoon
- niet echt betrouwbaar en niet echt objectief, juist intuitief
2. Persoonlijkheidsvragenlijsten: Ontstonden rond de Eerste Wereldoorlog
voor systematische verzameling van gegevens
- zijn eigenlijk gestandaardiseerde, schriftelijke psychiatrische interviews
- voorlopers van moderne vragenlijsten over persoonlijkheid, interesse,
waarden en attitudes
Maud Noordhuis
Samenvatting van Testtheorie: Inleiding in de theorie van de psychologische test en
zijn toepassingen van professor Drenth & Sijtsma inclusief alle belangrijke informatie
uit de colleges
H1 - Historische ontwikkeling van het testen
Testdiagnostiek
20e eeuw in bloei, maar ook in de oudheid al vormen van testgebruik
- in het oude testament staat zelfs een voorbeeld van een persoonlijkheidstest
- in de middeleeuwen probeerden mensen intellectuele en
karaktereigenschappen te meten via fysieke uiterlijke kenmerken
pas in de 20e eeuw kwam er een wetenschappelijke aandacht voor testen om in
plaats van intuïtief een systematisch oordeel te vellen
Vier perioden in het ontstaan van wetenschappelijk testen
1. Periode tot het verschijnen van de Binet-Simon Test
Binet-Simon Test: de eerste waardevolle intelligentietest in 1905
- Voordat deze ontstond waren er verschillende ontwikkelingen vanuit de
psychiatrie
- 1794: Pinet verwijderde boeien en ketens van krankzinnigen, met het
idee dat ze geen criminelen waren maar ziek
- 1838: Esquirol schreef over geestesziekten en maakte onderscheid
tussen krankzinnigen en zwakzinnigen
- 1848: Seguin probeerde zwakzinnige kinderen te trainen via
motorische en sensorische functies
- hieruit otstond de performance test = Seguin Form Board
- 1885: Rieger doet voorstel tot een algemeen toepasbare methode voor
intelligentieonderzoek
- 1897: Ebbinghaus probeert psychologische vermoeidheid te meten met
een test die functioneerde als intelligentietest
- Andere ontwikkelingen verliepen via de experimentele psychologie, vooral in
Duitsland wat de werking op testpsychologie zowel stimuleerde als remde
- Dit komt doordat Experimentele psychologie vooral exacte controle
wilde en verschillen tussen proefpersonen zag als ruis, terwijl
testpsychologie juist geïnteresseerd is in die verschillen
- 1879: Wundt start zijn experimentele laboratorium in Leipzig wat de
start van systematisch experimenteel onderzoek was
- problemen bleven generaliseerbaarheid van testresultaten en
beperkt onderzoek tot sensorische en motorische functies enkel
- hogere cognitieve processen bleven buiten beschouwing
, - 1890: Cattell publiceerde een artikel in Mind waarin voor het eerst het
woord test voorkwam waaruit belangstelling voor individuele verschillen
ontstond
- 1893: een commissie ontstaat binnen de American Psychological
Association met als doel het registreren van test en formuleren van
gebruiksmogelijkheden
- Een derde lijn van ontwikkelingen heeft betrekking tot de genetica
- 1882: Galton de bioloog verrichte antropometrische onderzoekingen
gericht op lichamelijke, sensorische en geestelijke functies
- Galton werd geïnspireerd door de interesse van Cattell in
individuele verschillen
- Ook zag hij de noodzaak van systematisering van
onderzoekstechnieken
- Galton deed een eerste poging om onderzoeksresultaten uit te
drukken in termen van ‘afwijkingen van het gemiddelde’, dus in
statistische termen
- Pearson: jongere collega van Galton bedacht de correlatiecoëfficiënt
- 1859: Darwin beschrijft in het boek the origin of species het probleem
van erfelijkheid van lichamelijke eigenschappen (Galton was zijn neef!)
Samengevat wordt deze periode dus gekenmerkt door de behoefte van psychiatrie
aan diagnosemogelijkheden, de voorkeur van experimentele psychologie voor een
gestandaardiseerde onderzoeksprocedure en de interesse van de genetica in
individuele verschillen
2. Periode tussen het verschijnen van Binet-Simon test en de eerste wereldoorlog
In 1904 kreeg Binet (directeur laboratorium) een verzoek om onderzoek te doen naar
differentiatie tussen luie en incapabele kinderen door het ministerie van onderwijs
- Binet en zijn medewerker Simon maakten dertig opgaven die een beroep
deden op praktische, alledaagse, schoolse kwaliteiten van kinderen in plaats
van pure basisvaardigheden
- bijvoorbeeld het benoemen van objecten, aanvullen van zinnen en het
begrijpen van verhaaltjes
Deze Binet-Simon test is vernieuwend omdat:
- accentuatie op complexe in plaats van eenvoudige mentale processen
- aandacht op begrip, geheugen, probleemoplossen en verbeelding
- empirisch uitgangspunt
In de tweede versie van de test kwam als eerste het begrip ‘mentale leeftijd’ naar
voren wat erg praktisch nuttig bleek als indicatie van geestelijke groei
Andere ontwikkelingen die volgden na het ontstaan van deze test:
- 1924: Claparede stichtte het Jean Jaques Rousseau instituut dat testen
ontwikkelde en toepaste
- Bobertag vertaalde de Binet-Simon test in het Duits
- Terman: hoogleraar aan de universiteit van Stanford maakte een
Amerikaanse versie van deze test
, - de Stanford-Binet test: met standaardinstructies (generaliseerbaarheid)
en constructie van normen gebaseerd op een representatieve
steekproef = erg belangrijk
- ook kwam de praktische indicatie van de mentale leeftijd die iets kon
zeggen over het intelligentieniveau van het onderzochte kind
Binets test was vooral praktisch toepasbaar voor intelligentieonderzoek en niet perse
theoretisch.
- het was het begin van onderzoek naar een algemene intelligentiefactor =
g-factor
Theoretisch onderzoek van Spearman leidde tot een belangrijke theorie:
- de twee-factorentheorie (g-factor en s-factor)
- die later door Thurstone met een multi factorentheorie werd bestreden
- Thorndike en Burt kwamen met de eerste onderwijs-prestatietests om slecht
presterende leerlingen te kunnen vergelijken
Grote vooruitgang werd geboekt door de ideeën van Binet en Simon, maar
grootschalig klassikaal testen en systematisch valideringsonderzoek kwamen pas na
de Eerste Wereldoorlog op gang.
3. Periode van begin eerste wereldoorlog tot de tweede wereldoorlog
Door WO1 kwam er heel snel heel veel testontwikkeling omdat mensen geselecteerd
moesten worden voor functies en opleidingen van defensie.
- denk aan chauffeurs, piloten en vliegtuigherkenners
- voor het eerst werd psychologie heel veel toegepast buiten het laboratorium
en speelde het een rol in de beslissingsproblematiek van selectie en plaatsing
- het leidde tot de eerste bedrijfspsycholoog Münsterberg
- Er zat veel haast achter het testen maar het moest wel efficient dus ontstond
de Army Alpha
- rekenopgaven, denksommen en aangeven van woordbetekenissen om
heel snel het intelligentieniveau van grote groepen deelnemers te
bepalen
- bleek een betrouwbare test
Na de wereldoorlog waren Europa en Amerika gefocust op verschillende onderdelen
van de psychologie:
- Europa: filosofische klimaat, gedomineerd door Gestaltpsychologie,
personalisme en fenomenologie, de individuele diagnostiek
- Engeland: tussenpositie VS en Europa met nadruk op groepstests met veel
aandacht voor objectieve evaluatie van schoolprestaties via meerkeuzetests
in plaats van open vragen (subjectief)
- constructie en normering van tests verschoof van docenten naar
specialisten
- Amerika: behavioristisch-positivistische achtergrond, praktische behoefte, het
accent ligt op kwantitatief verwerkbare groepstests
- ook door het toenemend aantal immigranten die rationeel in de
maatschappij moesten worden geïntegreerd
, - maar hoe kun je een generaliseerbare test maken voor immigranten
als zij een andere taal spreken? -> behoefte aan cross-culturele tests
- Army Beta: geïnstrueerd via gebaren en geen beroep op enige taal- kennis of
verbale vaardigheid.
- ideaal voor algemeen vergelijkend onderzoek tussen
bevolkingsgroepen, wel minder betrouwbaar dan verbale tests
Deze tests vormden weer de basis voor onderzoek naar verschillen tussen volken
maar ook in intelligentieonderzoek van gehandicapten
Belangrijkste testen die in deze tijd ontstonden in Amerika (weliswaar individuele
tests):
- Terman Merrill (de versie uit 1937 van de Stanford-Binet),
- de Wechsler series (wais, wisc; publicaties van Wechsler, 1949; 1955a, b).
Veel tests werden al gebruikt zonder duidelijke theoretische achtergrond
- Thurstone: benadrukt belang van kritische evaluatie van tests
- tests moeten betrouwbare scores opleveren en een voorspelling doen
van gedrag buiten de testsituatie = criteriumgedrag
- Hierdoor werd statistiek belangrijk in de testpsychologie
- vooral met het oog op de kwantificeerbaarheid van prestaties voor
zinvol testgebruik
- Belangrijke invloeden:
- Kelly (1923), Guilford (1936) -> statistiekboeken
- Thurstone (1931, 1935) -> publicaties over factoranalyse
Er kwam een nieuwe dimensie in intelligentieonderzoek: groepsfactoren
- Onderzoekers (Kelly, Thurstone, Guilford, Thomson, Holzinger & Harman)
introduceerden groepsfactoren waardoor er een analyse kon worden
gedaan van intelligentie per factor in plaats van 1 totaalscore voor intelligentie
- intelligentie is een complex geheel van alle algemene factoren,
specifieke factoren en groepsfactoren
- groepsfactor: gemeenschappelijk aan sommige, maar niet alle tests,
een structurele opvatting van intelligentie
- Thurstone's groepsfactoren: Verbal comprehension, Word fluency, Number
facility, Spatial visualization, Associative memory, Perceptual speed,
Reasoning
- deze spelen nog steeds een rol in testbatterijen voor intelligentie
Het ontstaan en de ontwikkeling van persoonlijkheidstest: 3 manieren
1. Observatiemethode (vooral in West Europa):
- gericht op de kwalitatieve aspecten van prestaties en gedrag en het
observeren van typerend gedrag van de proefpersoon
- niet echt betrouwbaar en niet echt objectief, juist intuitief
2. Persoonlijkheidsvragenlijsten: Ontstonden rond de Eerste Wereldoorlog
voor systematische verzameling van gegevens
- zijn eigenlijk gestandaardiseerde, schriftelijke psychiatrische interviews
- voorlopers van moderne vragenlijsten over persoonlijkheid, interesse,
waarden en attitudes