Hoofdstuk 10: Betrouwbaarheid van
meetinstrumenten
1. Kappa
Kappa: mate van overeenkomst bij categorische variabelen.
- Validiteit: overeenkomst met criterium
- Test-hertest betrouwbaarheid
- Inter-of intrabeoordelaars betrouwbaarheid
Inter: verschillende beoordelaars ingeschakeld om een meting te doen, ze
moeten het volgens dezelfde manier gaan uitvoeren.
Intra: binnen dezelfde beoordelaar, hij moet tot hetzelfde resultaat komen als hij
verschillende metingen uitvoert.
Interpretatie kapa:
<0.4= overeenkomst is matig, slecht.
Tussen 0.41 en 0.7= een redelijke overeenkomst
>0.7= de overeenkomst is goed.
Voorbeeld: validiteit van vragenlijst nagaan
Mensen gaan hun fysieke activiteit overschatten via een vragenlijst. Wat is de
validiteit van onze vragenlijst als we dit gaan vergelijken met een golden
standaard (versnellingsmeter die mensen dragen: objectiveren).
1
, Tegenover de golden standaard gaan we de validiteit gaan vergelijken met onze
vragenlijst.
Hebben we dezelfde resultaten/ gelijkaardige resultaten bij onze vragenlijst en bij
de meter?
Is er voldoende overeenkomst tussen beide metingen?
Zelf berekenen:
Via SPSS:
2
meetinstrumenten
1. Kappa
Kappa: mate van overeenkomst bij categorische variabelen.
- Validiteit: overeenkomst met criterium
- Test-hertest betrouwbaarheid
- Inter-of intrabeoordelaars betrouwbaarheid
Inter: verschillende beoordelaars ingeschakeld om een meting te doen, ze
moeten het volgens dezelfde manier gaan uitvoeren.
Intra: binnen dezelfde beoordelaar, hij moet tot hetzelfde resultaat komen als hij
verschillende metingen uitvoert.
Interpretatie kapa:
<0.4= overeenkomst is matig, slecht.
Tussen 0.41 en 0.7= een redelijke overeenkomst
>0.7= de overeenkomst is goed.
Voorbeeld: validiteit van vragenlijst nagaan
Mensen gaan hun fysieke activiteit overschatten via een vragenlijst. Wat is de
validiteit van onze vragenlijst als we dit gaan vergelijken met een golden
standaard (versnellingsmeter die mensen dragen: objectiveren).
1
, Tegenover de golden standaard gaan we de validiteit gaan vergelijken met onze
vragenlijst.
Hebben we dezelfde resultaten/ gelijkaardige resultaten bij onze vragenlijst en bij
de meter?
Is er voldoende overeenkomst tussen beide metingen?
Zelf berekenen:
Via SPSS:
2