ONDERZOEKSMETHODODLOGIE EN STATISTIEK
IN DE REVALIDATIEWETENSCHAPPEN 2
0. STATISTIEK
• Statistiek = de wetenschap van verzamelen, organiseren, bewerken, analyseren en interpreteren van
data of gegevens
o Vooral analyseren en interpreteren is het belangrijkst
o Uit onderzoeksopzet krijgen we data en dan moeten we hier iets mee doen → bv. Is er een
verschil in fitheid tussen jongens en meisjes → dan moet je adhv statistiek gaan zien of er een
verschil is in fitheid tussen jongens en meisjes
o Niet enkel verschil, ook verband of voorspelling,
• Wiskunde = omgaan met zekerheid ≠ statistiek = omgaan met onzekerheid
o Statistiek is afgeleiden van wiskunde maar bij statistiek gaan we kijken hoe we omgaan met
een bepaalde onzekerheid.
o Met de methodologie gaan we data verzamelen → bij de statistiek gaan we de fout/error zo
klein mogelijk maken
• Fasen in onderzoeksproces
o
• Onderzoekshypothese (= werkhypothese) = verwacht resultaat van de studie o.b.v. theorieën,
resultaten van voorgaande onderzoeken en vorige ervaringen/observaties van onderzoeker
Alternatieve hypothese (Ha): Er is een Nulhypothese (H0): Er is géén verschil / verband /
verschil/verband/effect! = groepen zijn niet gelijk effect… = groepen zijn gelijk
- Onze statistiek start hieruit net zoals
statistische test, die gaat ervan uit dat er
geen verband, verschil, is
→ Al dan niet te AANVAARDEN → Al dan niet te VERWERPEN
Deze aanvaarden we als er effectief een verschil is, Is deze waar (geen verschil)? Dan verwerpen we
zo. Iet? Aanvaarden we deze niet. deze niet. Is er wel een verschil? Verwerpen we deze
wel.
o !!! het is niet mogelijk om een nulhypothese al dan niet te aanvaarden en een alternatieve
hypothese al dan niet te verwerpen
1
, •
o We moeten altijd een steekproef trekken uit de populatie
o !!! Steekproef is vaak door toeval (niet altijd even toevallig → selectie bias)
▪ Toevallig verschil → toewijden aan steekproeftrekking
• Hoe groter verschil is tussen 2 groepen → hoe zeker je bent dat het een
echt verschil is
• Validiteit
o Belangrijkste psychometrische eigenschap van een test/meetinstrument
o = de mate waarin de test of het instrument effectief meet wat hij bedoelt te meten!
o Indicatie van de degelijkheid/accuraatheid van de test(resultaten)
• Betrouwbaarheid
o Deelaspect van validiteit
o Is test/meetinstrument vrij van willekeurige fouten en/of toevallige factoren?
o = de mate waarin test(resultaat) consistent of herhaalbaar is
• Nooit valide indien niet betrouwbaar MAAR wel betrouwbaar maar kan niet valide zijn (bv. Meetlat,
die foutief geijkt is)
• Soorten meetschalen: Binnen statistiek is het belangrijk om te identificeren of het een kwalitatieve of
kwantitatieve variabele is → op basis hiervan bepalen we de statistische toetsen
o Nominale meetschaal (bv. Geslacht -> Man = 1 en Vrouw = 2
▪ Kwalitatief, categorisch, geen kwantitatieve betekenis
o Ordinale schaal (bv. Rangen in leger, sterrenindeling hotels)
▪ Kwalitatief, kan geordend worden, geen gelijke intervallen
o Interval schaal (bv. Kalender- of jaartelling, temperatuur)
▪ Kwantitatief, gelijke intervallen, geen absoluut nulpunt, (dis)continu
o Ratio schaal (bv. Gewicht, afstand, tijd, bedragen, aantallen)
▪ Kwantitatief, gelijke intervallen, wel absoluut nulpunt, (dis)continue
o Likert schaal is strikt genomen een ordinale schaal maar wordt beschouwd als een
intervalschaal vanaf min 5 punten
▪ Meer punten = meer variantie = makkelijker om statistischer te verwerken → vanaf
5 punten is er normaal statistisch genoeg variantie (maar soms is 5 punten zelfs te
weinig)
o → Soorten meetschaal bepaalt keuze statistische toetsen
SOORTEN VARIABELEN
• Afhankelijke variabele (AV) → hetgeen wat we gaan onderzoeken
o Variabele waarvan men verwacht dat die zal variëren naargelang of onder invloed van de OV
o Variabele waarop men het effect van de OV wil onderzoeken
o UITKOMSTMAAT
• Onafhankelijke variabelen (OV)
o Conditie, eigenschap, methode, programma, waarvan men invloed of effect verwacht op
afhankelijke variabele
2
,Bv. OV =is er een verschil in lichaamslengte bij het geslacht? → Geslacht & AV = lichaamslengte
Bv. OV =we bepalen een afstand van verspringen op basis van lichaamslengte → lichaamslengte & AV = afstand
verspringen
• Between subjects variabelen → oftewel in de ene groep, oftewel in de andere groep
o Eigenschap op groepsvariabele die proefpersonen onderscheidt
o Bv. Geslacht → man kan niet tegelijk man en vrouw zijn
o Bv. Interventie → 3 verschillende fitheidstrainingsprogramma’s= 1/3de doet programma 1,
1/3de doet programma 2 en 1/3de doet programma 3
o Oftewel in de ene groep oftewel in de andere groep
• Within subjects variabele
o Variabele wordt gemeten bij alle proefpersonen
o Herhaalde meting binnen eenzelfde individu
o Bv. Lichaamslengte gemeten op tijdstip A en tijdstip B (net zoals pre- post testen met dezelfde
proefpersonen)
o Bv. Coopertest na afloop van de fitheidsprogramma’s: 3x → want elke proefpersoon volgt elk
programma (eigen controle)
1. BESCHRIJVENDE STATISTIEK
Handboek “statistiek in de praktijk” p. 4-62
• Variabele = kenmerk van proefpersoon uitgedrukt in een getal
o Kwalitatief: nominale of ordinale schaal
o Kwantitatief: interval of ratio schaam
▪ Likert-schalen vanaf 5 punten
• Beschrijvende statistiek = gegevensverzameling beschrijven
o Exploratieve data-analyse → Voor we met de statistiek gaan starten doen we eerst een
exploratieve data-analyse, hierbij gaan we grafisch kijken hoe dat de data er uit ziet, zo
hebben we al een beeld over de data en kunnen we elke variabele individu gaan verkennen.
▪ Elke variabele individueel gaan verkennen
▪ Dit doe je eerst grafisch (visualisatie), dan numeriek (data-reductie)
1.1 WEERGEVEN VAN VERDELINGEN MET GRAFIEKEN
A. GRAFIEKEN VOOR KWALITATIEVE VARIABELEN
Kwalitatieve variabelen = categorische variabelen
Bv. Burgerlijke staat
- Burgerlijke staat = variabele
- Nooit getrouwd, getrouwd, weduwe, gescheiden = categorieën onder de variabele (burgerlijke
staat)
3
, Staafdiagram → visueel Taartdiagram → visueel
B. GRAFIEKEN VOOR KWANTITATIEVE VARIABELEN
• Verzameling getallen (bv.12 deelnemers waarvan we de lichaamslengte hebben: Lichaamslengte in cm,
n=12) → n = aantal deelnemers
o
• In elke verzameling gegevens zekere VARIATIE
• Variatiepatroon van kwantitatieve variabele =
verdeling van variabele
o Frequentietabel
▪ Missing valuce (waardes die er
niet zijn) → valid percent laat
missing valuce voor wat ze zijn,
die laat die vallen en dan berekend die het valide percentage dus exclusief de
missing valuce
o Grafische voorstelling
▪ Stamdiagrammen
▪ Histogrammen
• Stamdiagrammen
o « stam-en-blad » OF « stem-and-leaf »
o Doel: vorm van de verdeling in beeld brengen
o Bv. Aantal doelpunten per seizoen van 10 ploegen
▪
o Stam = alle cijfers behalve de laatste = tientallen
o Blad = laatste cijfers (getallen die onder de stam behoren)
o Stammen in verticale lijst van klein naar groot ordenen (B -> O) → verticale streep trekken
aan de rechterkant van die kolom → bladeren naast bijhorende stammen plaatsen van klein
naar groot (L -> R)
▪
4
IN DE REVALIDATIEWETENSCHAPPEN 2
0. STATISTIEK
• Statistiek = de wetenschap van verzamelen, organiseren, bewerken, analyseren en interpreteren van
data of gegevens
o Vooral analyseren en interpreteren is het belangrijkst
o Uit onderzoeksopzet krijgen we data en dan moeten we hier iets mee doen → bv. Is er een
verschil in fitheid tussen jongens en meisjes → dan moet je adhv statistiek gaan zien of er een
verschil is in fitheid tussen jongens en meisjes
o Niet enkel verschil, ook verband of voorspelling,
• Wiskunde = omgaan met zekerheid ≠ statistiek = omgaan met onzekerheid
o Statistiek is afgeleiden van wiskunde maar bij statistiek gaan we kijken hoe we omgaan met
een bepaalde onzekerheid.
o Met de methodologie gaan we data verzamelen → bij de statistiek gaan we de fout/error zo
klein mogelijk maken
• Fasen in onderzoeksproces
o
• Onderzoekshypothese (= werkhypothese) = verwacht resultaat van de studie o.b.v. theorieën,
resultaten van voorgaande onderzoeken en vorige ervaringen/observaties van onderzoeker
Alternatieve hypothese (Ha): Er is een Nulhypothese (H0): Er is géén verschil / verband /
verschil/verband/effect! = groepen zijn niet gelijk effect… = groepen zijn gelijk
- Onze statistiek start hieruit net zoals
statistische test, die gaat ervan uit dat er
geen verband, verschil, is
→ Al dan niet te AANVAARDEN → Al dan niet te VERWERPEN
Deze aanvaarden we als er effectief een verschil is, Is deze waar (geen verschil)? Dan verwerpen we
zo. Iet? Aanvaarden we deze niet. deze niet. Is er wel een verschil? Verwerpen we deze
wel.
o !!! het is niet mogelijk om een nulhypothese al dan niet te aanvaarden en een alternatieve
hypothese al dan niet te verwerpen
1
, •
o We moeten altijd een steekproef trekken uit de populatie
o !!! Steekproef is vaak door toeval (niet altijd even toevallig → selectie bias)
▪ Toevallig verschil → toewijden aan steekproeftrekking
• Hoe groter verschil is tussen 2 groepen → hoe zeker je bent dat het een
echt verschil is
• Validiteit
o Belangrijkste psychometrische eigenschap van een test/meetinstrument
o = de mate waarin de test of het instrument effectief meet wat hij bedoelt te meten!
o Indicatie van de degelijkheid/accuraatheid van de test(resultaten)
• Betrouwbaarheid
o Deelaspect van validiteit
o Is test/meetinstrument vrij van willekeurige fouten en/of toevallige factoren?
o = de mate waarin test(resultaat) consistent of herhaalbaar is
• Nooit valide indien niet betrouwbaar MAAR wel betrouwbaar maar kan niet valide zijn (bv. Meetlat,
die foutief geijkt is)
• Soorten meetschalen: Binnen statistiek is het belangrijk om te identificeren of het een kwalitatieve of
kwantitatieve variabele is → op basis hiervan bepalen we de statistische toetsen
o Nominale meetschaal (bv. Geslacht -> Man = 1 en Vrouw = 2
▪ Kwalitatief, categorisch, geen kwantitatieve betekenis
o Ordinale schaal (bv. Rangen in leger, sterrenindeling hotels)
▪ Kwalitatief, kan geordend worden, geen gelijke intervallen
o Interval schaal (bv. Kalender- of jaartelling, temperatuur)
▪ Kwantitatief, gelijke intervallen, geen absoluut nulpunt, (dis)continu
o Ratio schaal (bv. Gewicht, afstand, tijd, bedragen, aantallen)
▪ Kwantitatief, gelijke intervallen, wel absoluut nulpunt, (dis)continue
o Likert schaal is strikt genomen een ordinale schaal maar wordt beschouwd als een
intervalschaal vanaf min 5 punten
▪ Meer punten = meer variantie = makkelijker om statistischer te verwerken → vanaf
5 punten is er normaal statistisch genoeg variantie (maar soms is 5 punten zelfs te
weinig)
o → Soorten meetschaal bepaalt keuze statistische toetsen
SOORTEN VARIABELEN
• Afhankelijke variabele (AV) → hetgeen wat we gaan onderzoeken
o Variabele waarvan men verwacht dat die zal variëren naargelang of onder invloed van de OV
o Variabele waarop men het effect van de OV wil onderzoeken
o UITKOMSTMAAT
• Onafhankelijke variabelen (OV)
o Conditie, eigenschap, methode, programma, waarvan men invloed of effect verwacht op
afhankelijke variabele
2
,Bv. OV =is er een verschil in lichaamslengte bij het geslacht? → Geslacht & AV = lichaamslengte
Bv. OV =we bepalen een afstand van verspringen op basis van lichaamslengte → lichaamslengte & AV = afstand
verspringen
• Between subjects variabelen → oftewel in de ene groep, oftewel in de andere groep
o Eigenschap op groepsvariabele die proefpersonen onderscheidt
o Bv. Geslacht → man kan niet tegelijk man en vrouw zijn
o Bv. Interventie → 3 verschillende fitheidstrainingsprogramma’s= 1/3de doet programma 1,
1/3de doet programma 2 en 1/3de doet programma 3
o Oftewel in de ene groep oftewel in de andere groep
• Within subjects variabele
o Variabele wordt gemeten bij alle proefpersonen
o Herhaalde meting binnen eenzelfde individu
o Bv. Lichaamslengte gemeten op tijdstip A en tijdstip B (net zoals pre- post testen met dezelfde
proefpersonen)
o Bv. Coopertest na afloop van de fitheidsprogramma’s: 3x → want elke proefpersoon volgt elk
programma (eigen controle)
1. BESCHRIJVENDE STATISTIEK
Handboek “statistiek in de praktijk” p. 4-62
• Variabele = kenmerk van proefpersoon uitgedrukt in een getal
o Kwalitatief: nominale of ordinale schaal
o Kwantitatief: interval of ratio schaam
▪ Likert-schalen vanaf 5 punten
• Beschrijvende statistiek = gegevensverzameling beschrijven
o Exploratieve data-analyse → Voor we met de statistiek gaan starten doen we eerst een
exploratieve data-analyse, hierbij gaan we grafisch kijken hoe dat de data er uit ziet, zo
hebben we al een beeld over de data en kunnen we elke variabele individu gaan verkennen.
▪ Elke variabele individueel gaan verkennen
▪ Dit doe je eerst grafisch (visualisatie), dan numeriek (data-reductie)
1.1 WEERGEVEN VAN VERDELINGEN MET GRAFIEKEN
A. GRAFIEKEN VOOR KWALITATIEVE VARIABELEN
Kwalitatieve variabelen = categorische variabelen
Bv. Burgerlijke staat
- Burgerlijke staat = variabele
- Nooit getrouwd, getrouwd, weduwe, gescheiden = categorieën onder de variabele (burgerlijke
staat)
3
, Staafdiagram → visueel Taartdiagram → visueel
B. GRAFIEKEN VOOR KWANTITATIEVE VARIABELEN
• Verzameling getallen (bv.12 deelnemers waarvan we de lichaamslengte hebben: Lichaamslengte in cm,
n=12) → n = aantal deelnemers
o
• In elke verzameling gegevens zekere VARIATIE
• Variatiepatroon van kwantitatieve variabele =
verdeling van variabele
o Frequentietabel
▪ Missing valuce (waardes die er
niet zijn) → valid percent laat
missing valuce voor wat ze zijn,
die laat die vallen en dan berekend die het valide percentage dus exclusief de
missing valuce
o Grafische voorstelling
▪ Stamdiagrammen
▪ Histogrammen
• Stamdiagrammen
o « stam-en-blad » OF « stem-and-leaf »
o Doel: vorm van de verdeling in beeld brengen
o Bv. Aantal doelpunten per seizoen van 10 ploegen
▪
o Stam = alle cijfers behalve de laatste = tientallen
o Blad = laatste cijfers (getallen die onder de stam behoren)
o Stammen in verticale lijst van klein naar groot ordenen (B -> O) → verticale streep trekken
aan de rechterkant van die kolom → bladeren naast bijhorende stammen plaatsen van klein
naar groot (L -> R)
▪
4