Deel 1: inleiding, beschrijvende en verklarende statistiek
1. Inleiding..............................................................................................................................................2
1.1 Onderzoeksvormen binnen wetenschappelijk onderzoek............................................................2
1.2 Soorten variabelen.......................................................................................................................2
1.3 Beschrijvende VS verklarende statistiek.......................................................................................3
1.4 Terminologie.................................................................................................................................3
2. Beschrijvende statistiek......................................................................................................................5
2.1 Inleiding........................................................................................................................................5
2.2 Grafische weergave onderzoeksgegevens....................................................................................5
2.3 Numerieke weergave van onderzoeksgegevens...........................................................................5
2.4 De normale verdeling...................................................................................................................6
2.5 Overzicht.......................................................................................................................................8
3. Achterliggende principes van de verklarende statistiek.....................................................................9
3.1 Inleiding........................................................................................................................................9
3.2 Kansen en kansverdelingen........................................................................................................10
3.2.1 Binomiale kansverdeling......................................................................................................10
3.2.2 Normale kansverdeling........................................................................................................10
3.3 Notatie........................................................................................................................................10
3.4 Toetsen en schatten steekproefgemiddelde...............................................................................11
3.4.1 Toetsen................................................................................................................................11
3.4.2 Tweezijdig VS eenzijdig toetsen...........................................................................................13
3.4.3 Schatten...............................................................................................................................13
3.5 De centrale limietstelling............................................................................................................13
3.6 De t-verdeling.............................................................................................................................14
4. De analyse van continue uitkomstvariabelen...................................................................................15
4.1 Inleiding......................................................................................................................................15
4.2 Het vergelijken van twee metingen bij dezelfde personen.........................................................15
4.2.1 Het vergelijken van een gemiddelde met een standaardwaarde........................................16
4.3 Het vergelijken van twee groepen..............................................................................................16
4.4 Het vergelijken van meer dan twee groepen..............................................................................16
4.4.1 Vergelijken scheef verdeelde uitkomstvariabelen...............................................................17
4.4.2 Non-parametrisch toetsen...................................................................................................17
4.5 Correlatie....................................................................................................................................18
, 4.6 Het analyseren van de relatie tussen een continue uitkomstvariabele en andere variabelen;
lineaire regressieanalyse..................................................................................................................19
4.6.1 Inleiding...............................................................................................................................19
4.6.2 Lineaire regressieanalyse met een dichotome determinant................................................20
4.6.3 Lineaire regressieanalyse met categoriale determinant......................................................20
4.6.4 Lineaire regressieanalyse met continue determinant..........................................................21
4.6.5 Verklaarde variantie.............................................................................................................21
5. Multipele regressieanalyse: associatiemodellen en predictiemodellen...........................................23
5.1 Inleiding......................................................................................................................................23
5.2 Confounding en effectmodificatie..............................................................................................23
5.3 Associatiemodellen.....................................................................................................................25
5.4 Predictiemodellen.......................................................................................................................28
6. De analyse van dichotome uitkomstvariabelen................................................................................30
6.1 Inleiding......................................................................................................................................30
6.2 Het vergelijken van twee metingen bij dezelfde persoon...........................................................30
6.3 Vergelijken in één groep met bepaalde standaardwaarde.........................................................30
6.4 Het vergelijken van 2 groepen....................................................................................................32
6.5 Het vergelijken van meer dan twee groepen..............................................................................34
6.6 Het analyseren van relaties tussen een dichotome uitkomstvariabele en diverse andere
variabelen; logische regressieanalyse...............................................................................................34
6.7 Meervoudige logistische regressie..............................................................................................37
7. Analyse van overlevingsdata............................................................................................................40
7.1 Inleiding......................................................................................................................................40
7.2 Vergelijken van 2 groepen..........................................................................................................40
7.3 Vergelijken van meer dan 2 groepen..........................................................................................41
7.4 Het analyseren van relaties tss overlevingsdata en diverse andere variabelen: Cox-
regressieanalyse...............................................................................................................................42
8. Sample-sizeberekeningen.................................................................................................................44
9. Een stap verder.................................................................................................................................45
9.1 Normaliteit van continue variabelen nagaan..............................................................................45
9.2 Valkuilen in statistische analyses................................................................................................46
9.3 Meer gevorderde analyses.........................................................................................................47
10. Betrouwbaarheid van meetinstrumenten......................................................................................48
1
, Deel 1: Inleiding, beschrijvende en verklarende statistiek
1. Inleiding
1.1 Onderzoeksvormen binnen wetenschappelijk onderzoek
- Onderzoeken onderverdeeld in 2 groepen (medische of epidemiologische onderzoeken)
o Observationele onderzoeken
Geobserveerd
Metingen aan proefpersoon zonder dat dit de persoon beïnvloedt
Resultaten metingen met elkaar in verband brengen
2 groepen:
Cohortonderzoeken
o Waarbij groep ptn/proefpersonen wordt geobserveerd
o Retrospectief: info verzamelen terugkijkend in de tijd
o Transversaal of cross-sectioneel: info verzamelen op
moment dat onderzoek uitgevoerd wordt
o Prospectief: groep gevolgd over de tijd
Case-controlonderzoeken
o Groep ptn met bepaalde ziekte of aandoening (cases)
vergeleken met groep controlepersonen (controles)
o Groepen w vergeleken obv mogelijke oorzaken van
betreffende ziekte/aandoening
o = retroperspectief onderzoek: terugkijkend in tijd, oorzaken
hebben vnl in verleden plaatsgevonden
o Experimentele onderzoeken
Proefpersoon wordt beïnvloed
Doel: effect interventie evalueren
1.2 Soorten variabelen
- Uitkomstvariabele van onderzoek: meestal continu of dichotoom
o Continue variabelen
Kunnen een oneindig aantal waarden aannemen
Bv. Lichaamsgewicht, lichaamslengte
o Dichotome variabelen
Kunnen 2 waarden aannemen: wel of niet
Bv. Patiënt is OF ziek OF niet ziek
- Categoriale variabele
o Bestaat uit meer dan 2 groepen
o Bv. Lichaamsgewicht als men onderscheid maakt tss normaal gewicht, overgewicht
en obesitas
o = ordinale categoriale variabelen: er zit bepaalde volgorde in VS nominale (bv.
‘beroep’): geen ordering
2
,1.3 Beschrijvende VS verklarende statistiek
- Beschrijvende: overzichtelijk samenvatten van onderzoeksgegevens, zonder te kijken naar
mogelijke verbanden of relaties tss verschillende variabelen
- Verklarende: schatten van effecten en relaties, hschatten betrouwbaarheid van deze effecten
en relaties en het berekenen van p-waarden
- Voor beide belangrijk de eigenschappen van versch variabelen onderzoeken bepalen
statistische mogelijkheden
1.4 Terminologie
- Uitkomstvariabele: variabele waarover de onderzoeker uitspraken wil doen
o Van wetenschappelijk onderzoek: afhankelijke variabele
o Overige: onafhankelijke variabelen (bv. Rookgedrag) = determinanten = verklarende
variabelen = voorspellers = predictoren = covarianten
- Toegepaste statistiek = analyseren van data om wetenschappelijke vraag te beantwoorden
- Komen tot evidence based practice: gestaafd/ondersteund door evidentie
- Hoe? Data: waarnemingen op variabelen = kenmerken van onderzoekseenheden (individuen
in ons vakgebieden) die kunnen variëren
o BV: leeftijd meten (30 VS 70)
- Door steekproef (=onderzoekspopulatie) nemen van doelpopulatie (hier willen we uitspraken
over doen)
- Nooit volledige doelpopulatie opnemen: bv gezondheid van inwoners België kijken naar
gezondheidsenquête: niet ALLE inwoners door steekproef nemen kunnen we zeggen alle
inwoners
- Onderzoeksvormen
o Observationeel onderzoek: als onderzoekers puur observeren, je komt zelf niet
tussen (BV: gezondheidsenquete)
o Experimenteel onderzoek: interventie studies, je komt als onderzoeker wel tussen
(BV: klinische testen medicijn)
o Onderscheid tijdsaspect
Prospectief: studie loopt in tijd en loopt door (vooruit in tijd)
Retrospectief: keert terug in tijd BV door vroegere dossier gegevens te gaan
meten
Transversaal: crossectioneel, geen longitudinaal, gegevens worden op 1
moment verzameld, niet over langere periode
Case controle onderzoek: spec vorm retrospectief, groep met ziekte
vergelijken met groep die ziekte niet heeft
- Variabelen: kenmerken onderzoekseenheden die we kunnen meten
o Uitkomstvariabelen: afhankelijke (dependent) variabele willen we voorspellen,
verklaren
o Onafhankelijke (independent) = determinanten, verklarende, voorspellende,
waarvan we denken een invloed te hebben op de afhankelijke
- Soorten variabelen: onderscheid goed maken, bepaald welke statische testen nodig
o Categorische/categoriale/kwalitatieve variabelen: die als mogelijke uitkomst een
beperkt aantal mogelijke variabelen hebben (VB: geslacht)
Nominaal (niet geordend): niet op natuurlijke manier ordenen, aantal
mogelijke uitkomsten
3
, Ordinaal (geordend): wel mogelijk om te ordenen
Dichotoom (2 categorieën): dummy codering 1 VS 0 (2 mogelijke uitkomsten)
o Numerieke / kwantitatieve: hele reeks mogelijke uitkomsten die op een continuüm
bevinden
Discreet (gehele getallen / aantallen): niet gewicht bv, wel meting het aantal
keer dat mensen naar huisarts zijn geweest)
Continu (in theorie oneindig aantal mogelijke waarden) VB: BMI
In theorie: hangt af van precisie meetinstrument
Interval-schaal: elk interval heeft dezelfde betekenis of grootte (VB:
gewicht uitgedrukt in kg)
Ratio-schaal: er is sprake van natuurlijk nulpunt, als 0 uitkomst is,
betekent dat afwezig is van kenmerk (VB: bij gewicht 0 = er is geen
gewicht, bij T 0 = geen ratio schaal)
o Mutually exclusive: 1 antwoord mogelijk per proefpersoon
o Pijl van nummerieke naar categorische: VB BMI hangt af van hoe kenmerk is
gemeten en wordt behandeld voor welk soort
o Likert schaal: helemaal niet akkoord – niet akkoord – akkoord ….
- Cohort = groep onderzoekseenheden
- Soorten statistiek (onderscheid steekproef en doelpopulatie)
o Beschrijvende: overzichtelijk samenvatten van data: grafische/numerieke weergave -
eerste stap altijd beschrijvende analyse, puur beschrijven, gegevens verzameld
weergeven
o Verklarende / inferentieële statistiek: schatten van effecten / relaties
betroubaarheud vd onderzoeksresultaten en hypothesen testen
4
, 2. Beschrijvende statistiek
2.1 Inleiding
- Doel: onderzoeksgegevens op overzichtelijke manier samenvatten
- Grafisch of numeriek keuze: doel samenvatting
o Gegevens samengevat in mondelinge presentatie op congres: grafisch
o Wetenschappelijk artikel: numeriek
Voordeel: info compacter en preciezer
2.2 Grafische weergave onderzoeksgegevens
- Continue variabele in:
o Histogram
X-as: continue variabele waarden (bv. Cholesterol)
Y-as: aantallen proefpersonen
o Tak-en-blad / stem and leaf diagram
Heel informatief
Stengel = stem: tientallen
Blad = leaf: eenheden
1. 2 proefpersonen zijn 19j
2. 2 pf van 21, 3 pf van 22, 1 pf 23 …
- 2 continue variabelen: puntenwolk (scatterplot) visueel idee hoe 2 variabelen aan elkaar
hangen
- Categorische variabelen in:
o Staafdiagram (bar chart)
o 2 variabelen: geclusterd/gesegmenteerd staafdiagram
o Taartdiagram (pie chart)
2.3 Numerieke weergave van onderzoeksgegevens
- Dichotome of categoriale variabelen weergeven in frequentietabel
o Aantallen (freq) + percentages in verschillende groepen
o Valid percent: valide percentage waarbij missende waarden niet worden meegeteld
o Cumulative percent: percentages opgeteld
- Continue variabelen
o Freqtabel niet informatief
5