DEEL 1: WAAROM MEDISCHE STATISTIEK?
We willen dingen weten zoals:
• Causaal effect: interventies goede of slechte gevolgen + hoe sterk de gevolgen zijn
• Predictie: hoe goed de aanwezigheid van/ ontwikkeling van een ziekte voorspeld kan worden
• Beschrijving: hoe vaak symptomen voorkomen/ verschillende symptomen samen voorkomen
!! als een studie suggereert dat gedrag x leidt tot ziekte/probleem y, betekent dat NIET automatisch dat de
onderzoekers gedrag x willen verbieden !!
Voorbeelden:
Stel Vraag Aanpak Antwoord
We hebben een nieuwe aanpak Werkt het? Bij de volgende patiënt passen we Het werkt!
bedacht tegen delier na chirurgie de aanpak toe, en stellen vast dat
bij ouderen. de patiënt geen delier doormaakt.
We hebben een nieuw predictief Werkt het model Bij de volgende patiënt passen we Het model
model gemaakt om de kans op goed? het model toe. Het model geeft een werkt niet!
een miskraam in te schatten bij kans van 10% op een miskraam. De
vrouwen bij wie net een vrouw kreeg helaas een miskraam.
zwangerschap werd vastgesteld.
We willen weten of burn-out een Hebben We spreken met een vroedvrouw, en Vroedvrouwen
probleem is bij vroedvrouwen. vroedvrouwen die blijkt geen last te hebben van hebben geen
last van burn- een burn-out. last van burn-
out? out!
Of is er toch twijfel bij de conclusie? Waarom? à ja, want het is allemaal maar op 1 persoon getest à
We hebben REPLICATIES nodig om uitspraken te doen (~ steekproefgrootte)
Reken nu 1+1 à resultaat is 2. Je kan miljoen replicaties doen, je krijgt altijd 2 à dit is een deterministisch
probleem. We hebben GEEN replicaties en statistiek nodig om tot een conclusie te komen omdat er geen
variatie is.
Statistiek heeft VARIATIE nodig. De wereld is niet deterministisch, er is veel variabiliteit. (als er dus geen
variaties is, dan is alles en iedereen hetzelfde à deterministische probleem)
1
,Bijvoorbeeld:
§ Niet elke roker krijgt longkanker of krijgt het op hetzelfde moment
§ Dezelfde ziekte kan op vele manieren ontstaan
§ Zelfs al leven mensen op precies dezelfde manier, dan nog zal hun
§ gezondheidstoestand anders evolueren
Statistiek probeert die variabiliteit te kwantificeren of modelleren in een poging om door de bomen het
bos te zien. à statistiek probeert de variabiliteit in kaart te brengen, variatie is de basis van statistiek.
Hoe minder variabiliteit tussen mensen, hoe duidelijker het effect is op de mensen (kleine steekproef
nodig ipv een grote) à minder replicaties en/of meer variabiliteit = meer onzekerheid (die onzekerheid
moet voldoende aandacht krijgen, maar dat gebeurt niet altijd)
6 FUNDAMENTEN VAN (TOEGEPASTE) STATISTIEK:
1. Statistiek is een evoluerende wetenschap, geen receptenboek voor empirische studies
o De wiskundige modellen werken goed in ‘de perfecte wereld’ maar niet in de echte wereld à
er is vaak niet 1 antwoord op elk probleem. Statistiek is een wetenschap op zich die wordt
gebruikt in heel veel disciplines (overal waar er empirische studies worden gedaan).
2. Toegepaste statistiek is een combinatie van wiskunde en filosofie/logica
o Bouwt verder op fundament 1. Wiskunde gebruiken om data te analyseren. Er is geen vast
recept, blijven kritisch nadenken!!
3. Een toegepast statisticus moet (net als elke wetenschapper) ook een methodoloog zijn
o De essentie van wetenschap is goede methodologie! Statistiek uitleggen als ‘dit model, zo en
dat zo’ werkt niet. Puur statistiek opzich ‘leeft’ niet zelfstandig in de echte wereld, gaat altijd
in samenspraak met andere dingen (bv: designs…)
4. Schatten van associaties is belangrijker dan statistische significantie
o Teveel nadruk op p-waarde
5. De statistische aanpak voor een studie hangt sterk af van de onderzoeksvraag
o Eerst weten wat je wil onderzoeken, dit bepaalt hoe je het statistisch gaat analyseren
6. De validiteit van de resultaten hangt sterk af van studiedesign en methodologie
o Als de methodologie slecht is dan kan je ook niet zeker zijn over de betrouwbaarheid van je
resultaten
DEEL 2: ENKELE BASICS (NOG HERBEKIJKEN)
STUDIEPROTOCOL
= gedetailleerde uitleg over waarom en hoe de studie zal uitgevoerd worden (waarom, wie, wat, waar en
hoe) à al de procedures die je gaat uitvoeren in het echte onderzoek vermelden: hoe deelnemers
aanwerven, hoe bloedstalen afnemen, vragenlijsten, hoe analyseren resultaten etc.
2
,VASTSTAAND IETS?
Je beschrijft de onderzoeksprocedures in detail. Hierover nadenken helpt ook om mogelijke problemen te
identificeren en hierop te anticiperen, maar je kan op voorhand niet alles inschatten. à wijzigingen aan
protocol kunnen gebeuren indien echt nodig. Alle wijzigingen moeten beschreven worden +
beargumentatie
à Eerst denken, dan doen
Je geeft het protocol weer om aan anderen te laten zien wat je eerste plan/interventie was voor de start
van het onderzoek.
WAAROM EEN STUDIEPROTOCOL?
Niet enkel omdat het vaak moet (denk aan ethische goedkeuring, regelgevende instantie,
onderzoeksfinanciering, publicatie), maar vooral om de kwaliteit van het onderzoek te maximaliseren:
§ Transparantie naar de buitenwereld (niets in de handen, niets in de mouwen aka geen geheimen)
§ Leidraad voor het studieteam van idee tot publicatie
§ Kritisch doordenken van procedures
o Problemen vermijden door op voorhand alles uit te schrijven
§ Verrassingen en problemen anticiperen, vermijden dat men in zo’n gevallen maar wat doet
§ Vertekende resultaten voorkomen door de analysemethoden vast te leggen
§ Selectieve of vertekende rapportering vermijden: rapporteer volgens het protocol
§ Replicatie toelaten
o Leidraad voor iedereen die bij de studie betrokken is, zo kan iedereen het nalezen,
herlezen indien nodig + iedereen zit dan op dezelfde golflengte. Het is altijd relevant dat
studies die een bepaalde claim maken dat mensen in andere settings of landen het
kunnen repliceren à kwaliteit, eerlijkheid en transparantie van de studie
IMPLICATIES
§ Zou even belangrijk moeten zijn als de paper
§ Zou volledig en gedetailleerd moeten zijn
§ Zou publiek beschikbaar moeten zijn, bv pre-registratie
§ Zou finaal moeten zijn voor de studie start
§ Zou gevolgd moeten worden bij het uitvoeren, analyseren en rapporteren
§ Zie declaration of Helsinki (ethische principes voor medisch onderzoek op mensen die gevolgd
moeten worden en die zegt dat je een protocol MOET schrijven)
IN DE REALITEIT
§ Aspecten van methodologie en statistiek vaak zonder uitleg/verantwoording veranderd tijdens
studie à waarom? Wil men gewoon beste resultaat?
§ Beschikbare protocollen zijn vaak niet het protocol bij het begin van de studie
§ Slechts 15% van de gerandomiseerde trials in Pubmed had een beschikbaar protocol
§ Slechts 3% van de gerandomiseerde trials in Pubmed had een beschikbaar analyseplan (SAP)
§ Wanneer men na publicatie vraagt haar het protocol/SAP, wordt het zelden gedeeld
3
,DESCRIPTIEVE VS INFERENTIËLE STATISTIEK
DESCRIPTIEVE STATISTIEK
Samenvatten en presenteren van data
§ Histogrammen, bar charts, box plots, scatter plots, …
§ Frequentietabellen
§ Maten voor “centrale tendens” (central tendency): gemiddelde, mediaan, modus
§ Maten voor “dispersie” of variatie: standaarddeviatie, interkwartielbereik, bereik
§ Maten voor samenhang: Pearson en Spearman correlatiecoëfficiënten
INFERENTIËLE STATISTIEK
Dit gebruiken we om inferenties te maken over een doelpopulatie, onder andere door
§ Formele hypothesetoetsing (cf. p-waarden)
§ Schatten van eigenschappen in de populatie, met betrouwbaarheidsintervallen
Die inferenties zijn schattingen en zijn dus onzeker. Die onzekerheid moet meegegeven worden. We doen
een studie om iets te zeggen over die bepaalde
populatie. Het blijft wel een schatting en die schatting
moet gekwantificeerd worden.
Je hebt een bepaalde populatie waarover je iets te weten
wil komen (je kan niet heel de populatie gebruiken à
steekproef door randomisatie à metingen en testen
doen op de metingen van de steekproef à uitspraken
terugkoppelen naar de doelpopulatie
SOORTEN ONDERZOEKSVRAGEN
Onderzoek gaat over het proberen beantwoorden van bepaalde onderzoeksvragen. De specifieke
onderzoeksvraag en de context bepalen de methodologie, bv onderzoeksdesign en statistiek (cf later)
Maar hetzelfde design en dezelfde statistische methoden (bv regressie) kunnen voor verschillende
soorten onderzoeksvragen gebruikt worden. Voor je begint moet je dus specificeren wat je wil (en niet wil)
onderzoeken, inclusief het duidelijk/helder/specifiek omschrijven van de onderzoeksvraag
CAUSALE VRAGEN
Doorgaans focus op het causale effect van een specifieke variabele 𝑥 op y, waarbij eventueel rekening
gehouden wordt voor andere variabelen (cf later, hangt af van design) à Voorbeeld:
Is “exposure” (gedrag/eigenschap/behandeling) 𝑥 een oorzaak van “uitkomst” (probleem/ziekte) 𝑦?
EXPOSURE à UITKOMST?
§ Is slaapkwaliteit een oorzaak van het ontwikkelen van dementie?
§ Heeft de leeftijd van de patiënt invloed op hospitalisatieduur en/of -kost?
§ Is vapen een oorzaak van hart- en vaatziekten?
§ Is deze nieuwe behandeling effectief bij patiënten met diabetes?
4
,PREDICTIEVE VRAGEN
• Hoe kunnen we probleem/ziekte 𝑦 voorspellen op basis van een of meerdere predictoren (𝑥)?
PREDICTOREN à VOORSPELLING OVER DE UITKOMST
Voorbeelden:
§ Predictiemodel maken om de hospitalisatieduur van een nieuwe patiënt te voorspellen
§ Predictiemodel maken om de kans in te schatten dat een tumor kwaadaardig is
§ Predictiemodel maken om de kans op herval in te schatten na kankerbehandeling
§ Welke predictoren kunnen voorspellen of een spoedkeizersnede nodig is?
§ Verbetert nieuwe DNA marker het beste predictiemodel voor kwaadaardigheid van
eierstoktumoren?
§ Hoe goed voorspelt de CRP bloedtest de aanwezigheid van reumatoïde artritis?
Recent is er meer aandacht op het voorspellen van de kans op succes van behandelingen (ipv ziekte)
§ Klinisch nut van coronaire bypassoperatie (CABG) bij patiënten met coronaire hartziekte
voorspellen
§ Relatief klinisch nut van CABG vs percutane coronaire interventie (PCI) bij patiënten met CHZ
voorspellen
!! Om na te gaan of iets werkt of je wil iets voorspellen heb je succesverhalen nodig, maar OOK
pechverhalen (mensen die hervallen van kanker…)!!
Predictie modellen à wij gaan ons eerder focussen op regressiemodellen
BESCHRIJVENDE VRAGEN
Samenvatten en/of beschrijven van gebeurtenissen of associaties. Geen causale of predictieve
doelstellingen
Niet altijd eenvoudig: vaak hangt er ergens een zweem van causaliteit/predictie rond, hoewel
beschrijvende studies op de vlakte moeten blijven (Lastig, want uiteindelijk doe je toch onderzoek om na
te gaan of het effect heeft of het verband heeft met iets)
Voorbeelden:
§ Hoe vaak zien we complicaties bij laparotomie?
§ Hoeveel verpleegkundigen hebben last van burn-out, en met welke factoren hangt dat samen?
§ Krijgen zwangere vrouwen met kanker steeds vaker chemo tijdens de zwangerschap?
TIP EXAMEN
In het taalgebruik/ woorden die gebruikt worden in vragen en/of antwoorden van het examen zit al een tip
POPULATIE EN STEEKPROEFTREKKING
Studiepopulatie = de verzameling ‘eenheden’ (bv. individuen) waarover de onderzoeker uitspraken wil
doen
In medisch/klinisch onderzoek is de populatie vaak in evolutie en oneindig, bijvoorbeeld:
5
, § Patiënten met de diagnose borstkanker
§ Verpleegkundigen werkzaam op de spoeddienst
§ Studie over zwangere vrouwen met kanker à dame bevalt, dus hoort niet meer bij de
studiepopulatie, dame is zwanger en krijgt kanker à hoorde voordien niet bij de populatie, maar
kan nu wel in de studie betrokken worden
Dit verandert voortdurend: individuen treden toe tot de populatie of verlaten ze
Heldere onderzoeksvraag = heel goed weten wat je studiepopualtie inhoudt!
VAN POPULATIE TOT STEEKPROEF
Steekproef (sample) = de eenheden (individuen) uit de populatie die geselecteerd worden voor de studie
Kan je zomaar uit de volledige populatie gaan selecteren, bv alle
borstkankerpatiënten ter wereld? Vaak niet.
Steekproefkader (sample frame) = De verzameling eenheden uit de populatie die kan
geselecteerd worden. Hieruit trek je een steekproef.
Voorbeeld: borstkankerpatiënten in België, of zelfs in UZ Leuven (Zijn die
representatief voor de globale populatie?)
Met steekproefkader werken om het haalbaar te houden.
STEEKPROEFTREKKING (SAMPLING)
Inferenties naar de populatie veronderstellen toevallige (random) steekproeven. Random steekproeven
verschillen “niet-systematisch” van de populatie, enkel door random variatie. Het is door toeval, maar
toch kan je bijvoorbeeld veel jonge personen hebben of bepaalde soort tumoren… maar het was per
onegluk.
à Dus: resultaten verschillen niet-systematisch van het resultaat in de populatie. Er is enkel random
variatie (die kleiner wordt met de steekproefgrootte)
Steekproeven die systematisch verschillen van de populatie zijn niet representatief (representeren de
populatie niet goed). Systematisch wil zeggen niet random getrokken.
De resultaten (schattingen) zullen dan vaak ook systematisch verschillen van het resultaat in de populatie
(bias)
REPRESENTATIVITEIT
In empirisch onderzoek is representativiteit niet eenvoudig
§ Random steekproeven uit de populatie of het steekproefkader zijn vaak quasi onmogelijk
§ Representatieve steekproefkaders zijn al moeilijk op zich
§ Geselecteerde eenheden (deelnemers) kunnen deelname weigeren of stopzetten
§ Ontbrekende metingen (missing data) komen vaak voor en zijn zelden puur toevallig
o Missing data = mensen die zijn verhuisd, machine gaat kapot à geen metingen… er zit
meestal een reden achter
6
,Dit vraagt om voorzichtigheid/bescheidenheid/terughoudendheid bij inferenties omdat je steekproef op
heel veel verschillende manieren toch niet representatief kan zijn voor de populatie.
Vraag: Zijn deelnemers in de analyse van de studie systematisch verschillend van deelnemers die werden
weggelaten (Vb. omdat ze geen toestemming gaven of missing data?) uit de analyse en van de
doelpopulatie?
Verzamel informatie hierover waar mogelijk:
§ Descriptieve statistieken voor deelnemers in de analyse en weggelaten deelnemers
§ Vermijd om deelnemers weg te laten, bv door het imputeren van missing data
§ Vergelijk steekproef met betrouwbare gegevens uit de doelpopulatie, als die beschikbaar zijn
Voorbeeld:
§ DOELPOPULATIE: praktiserende gynaecologen en verloskundigen in het VK
§ STEEKPROEFKADER: alle gynaecologen en verloskundigen geregistreerd bij de “Royal Collega of
Obstertrics and Gynaecology”
§ STEEKPROEF: 55% stuurden survey terug waarvan sommigen niet (meer) praktiserend zijn.
SAMPLING EN REPRESENTATIVITEIT
Random sampling uit de doelpopulatie / steekproefkader is dus vaak niet of nauwelijks mogelijk
Hoe geraak je aan een random sample van alle individuen met diabetes
§ op deze planeet?
§ in België?
§ die in behandeling zijn in het UZ Leuven?
In de praktijk wordt convenience sampling vaak gebruikt, i.e. focus op ‘bereikbare’ individuen
Voorbeeld: patiënten uit 1 of meerdere ziekenhuizen als een bereikbaar steekproefkader
à Consecutieve sampling is een vorm van convenience sampling. Consecutive = iedereen includeren
die toestemming geeft en binnen doelpopulatie past.
Typisch voorbeeld: alle relevante patiënten die zich aanbieden in de deelnemende ziekenhuizen tijdens
de rekruteringsperiode. Zelfs perfecte consecutieve sampling is in de praktijk niet eenvoudig
Denk aan:
• patiënten die zich aanbieden op weekdagen versus weekenddagen
• onderzoekers die op vakantie zijn
• grote ziekenhuizen maar meerdere clinici los van elkaar relevante patiënten zien
STEEKPROEFTREKKING IN DE PRAKTIJK
Op zijn minst moet een inspanning gedaan worden om ervoor te zorgen dat de geïncludeerde individuen
aselect zijn. Dus dat selectie in de studie niet geassocieerd is met bepaalde relevante informatie of
variabelen. En ook dat kan lastig zijn!
7
,Voorbeelden:
• Als enkel de hoofdarts op een bepaalde afdeling patiënten rekruteert, kan de steekproef meer
‘moeilijke’ of complexe gevallen bevatten (die vaak door de meest ervaren arts gezien worden) in
plaats van patiënten die bij een beginnende arts worden geïncludeerd.
• Patiënten die zich aanbieden tijdens het weekend kunnen systematisch verschillen (qua leeftijd,
symptomen, …) van patiënten die zich aanbieden tijdens de week
De theorie is mooi, de praktijk is nog wat anders: zo gaat het altijd
Die niet op een of andere manier afhangt van iets anders = aselecte steekproef.
SIGNAAL EN RUIS
Centraal idee: datasets bevatten ‘signaal’ en ‘ruis’
• SIGNAAL= Echte onderliggende (causale) relaties tussen variabelen
• RUIS = Random variatie (elke steekproef omvat andere deelnemers en is daarom anders)
Twee steekproeven uit dezelfde populatie: ‘Signaal’ is hetzelfde, ‘ruis’ is verschillend
Alleen ‘God’ weet precies wat signaal is, en wat ruis. Wij weten dat niet. Met statistische methoden
proberen we het signaal te vinden…
Dat is eenvoudiger als:
§ De steekproefgrootte hoger is: ruis speelt minder mee, signaal wordt makkelijker zichtbaar
o Een studie met N=10 hangt sterk af van welke 10 deelnemers per ongeluk geïncludeerd
werden
o Als N=10000, dan hangt het minder af welke 10000 deelnemers meededen
o Bv: hoe groot zijn studenten?
§ Het signaal sterker is (bv geneesmiddel met sterk effect vs geneesmiddel met kleiner effect):
sterker signaal is makkelijker zichtbaar met kleinere N
Klinische geneeskunde: signaal vaak niet erg sterk
§ ‘het signaal uit de data halen door statistische methoden’
Voorbeeld
We hebben data over 8403 vrouwen met een eierstoktumor waarvoor we de histologie kennen. In dit
voorbeeld, doen we alsof dit onze populatie is. Vraag: wat is het verschil in tumorgrootte tussen goed- en
kwaadaardige tumoren?
Gekende histologie à we weten of de tumor goedaardig of kwaadaardig is
De ‘waarheid’ in de doelpopulatie
§ Maximale tumordiameter van goedaardige tumoren: mediaan 63mm
§ Maximale tumordiameter van kwaadaardige tumoren: mediaan 89mm
§ Verschil in mediane diameter: 89 – 63 = 26mm = 2.6 cm
8
,Aanpak om de waarheid te schatten
1. We trekken at random een steekproef van 20 deelnemers uit de populatie
2. We berekenen de mediaan van de maximale tumordiameter voor vrouwen met een goedaardige
tumor
3. We berekenen de mediaan van de maximale tumordiameter voor vrouwen met een kwaadaardige
tumor
4. We berekenen het verschil tussen die medianen
5. We herhalen dit 99 keren, alsof we de studie in totaal 100 doen met telkens een andere
steekproef
§ 60mm bij goedaardige tumoren, 83mm bij kwaadaardige tumoren, verschil 23
§ 70mm bij goedaardige tumoren, 97mm bij kwaadaardige tumoren, verschil 27
§ 56mm bij goedaardige tumoren, 111mm bij kwaadaardige tumoren, verschil 55
§ 56mm bij goedaardige tumoren, 68mm bij kwaadaardige tumoren, verschil 12
§ 56mm bij goedaardige tumoren, 53 bij kwaadaardige tumoren, verschil -3
§ …
Dit laat ons toe om de variabiliteit in het geschatte verschil te zien. We plotten die schattingen in een
histogram
Dit doen we nu eens met 100 random steekproeven van 100, en met 100 random steekproeven van 500
deelnemers. Dit laat ons toe om te bekijken of en hoe de variabiliteit in de schattingen afneemt met
steekproefgrootte. Met andere woorden: om te zien hoe steekproefgrootte helpt om het signaal te zien
9
, De ruis wordt meer en meer geneutraliseerd als de steekproef groter wordt. Hoe groter de steekproef hoe
zuiverder het signaal, want minder ruis
Conclusie
§ Het leven is niet deterministisch: er is variatie tussen individuen
§ We proberen die variatie te modelleren / analyseren door datasets met replicaties
§ Steekproeven hebben ruis en we kennen de waarheid (signaal) niet
§ Signaal kan variëren in sterkte: sommige associaties of effecten zijn sterker dan andere
§ Meer replicaties (hogere steekproefgrootte) reduceren impact van ruis, onzekerheid rond
schattingen wordt kleiner
§ Statistische analyses zijn geen orakel en bevatten onzekerheid!
DEEL 3: SOORTEN DATA EN STATISTISCHE MATEN (NOG HERBEKIJKEN)
DATASTRUCTUREN
Je wil een variabele vergelijken tussen twee groepen. Er zijn twee basis data structuren:
à Gepaarde groepen (paired) VS ongepaarde groepen (unpaired)
Hierop voortbouwend zijn uiteraard complexere structuren mogelijk.
Ongepaarde data
Gepaarde data
10