Video 1: DAG
Directed Acyclic Graphs
= Grafische weergave van de causale structuur die ten grondslag ligt aan de
onderzoeksvraag.
- Kennis nodig om de DAG te tekenen.
- Voor start van onderzoek DAG tekenen.
1.
1.
1.
1.
1.
1.
1.
1.
Paths
Elke route tussen X en Y
o Paden: 5
2. Causal paths and backdoor paths
Causal volgt richting pijlen en backdoor niet
o Causal: 2
o Backdoor: 3
3. Open and closed paths
Gesloten is als pijlen botsen genaamd collider
o Open: 4
o Closed: 1
4. Blocking open paths
Open pad wordt geblofkkeerd, omdat we corrigeren voor minstens 1 variabele (L).
Door de variabele (l) mee te nemen in de regressieanalyse. Alle open backdoor paths
in analyse.
o L is confounder, blocking pad L
5. Opening blocked paths
Als je collider opneemt in analyse krijg je bias
o Collider W in analyse = bias
,HC1: Causale inference
Causale inference
Niet geïnteresseerd in uitkomst
Wel in rol van de behandeling in het bereiken van het resultaat
Dus exposure measure en niet outcome measure
Causal effect
= Bij een individu heft een behandeling een causal effect als de uitkomst bij behandeling 1
anders zou zijn dan bij behandeling 2.
Potential outcome approach
Wat zou er gebeeurd zijn als…
What would have happened
What will happen
Kan niet!! In realiteit wel OF niet behandeld.
Dus controlegroep nodig.
Counterfactual outcome is potentiële uitkomst die niet wordt waargenomen.
Belangrijk om controlegroep te gebruiken.
Identifiability conditions
Average causal effect vaststellen, dan voldoen aan onderstaande 3 voorwaarden:
1. Positivity
= In beiden groepen moeten voldonede mensen zitten.
= Positive probability om toegewezen te worden.
- Bv mensen met én zonder aansteker.
- Bv genoeg mensen die thuis de behandeling krijgen.
2. Consistency
= De interventie moet concreet geformuleerd/well-defined zijn.
- Bv plastic aansteker hebben is niet specifiek genoeg. Moet deze werken? Is 2 of meer
aanstekers ook goed?
3. Exchangeability
= De groepen zijn vergelijkbaar aan elkaar. Het maakt niet uit wie in welke groep zit.
- Bv niet in ene groep jongeren en andere groep alleen maar ouderen.
- Bv niet in ene groep hoog inkomensklasse en andere niet.
Exchangeability conditions, 4 manieren
1. RCT
Randomisatie: Individuen worden willekeurig toegewezen ‘gouden standaard’
50% wel medicijn, 50% placebo.
- Nadeel: Je moet een grote sample size hebben.
2. Matching
, Individuen zoeken met dezelfde kenmerken.
Bv 22 jaar, vrouw, volleybal en dan krijgt persoon A wel de behandeling en persoon B
niet.
- Nadeel: Moeilijk bij veel dezelfde karakteristieken.
3. Stratificatie
Selecteer willekeurig individuen uit verschillende subgroepen (strata).
Bv strata inkomen hoog/laag random selectie sample
- Nadeel: Onmogelijk bij veel karakteristieken.
- Nadeel: Moeilijk om aan positivity te voldoen.
4. Adjustment/aanpassing
Controle voor factoren die de associatie tussen X en Y in de regressie analyse
aanpassen.
Kan in combinatie met de eerste exchangeability 3 condities.
Causale claims
Beleidsmakers, managers, etc. zijn geïnteresseerd in causale effecten, niet alleen in
correlaties.
- Correlatie impliceert associatie, geen oorzakelijk verband
- Er moet aan de identifiability conditions worden voldaan
- Let dus op dat claims vaak niet kloppen
Traditionele selectiemethoden, zoals alleen de statistisch significante uitkomsten behouden
in regressie zorgt voor bias, dus niet doen.
Gebruik DAG’s
- Alleen als je 100% zeker weet dat er geen causale relatie is, dan teken je geen pijl.
DAG
Directed: Verbinding X en Y volgt richting van de pijlen.
Acyclic: Kan niet rond gaan. Een pad van pijlen komt nooit bij zijn oorsprong.
Graph
Confouding= Vertekening (bias) door gemeenschappelijke oorzaak van X en Y (L)
Confounder= Elke variabele die gebruikt kan worden om confounding te
verwijderen (L en M)
Collider= Variabele waar 2 pijlen in een DAG botsen
Gemeenschappelijk effect van X en Y of van voorgangers van X en Y
Blocking= Backdoor path verwijdeeren uit associatie door te corrigeren voor een
variabele op dat pad (variabele mag geen collider zijn) ‘block the bias’ door
confounder op te nemen.
Unblocking= Backdoor path openen door te corrigeren (adjusting) voor een collider
op dat pad.
Voor colliders (W) mag je niet corrigeren, dan veroorzaak je bias. Dus unblocking is
niet goed.
,Collider (botsing)
Closed path; dus als pijlen botsen tussen X en Y
Adjusting/corrigeren voor een collider opent een pad Maar eigenlijk moeeten de
paden van een backdoor path gesloten zijn
Als eer een reden is om het pad te openen, dan moet je info van een andere variabele
hebben om het pad te sluiten.
- Dus door info van weight loss te hebben, kun je voorspellen wat de waarschijnlijke
relatie is tussen diet en disease.
Keep the backdoor paths closed. If you have to open a backdoor path, make sure you close it
by controlling by an other variabele on that path.
Selectie/colliderbias= Wanneer je corrigeert voor een collider.
Je weet dan niet zeker of het causalee effect juist is, omdat er ook andere variabelen
een rol kunnen spelen Er is bias.
Confounding bias= Wanneer X en Y een gemeenschappelijke oorzaak hebben,
waarvoor je niet hebt gecorrigeerd Er is bias.
,WG1: DAG’s
Collider (W) Niet meenemen in analyse, want dan krijg je bias.
Dus unblocking W (backdoor path) open maken, niet doen!
Confounder (C) Blocking backdoor path C, want die wil je meenemen in de analyse.
RQ: Wat is het effect van de plaats van de behandeling op de zorgkosten (van de
behandeling van exacerbatie bij patiënten met COPD)?
- Soms moet je tussen regels lezen wat onderzoeker precies wil onderzoeken, in dat
geval is de onderzoeksvraag impliciet.
- Dus dan staat er niet duidelijk ‘het doel of de doelstelling is…’
Aantal paden: 10
Open: 8 Gesloten: 2
Causaal: 1 Backdoor: 9
Collider: ernst klachten
Confounder: ernst klachten, geslacht, leeftijd
Wel voor de collider ernst klachten corrigeren.
Doordat we ook voor geslacht en leeftijd corrigeren, worden de paden opnieuw gesloten.
‘We close the collider pack’
We moeten aan 3 condities voldoend om causale claims te maken.
Adjusting (corrigeren) hoort bij de conditie exchangeability.
Redenen waarom voor managers, beleidsmakers, verzekeraars belangrijk is om inzicht in de
kosten van behandeling ziekenhuis of thuis te krijgen?
o Geïnformeerde besluitvorming
In staat om geïnformeerde beslissingen te nemen over toewijzing van middelen.
o Optimalisatie van middelen
Inzicht in kostenverschillen ziekenhuis of thuis kan verzekeraar zorgmiddelen
optimaliseren en investeringen richten op kosteneffectieve zorginstellingen.
o Beleidsontwikkeling
Leidt tot gerichte interventies die de toegankelijkheid van zorg, betaalbaarheid en
prestaties van het zorgstelsel verbeteren.
o Kwaliteitsbeoordeling
Kostenanalyse helpt bij beoordelen kwaliteit van behandeling wat zorgstandaard
voor COPD verbetert.
, o Economische impact
Bewust zijn van kosten COPD behandeling geeft prikkels, waardoor
beleidsmaatregelen worden genomen om economische gevolgen effectief te
beheersen.
Voorwaarden causale claims:
1. Positivity
Beiden groepen voldoende mensen hebben
- Je moet mensen hebben die roken en die niet roken.
2. Consistency
- Well defined interventie: Interventie moet duidelijk gespecificeerd zijn.
- Geen attribuut van de individu: Interventie moet extern zijn aan de individuen die
worden bestudeerd. Bv interventie lichaamsbeweging moet hetzelfde zijn voor elke
individu, niet afhankelijk van leeftijd of geslacht.
- No causal interference: De uitkomst van een individu mag niet beïnvloed zijn door
het feit dat andere individu werd behandeld. Dus uitkomst moet alleen afhankelijk
zijn van eigen behandelstatus.
3. Exchangeability
De groepen zijn vergelijkbaar. Het maakt niet uit wie behandeld wordt en wie niet.
- 4 manieren om aan exchangeability conditions te voldoen
RCT, matching, stratificatie, adjustment in regressieanalyse.
Het voldoen aan deze 3 voorwaarden is noodzakelijk voor managers, beleidsmakers,
verzekeraars, omdat;
Nodig om hen van betrouwbare informatie te voorzien om;
- Goed geïnformeerde beslissingen te nemen
- Effectieve interventies te ontwikkelen/implementeren
- Middelen verstandig toe te wijzen
- Beleid creëren dat optimale patiënten resultaten en prestaties van het
gezondheidszorgsysteem bevordert.
In casus probleem in een va de 3 voorwaarden? Voorbeeldantwoorden;
1. Positivity
Nee, ervan uitgaande dat de steekproef mensen uit alle klassen bevat van SES (laag,
midden, hoog inkomen).
+ Alle klassen mensen met verschillende kenmerken bevat.
2. Consistency
Ja, er zijn verschillende manieren om tot een SES-categorie te behoren. Bv hoge
opleiding en laag inkomen of andersom. Dus de behandeling is niet goed genoeg
gespecificeerd.
3. Exchangeability
Behandeling (in dit geval behoren tot specifieke SES-categorie) zou omgewisseld
kunnen worden met controlegroep, na evt. statistische aanpassingen.
,Andere voorbeelden waarbij niet wordt voldaan:
1. Positivity
Bv ontbreken van controlegroep
Bv onderzoek zeldzame ziekte: 1) niet genoeg individuen voor zowel interventie +
controelgroep. 2) Niet ethisch verantwoord om een groep patiënten de behandeling
niet te geven.
2. Consistency
Bv voorlichtingsprogramma wordt op verschillende manieren gegeven aan
verschillende groepen (andere locaties en demografische kenmerken).
3. Exchangeability
Bv kenmerken waarvoor de onderzoekers niet hebben gecorrigeerd.
Bv alleen jonge en gezonde mensen kiezen voor een procedure bij verzekerden.
PC1: OLS regression
DAG
Exposure: treatment
Outcome: CCQ after 7 days
Confounder: age, CCQ at baseline, sex
Collider: CCQ at baseline
Intermediate: -
Aantal paden: 10
Causal: 1 Backdoor: 9
Open: 8 Closed: 2
o Boxplot is unadjusted; het is de vergelijking van X en Y
P-waarde > 0.05 NIET statistisch significant
0 valt in CI NIET statistisch significant
Als je een causale claim wil maken, moet je de confounders meenemen in de analyse.
Anders krijg je bias.
Unadjusted kan dus biased zijn.
Coefficient CCQ_7days: treatment 0.247
Coefficient CCQ_6weeks: treatment 0.097
Het verschil op dag 7, was bij 6 weken zo goed als verdwenen.
De resultaten geven niet aan dat er grote verschillen in CCQ-score tussen de
behandelgroepen zijn.
,CI 0 valt er in, dus NIET statistisch significant.
Dus onzekerheid over de sample.
Video 2: OLS regression
Continuous variabele
Kunnen elke waarde aannemen binnen een bepaald bereik.
o Leeftijd, BMI, pijnscore, afstand, wachttijd.
OLS regressie
Dichotomous variabele
Hebben alleen 2 potentiële (vaak binary) uitkomsten.
o Gezondheidsstatus verzekerd/niet verzekerd, leeftijd <40jr ja/nee
Logistic regressie
RQ: Wat is effect van lengte op gewicht?
(X)lengte ----------------- (Y) gewicht
Gewicht= B0 + B1 * lengte
B0= Constante/y-intercept
B1= Gemiddeld effect van lengte (+1cm) op gewicht
DAG’s helpen bij het interpreteren van B coëfficiënten.
DAG Analyse Resultaten Interpretatie
HC2: OLS and moderation
Moderatie
RQ: Wat is de invloed van geslacht op de relatie tussen lengte en gewicht?
Nooit pijl op pijl, geen onderdeel van DAG.
Om RQ te beantwoorden heb je extra variabele in regressie nodig, de interactie tussen
lengte en geslacht.
Interaction term= Combinatie van 2 variabelen.
- Kijken of de moderator (variabele) invloed heeft op de behandeling.
- Dus hoeveel is het per groep verschillend.
Gelsacht coding in data:
0=mannen 1=vrouwen
,Interactieterm: Combinatie gelacht en lengte:
0* hoogte voor mannen
1* hoogte voor vrouwen
Moderatie gaat dus niet over bias, maar het (verder) onderzoeken van het effect van
lengte op gewicht.
Coëfficiënt voor interactieterm geeft ‘extra’ effect in subgroep (hier vrouwen)
Mediation
Opname van tussenliggende variabelen, WEL onderdeel van DAG.
XVY
Waarom heeft X dit effect, komt het (mede) door V?
- Associatie wordt veroorzaakt door alle open paden dus nemen V ook mee in de
analyse als aparte coëfficiënt.
- Dus blocking V.
Not adjusting for mediator
- B representeert alle open paden
- B is full effect van roken op sterfte
Adjusting for mediator
- B1 en B2 representeren 1 open pad
- B1 is partial effect van roken op sterfte
- B2 is full effect van longkanker op sterfte
Beiden unbiased, want roken is confounder maar hebben we gecorrigeerd.
Bij full effect kijk je naar het geheel. De paden met colliders, gesloten paden, hou je gesloten.
Bij partial effect is dat pad niet gesloten.
Geïnteresseerd in
full effect:
- Not being able to adjust for U is not a problem, B = unbiased.
Geïnteresseerd in partial effect:
- Not being able to adjust for U is a problem, B = Biased.
Want dan is er gecorrigeerd voor een collider.
- Adjusting for U partial effect is not a problem, B = unbiased.
, Statistische significance
P-waarden worden gebruikt bij nulhypothese significantie testen (NHST)
P-waarde= De kans op het vinden van deze associatie (of sterker) in een steekproef als
‘echte’ associatie = 0 (dus als H0 waar is).
Verschil is ‘statistisch significant’ als P-waarde <0.05
P-waarde gaat dus over ‘niet 0’
Dus is de kans kleiner dan 0.05 of niet.
Strikt genomen is de nulhypothese altijd fout. Als je goed genoeg kijkt is er altijd een
verschil.
Dus je kunt geen scientific claims maken o.b.v. p<0.05
Testen geeft dichotome resultaten: ja/nee
- Significant: bewijs voor associatie
- Niet significant: afwezigheid van bewijs
Dit ja/nee antwoord is niet interessant.
Dus concentreer niet op P-waarde. Significantietest zijn niet voldoende.
Kijk naar effectschatting
- Schatting gaat over grootte/sterkte van geschat effect.
- Veel informatiever
Is de schatting substantieel?
CI/betrouwbaarheidsinterval
=95% kans dat de CI de werkelijke waarde bevat als het onderzoek vaak wordt herhaald.
- CI omvat effectgrootte
- CI geeft gevoel van onzekerheid
WG2: Interpretation of study results bij OLS
Studie causal of associatief
Causaal: Woorden als ‘influence’
RQ: Wat is het effect op de beslissingen die mensen doen.
Conclusie: Claim ‘de besluitvorming van ouders worden beïnvloed…’
Unadjusted analyse
- Crude analyse
- Analyseert de relatie van 2 variabelen, zonder de invloed van andere variabelen te
overwegen.
- Geeft mogelijk geen compleet beeld en neemt confounders niet mee.
Adjusted analyse
- Neemt additionele variabelen (confounders) mee zodat het niet tot misleidende
conclusies zorgt.
- Zorgt voor meer accuraat maat van de echte relatie tussen variabelen.