DATA-ANALYSE
DEEL 1: INTRODUCTION, MOTIVATION & EXAMPLE
1.Introductory material
Statistiek: overal nodig thesis, correct interpreteren van data…
2.Homeopathy: the test
Belangrijk concept: blindering onderzoeker mag niet weten welke stalen onderzocht
worden door random codes aan te brengen op de stalen
Dubbele blindering: noch onderzoeker, noch patiënt mag weten wat placebo & GM is
Placebo/controlegroep altijd nodig om werking nieuw GM aan te tonen
2x2 tabel om resultaten weer te geven
Wat we onderzoeken: Hoe groot is de KANS dat dit resultaat toeval is? variabiliteit
DEEL 2: BASIC PRINCIPLES OF STATISTICAL METHODOLOGY
3.What is statistics?
Vb. ziekteverzuim:
Bestaat er een correlatie tussen geslacht en ziekteverzuim?
Hoe groot is de kans dat er door puur toeval toch verschillen zijn tussen man en
vrouw in de steekproef terwijl er in werkelijkheid geen verschillen zijn?
Vb. Cervix kanker:
Hoe groot is de kans dat de geobserveerde correlatie tussen de leeftijd & kanker
toeval is?
Vb. overlevingskans bij kanker patiënten: kleine dataset
Is er een correlatie tussen soort kanker & overlevingskans?
Hoe groot is de kans dan gemiddeld #dagen overleven & soort kanker berust op puur
toeval?
Vb. BD & GM
Gemiddelde BD daalt, maar verschil per patiënt variabiliteit is reden voor twijfel,
daarom weten wat de kans is dat dit gebeurt door puur toeval
Vb. verkoudheid & leeftijd: continue data > binaire data (ja/nee)
Conclusie:
Discriptive/beschrijvende statistiek: samenvatten & beschrijven van data opdat de
relevante aspecten duidelijk zijn beperkt zich tot steekproef
Vb. tabellen, grafieken, gemiddelden…
Inferentieele statistiek: bestuderen hoe geobserveerde trends zich vertalen naar een
algemene populatie vanuit steekproef uitspraken doen op de populatie
(interferentie tss steekproef en populatie)
, 4.Population vs. sample
Populatiecriteria gebaseerd op inclusie- & exclusie criteria
Inclusie moet voldaan zijn vb. bepaalde aandoening
Exclusie mag niet voldaan zijn vb zwangerschap
Objectieve criteria om verwarring/ discussie te vermijden
Vb. niet: mensen met minstens 90 dagen overleving
Steekproef vb: verpleegkundigen met rugpijn
Je kan nooit een exacte representatie geven van de verpleegkundigen populatie
(#mannen, academische ziekenhuizen, leeftijd…)
Daarom: random steekproef = moeilijk in praktijk (o.a. door variabiliteit)
Steekproef Populatie statistiek
Kansrekenen
statistiek wil conclusies trekken over de populatie gebaseerd op wat geobserveerd is in het experiment
5. Causality and randomization
Causaal effect: samenstelling homeopathie-&controlegroep moet =zijn, anders zouden
uitkomsten hieraan toegeschreven kunnen worden
2 groepen zullen nooit helemaal = zijn, maar ze dienen wel gerandomiseerd te
worden (willekeurige opdeling)
Vb. computer bepaalt welke patiënt behandeling A of B krijgt
Randomisatie niet altijd mogelijk:
Ethische redenen vb. evolutie van baby met/zonder chemo onderzoeken + groepen
kunnen niet gerandomiseerd worden
Case-control study: verband tussen roken & longkanker adhv ondervraging over
rookgeschiedenis bij kanker patiënten vs niet-kankenr patiënten je kan niet
aantonen dat dit een causaal verband is (mss ook genetische factor….)
DEEL 3: DESCRIBING AND SUMMARIZING DATA
6. Types of outcomes
Kwalitatieve data: niet gekarakteriseerd door waarde van nummers
Dichotoom: 2 mogelijke waarden (vb overleving)
Nominaal: geen ordening (vb haarkleur)
Ordinaal: ordening (vb pijnschaal van nooit tot altijd, medailles volgorde heeft
betekenis)
Kwantitatieve data: waarde van nummers
Discreet: waarden zijn vast & gescheiden (vb hartritme)
DEEL 1: INTRODUCTION, MOTIVATION & EXAMPLE
1.Introductory material
Statistiek: overal nodig thesis, correct interpreteren van data…
2.Homeopathy: the test
Belangrijk concept: blindering onderzoeker mag niet weten welke stalen onderzocht
worden door random codes aan te brengen op de stalen
Dubbele blindering: noch onderzoeker, noch patiënt mag weten wat placebo & GM is
Placebo/controlegroep altijd nodig om werking nieuw GM aan te tonen
2x2 tabel om resultaten weer te geven
Wat we onderzoeken: Hoe groot is de KANS dat dit resultaat toeval is? variabiliteit
DEEL 2: BASIC PRINCIPLES OF STATISTICAL METHODOLOGY
3.What is statistics?
Vb. ziekteverzuim:
Bestaat er een correlatie tussen geslacht en ziekteverzuim?
Hoe groot is de kans dat er door puur toeval toch verschillen zijn tussen man en
vrouw in de steekproef terwijl er in werkelijkheid geen verschillen zijn?
Vb. Cervix kanker:
Hoe groot is de kans dat de geobserveerde correlatie tussen de leeftijd & kanker
toeval is?
Vb. overlevingskans bij kanker patiënten: kleine dataset
Is er een correlatie tussen soort kanker & overlevingskans?
Hoe groot is de kans dan gemiddeld #dagen overleven & soort kanker berust op puur
toeval?
Vb. BD & GM
Gemiddelde BD daalt, maar verschil per patiënt variabiliteit is reden voor twijfel,
daarom weten wat de kans is dat dit gebeurt door puur toeval
Vb. verkoudheid & leeftijd: continue data > binaire data (ja/nee)
Conclusie:
Discriptive/beschrijvende statistiek: samenvatten & beschrijven van data opdat de
relevante aspecten duidelijk zijn beperkt zich tot steekproef
Vb. tabellen, grafieken, gemiddelden…
Inferentieele statistiek: bestuderen hoe geobserveerde trends zich vertalen naar een
algemene populatie vanuit steekproef uitspraken doen op de populatie
(interferentie tss steekproef en populatie)
, 4.Population vs. sample
Populatiecriteria gebaseerd op inclusie- & exclusie criteria
Inclusie moet voldaan zijn vb. bepaalde aandoening
Exclusie mag niet voldaan zijn vb zwangerschap
Objectieve criteria om verwarring/ discussie te vermijden
Vb. niet: mensen met minstens 90 dagen overleving
Steekproef vb: verpleegkundigen met rugpijn
Je kan nooit een exacte representatie geven van de verpleegkundigen populatie
(#mannen, academische ziekenhuizen, leeftijd…)
Daarom: random steekproef = moeilijk in praktijk (o.a. door variabiliteit)
Steekproef Populatie statistiek
Kansrekenen
statistiek wil conclusies trekken over de populatie gebaseerd op wat geobserveerd is in het experiment
5. Causality and randomization
Causaal effect: samenstelling homeopathie-&controlegroep moet =zijn, anders zouden
uitkomsten hieraan toegeschreven kunnen worden
2 groepen zullen nooit helemaal = zijn, maar ze dienen wel gerandomiseerd te
worden (willekeurige opdeling)
Vb. computer bepaalt welke patiënt behandeling A of B krijgt
Randomisatie niet altijd mogelijk:
Ethische redenen vb. evolutie van baby met/zonder chemo onderzoeken + groepen
kunnen niet gerandomiseerd worden
Case-control study: verband tussen roken & longkanker adhv ondervraging over
rookgeschiedenis bij kanker patiënten vs niet-kankenr patiënten je kan niet
aantonen dat dit een causaal verband is (mss ook genetische factor….)
DEEL 3: DESCRIBING AND SUMMARIZING DATA
6. Types of outcomes
Kwalitatieve data: niet gekarakteriseerd door waarde van nummers
Dichotoom: 2 mogelijke waarden (vb overleving)
Nominaal: geen ordening (vb haarkleur)
Ordinaal: ordening (vb pijnschaal van nooit tot altijd, medailles volgorde heeft
betekenis)
Kwantitatieve data: waarde van nummers
Discreet: waarden zijn vast & gescheiden (vb hartritme)