Herhaling - beschrijvende en inferentiële statistiek................................................................................... 3
Basis statistische concepten...................................................................................................................... 3
Steekproef vs. populatie.......................................................................................................................3
Statistische significantie vs. klinische relevantie.................................................................................. 3
Methoden van onderzoek.....................................................................................................................3
Soorten data.........................................................................................................................................4
Data samenvatten...................................................................................................................................... 4
Kengetallen voor locatie....................................................................................................................... 4
Rekenkundig gemiddelde............................................................................................................... 4
Mediaan..........................................................................................................................................4
Kwartielen.......................................................................................................................................4
Kengetallen voor spreiding...................................................................................................................5
Variantie..........................................................................................................................................5
Standaardafwijking......................................................................................................................... 5
Bereik............................................................................................................................................. 5
Interkwartielafstand........................................................................................................................ 6
Weergeven van data - boxplot............................................................................................................. 6
Het schatten van het populatiegemiddelde (puntschatten).................................................................. 6
Toetsen van hypothesen............................................................................................................................ 6
Toetsingsfouten.................................................................................................................................... 6
Algemene toetsingsprocedure..............................................................................................................7
Toetsen van hypothese over een populatiegemiddelde....................................................................... 7
1. Typische toetsingsproblemen (voor 1-steekproeven probleem).................................................7
2. Toetsingsgrootheid berekenen................................................................................................... 7
3. Beslisregel construeren.............................................................................................................. 8
Toetsen van hypothese over een populatieproportie............................................................................8
1. Typische toetsingsproblemen (voor 1-steekproeven probleem).................................................9
2. Toetsingsgrootheid..................................................................................................................... 9
Overview van statistische testen voor locatie.............................................................................................9
Parametrisch vs. non-parametrisch......................................................................................................9
One-sample t-test.................................................................................................................................9
Paired-sample t-test........................................................................................................................... 10
Unpaired-sample t-test = two-sample t-test........................................................................................10
One-sample z-test.............................................................................................................................. 11
Two-sample z-test.............................................................................................................................. 11
One-way ANOVA................................................................................................................................ 11
ANOVA model.............................................................................................................................. 12
Formules.......................................................................................................................................12
Post hoc comparisons.................................................................................................................. 13
Enkelvoudige lineaire regressie................................................................................................................. 14
Van statistisch testen naar regressiemodellen......................................................................................... 14
Statistische testen.............................................................................................................................. 14
Regressiemodellen.............................................................................................................................14
Enkelvoudige lineaire regressie............................................................................................................... 15
Schatten van intercept en richtingscoëfficiënt................................................................................... 16
Kleinste kwadraten criterium........................................................................................................ 16
, Verklarende statistiek voor en........................................................................................................... 18
(globale) F-test voor enkelvoudige lineaire regressie.........................................................................18
T-test voor enkelvoudige lineaire regressie........................................................................................19
Weergave in “R”................................................................................................................................. 20
Betrouwbaarheidsintervallen voor de regressieparameters en............................................................... 21
Betrouwbaarheidsinterval voor rico.................................................................................................... 21
Betrouwbaarheidsinterval voor intercept............................................................................................ 22
Op 95% BI nagaan of er een significant effect is............................................................................... 23
Weergave in “R”................................................................................................................................. 23
Predictie-intervallen..................................................................................................................................23
Predictie-interval voor y horende bij een gegeven x-waarde............................................................. 23
Weergave in ‘R”............................................................................................................................24
BI voor E(y) horende bij een gegeven X-waarde............................................................................... 24
Weergave in ‘R”............................................................................................................................25
Correlatiecoëfficiënt..................................................................................................................................25
Verband tussen b en r........................................................................................................................ 26
Weergave in “R”................................................................................................................................. 26
Meervoudige lineaire regressie.................................................................................................................. 27
Meervoudige lineaire regressie (voor 2 covariaten)................................................................................. 27
Schatten van regressieparameters.................................................................................................... 27
Interpretatie van de regressiecoëfficiënten........................................................................................ 28
Adjusted R²...................................................................................................................................28
Gestandaardiseerde regressiecoëfficiënt........................................................................................... 28
Voorbeeld: hypertensie.......................................................................................................................29
Weergave in “R”................................................................................................................................. 30
Meervoudige lineaire regressie (voor k covariaten)................................................................................. 30
Toetsen voor de hele groep van regressoren (globale F-test)............................................................30
Weergave in “R”........................................................................................................................... 31
Toetsen voor één regressor (partiële t-test)....................................................................................... 31
Weergave in “R”........................................................................................................................... 32
Partiële F-test..................................................................................................................................... 32
Vergelijken met één covariaat...................................................................................................... 32
Vergelijken met groep van covariaten.......................................................................................... 33
Weergave in “R”........................................................................................................................... 33
Enkelvoudige vs. meervoudige lineaire regressie.................................................................................... 34
Interactie-effecten.....................................................................................................................................34
Categorische variabelen.....................................................................................................................34
Visualisatie van een interactie-effect.................................................................................................. 34
Modelbouw............................................................................................................................................... 35
Veralgemeende lineaire regressie: logistische regressie........................................................................ 36
Bernoulli verdeling (herhaling)................................................................................................................. 36
Logistische regressie................................................................................................................................36
Link-functie......................................................................................................................................... 36
Expit..............................................................................................................................................37
Veralgemeende lineaire modellen (GLM).................................................................................................37
Schatten van de regressieparameters in GLM...................................................................................38
Maximum likelihood methode (ML)...............................................................................................38
Voorbeeld: varicella............................................................................................................................ 39
1
, Weergave in “R”........................................................................................................................... 39
Interpretatie........................................................................................................................................ 40
Wald-test (z-test).......................................................................................................................... 40
Schattingen maken (weergave in “R”).......................................................................................... 41
Likelihood-ratio test voor categorische variabelen............................................................................. 41
Weergave in “R”........................................................................................................................... 42
Meervoudige logistische regressie..................................................................................................... 42
Weergave in “R”........................................................................................................................... 42
Veralgemeende lineaire regressie: Poisson regressie............................................................................. 44
Poissonverdeling...................................................................................................................................... 44
Poisson regressie.....................................................................................................................................44
log-link functie: transformatie g zodat g() (-, +)..................................................................................44
Veralgemeende lineaire modellen (GLM).................................................................................................45
Model opstellen op basis van de 3 componenten........................................................................ 45
Schatten van de regressieparameters in GLM...................................................................................45
Maximum likelihood methode (ML)...............................................................................................45
Voorbeeld: hospitaalgegevens........................................................................................................... 46
Weergave in “R”........................................................................................................................... 46
Interpretatie........................................................................................................................................ 46
Wald-test (z-test).......................................................................................................................... 47
Voorbeeld: hospitaalgegevens..................................................................................................... 47
Weergave in “R”........................................................................................................................... 47
Likelihood-ratio test voor categorische variabelen............................................................................. 48
Meervoudige Poisson regressie......................................................................................................... 48
Weergave in “R”........................................................................................................................... 48
Akaike’s Information Criterion (AIC)......................................................................................................... 49
2
,Herhaling - beschrijvende en inferentiële statistiek
Xi = stochastische veranderlijke, een observeerbare grootheid waarvan de uitkomst van het toeval afhangt
en die zich voordoet met een bepaalde kans
xi = heeft een waarde
Basis statistische concepten
Steekproef vs. populatie
populatie
● een duidelijk gedefinieerde groep van subjecten waarin de onderzoeker geïnteresseerd is vanuit
wetenschappelijk oogpunt
● vaak te groot om alle subjecten te onderzoeken (te duur, te weinig tijd, te weinig middelen …)
steekproef
● een eindige verzameling van studie objecten, waarvoor geobserveerde karakteristieken en
uitkomstwaarden worden gemeten
● dient representatief te zijn voor de studie populatie
Statistische significantie vs. klinische relevantie
statistisch significant
● gebaseerd op metingen, observaties, getallen …
● statistische expertise is vereist
klinische relevantie
● Welke research questions zijn relevant om te beantwoorden?
● wordt bepaald op basis van domeinspecifieke expertise
● medical doctor, clinical investigator, lab-researcher …
⇒ statistische significantie ≠ klinische relevantie
bv. steekproef is statistisch significant als de steekproefgrootte naar oneindig gaat, maar dan is de studie
niet meer klinisch relevant
Methoden van onderzoek
experimentele studies (gecontroleerde experimenten)
● het effect van een behandeling onderzoeken
● onderzoeker heeft de controle, kan bepalen wat de condities van het experiment zijn
● doel: (oorzakelijk) verband zoeken
● bv. clinical trials
○ randomisatie = het willekeurig indelen van subjecten in behandelings- en controlegroep
■ factoren die invloed kunnen hebben op de relatie tussen behandeling en uitkomst
willekeurig verdelen over de verschillende groepen
○ blinding = arts en/of patiënt weten niet tot welke groep patiënten behoren
○ placebo = niet-actieve behandeling
observationele studies
● geen actieve interventie bij de onderzochte subjecten
● onderzoeker heeft geen controle, louter observeren
● doel: geen conclusies over oorzakelijke verbanden, enkel mogelijke associaties
● bv. heeft roken effect op longkanker?
3
, Soorten data
kwalitatieve = categorische data
● dichotomie = categorisch systeem met 2 categorieën
○ bv. man/vrouw, dood/levend …
● nominaal = categorische data die gebruikt wordt om een object/karakteristiek te classificeren
(zonder ordening)
○ bv. geslacht, regio, oogkleur
● ordinaal = categorische data met een specifieke ordening
○ bv. heel goed, goed, middelmatig, slecht, heel slecht, leesniveau (A1-A7)
kwantitatieve = numerieke data
● discreet = meetgegevens waarvoor de waarden niet arbitrair dicht bij elkaar kunnen liggen
○ bv. aantal zwangerschappen, aantal sterfgevallen, aantal hartslagen per minuut
● continu = meetgegevens die alle waarden in een bereik kunnen aannemen
○ bv. gewicht, lengte, BMI, bloeddruk
Data samenvatten
kengetallen voor locatie
● (rekenkundig) gemiddelde → wordt beïnvloed door uitschieters
● mediaan
● (kwartielen)
kengetallen voor spreiding
● variantie en standaardafwijking
● bereik
● interkwartielafstand (IQR)
Kengetallen voor locatie
Rekenkundig gemiddelde
het rekenkundig gemiddelde 𝑥 van numerieke gegevens x1, …, xn is het getal
indien de data gegeven is in frequentietabel met n gegevens en p verschillende waarden van x:
⇒ gevoeliger voor uitschieters !
Mediaan
de mediaan van een rij van n numerieke gegevens is, nadat deze rij als gerangschikte tabel is herschreven
● n oneven: het middelste getal
● n even: het rekenkundig gemiddelde van de twee middelste getallen
Kwartielen
4