Chapter 1: Some references .................................................................................................................... 8
Part 1: Fundamental concepts .................................................................................................................... 8
Chapter 2: Introductory material .......................................................................................................... 8
2.1 Motivatie......................................................................................................................................... 8
Chapter 3: What is statistics? .................................................................................................................. 8
3.1 Voorbeeld: Captopril® data ........................................................................................................ 8
3.2 Populatie vs random steekproef ................................................................................................. 9
3.3 Het doel van statistiek .................................................................................................................. 9
Chapter 4: Summary statistics ................................................................................................................ 9
4.1 Introductie ..................................................................................................................................... 9
4.2 Meten van locatie .......................................................................................................................... 9
4.3 Meten van spreading................................................................................................................... 10
4.4 Percentages .................................................................................................................................. 12
Chapter 5: Confidence intervals & hypothesis testing ..................................................................... 13
5.1 Random variabiliteit.................................................................................................................... 13
5.2 Het betrouwbaarheidsinterval ................................................................................................... 14
5.3 Interpretatie van het betrouwbaarheidsinterval ...................................................................... 15
5.4 Hypothese testing ................................................................................................................ 15
5.5 Hypothese testing vs betrouwbaarheidsintervallen ........................................................ 17
5.6 Voorbeeld uit de biomedische literatuur .......................................................................... 17
5.7 Enkele verdere beschouwingen bij het toetsen van hypothesen .................................. 18
5.8 Overzicht: standaarddeviatie, standaardfout, p-waarde en BI ...................................... 18
5.9 SAS voorbeeld Captopril® data ........................................................................................ 20
5.10 Nog enkele beschouwingen over het design ................................................................... 20
Chapter 6: Use and misuse of statistics .............................................................................................. 20
6.1 Mogelijke fouten in beslissingen nemen .................................................................................. 20
6.2 Twee types fouten ....................................................................................................................... 20
6.3 Overzicht: nominaal niveau, power en type II fout ............................................................... 20
6.4 Multiple testing ............................................................................................................................ 21
6.5 Verdere beschouwingen omtrent ‘Multiple testing’ ............................................................... 21
6.6 Equivalentie testen ...................................................................................................................... 22
6.7 Voorbeeld uit de biomedische literatuur ................................................................................. 22
6.8 Significantie vs relevantie ........................................................................................................... 22
6.9 Overzicht mbt de 4 toetsingssituaties ...................................................................................... 23
6.10 Toetsingssituaties: een voorbeeld ........................................................................................... 23
6.11 Meer over eenzijdig/tweezijdig en non-inferior/equivalent .............................................. 23
6.12 Toetsingsituaties: voorbeelden................................................................................................ 24
6.13 Een eerste blik op steekproefgrootte berekening ................................................................ 24
Chapter 7: Data structures and types .................................................................................................. 24
7.1 Niveaus van complexiteit ........................................................................................................... 24
7.2 Multivariate analyse..................................................................................................................... 26
, 7.3 Algemene multivariate setting ................................................................................................... 26
7.4 Andere gecorreleerde data settings ........................................................................................... 26
7.5 Leeftijd gerelateerde maculaire degeneratie trial..................................................................... 26
7.6 Overzicht terminologie .............................................................................................................. 27
7.7 Correlatie, associatie en afhankelijkheid .................................................................................. 27
7.8 Schematische representatie ........................................................................................................ 28
7.9 Voorbeeldvragen ......................................................................................................................... 28
Part 2: Contingency tables......................................................................................................................... 28
Chapter 8: Kruistabellen ....................................................................................................................... 28
8.1 Parametrische en niet parametrische methoden ..................................................................... 28
8.2 Kruistabellen ................................................................................................................................ 29
8.3 Voorbeeld 1 ................................................................................................................................. 29
8.4 Statistische vraag ......................................................................................................................... 29
8.5 χ² test voor kruistabellen ........................................................................................................... 29
8.6 Voorbeeld 2 ................................................................................................................................. 30
8.7 Nog een woordje over p waarde bij χ² en kritisch punt bij een χ² veranderlijke .............. 32
8.8 Harmonische som in de χ² toetsstatistiek ............................................................................... 34
8.9 Continuïteit correctie en voorbeeld 3 ...................................................................................... 34
8.10 Geldigheid van de benadering ................................................................................................ 34
8.11 BI voor het verschil .................................................................................................................. 34
8.12 Overzicht ................................................................................................................................... 35
8.13 Uitbreiding vereist! ................................................................................................................... 35
8.14 Fisher’s exact test ...................................................................................................................... 35
8.15 Analyse van voorbeeld 1 .......................................................................................................... 36
8.16 Voorbeeld 3: preklinische test ................................................................................................. 37
8.17 χ² test versus Fisher’s exact test.............................................................................................. 37
8.18 Schatter voor de associatie ...................................................................................................... 37
8.19 R x C kruistabellen.................................................................................................................... 37
8.20 Voorbeeld 5 ............................................................................................................................... 38
8.21 Voorbeeld 6 ............................................................................................................................... 38
8.22 en 23 Voorbeeld 1 & 2: SAS voorbeeld χ² en Fisher’s exact ............................................. 39
8.24 Voorbeeld 5: SAS voorbeeld χ² en Fisher’s exact voor 2 x 3 tabel ................................... 39
8.25 Meerdere 2 x 2 tabellen ............................................................................................................ 39
8.26 Voorbeeld 7 ............................................................................................................................... 39
8.27 Mantel – Haenszel statistiek .................................................................................................... 40
8.28 Analyse van voorbeeld 7 .......................................................................................................... 40
8.29 Het weglaten van de statificerende variabele ........................................................................ 40
8.30 Voorbeeld 7: SAS en Cochran – Mantel – Haenszel ........................................................... 40
8.31 Gepaarde paren: McNemar’s Test ......................................................................................... 40
8.32 Onafhankelijke allergie test ..................................................................................................... 41
8.33 Voorbeeld 8: SAS en McNemar ............................................................................................. 41
Part 3: t test ................................................................................................................................................. 42
Chapter 9: Comparing groups with continuous outcomes: the t test ............................................ 42
9.1 Voorbeeld: Captopril® data ...................................................................................................... 42
9.2 Verschillen in DBP ..................................................................................................................... 42
9.3 Twee steekproeven t-test ........................................................................................................... 43
, 9.4 Gepaarde t-test ............................................................................................................................ 43
9.5 De rol van de t-verdeling ........................................................................................................... 44
9.6 Het effect van positieve correlatie bij gepaarde metingen .................................................... 44
9.7 t testen: concluderende opmerkingen ...................................................................................... 45
9.8 SAS voorbeeld gepaarde t toets ................................................................................................ 45
Part 4: Linear regression ............................................................................................................................ 45
Chapter 10: Introduction (illustratief voorbeeld) .............................................................................. 45
10.1 Probleemsetting ........................................................................................................................ 45
10.2 Steekproef .................................................................................................................................. 45
10.3 Verzamelde data ........................................................................................................................ 46
10.4 Terugblik en vooruitblik: t toets, ANOVA, lineaire regressive.......................................... 46
Chapter 11: Simple (single) linear regression ..................................................................................... 46
11.1 Introductie ................................................................................................................................. 46
11.2 De kleinste kwadraten methode ............................................................................................. 47
11.3 De som van de residu’s is gelijk aan 0 ................................................................................... 48
11.4 Illustratie + interpretatie .......................................................................................................... 48
11.5 Statistische interferentie ........................................................................................................... 49
11.6 Waarom staat ‘normaliteit’ tussen aanhalingstekens? .......................................................... 50
11.7 Overzicht en belang van ‘sums of squares’ voor zowel significantie en relevantie ......... 53
11.8 SAS voorbeeld van lineaire regressive ................................................................................... 54
Chapter 12: Model Diagnostics ........................................................................................................... 54
12.1 Voorbeeld .................................................................................................................................. 54
12.2 Model aannames ....................................................................................................................... 55
12.3 De aanname van lineariteit ...................................................................................................... 55
12.4 Kanttekening bij het gebruik van transformaties ................................................................. 57
12.5 Voorbeeld: length of stay versus ADL .................................................................................. 57
12.6 De aanname van constante variantie ..................................................................................... 57
12.7 Voorbeeld: length of stay vs ADL ......................................................................................... 58
12.8 De aanname van normaliteit / symmetrie ............................................................................ 58
12.9 Voorbeeld: Length of stay vs ADL ........................................................................................ 60
12.10 Algemene conclusie ................................................................................................................ 61
Chapter 13 Influential observations .................................................................................................... 61
13.1 Terminologie ............................................................................................................................. 61
13.2 Voorbeeld .................................................................................................................................. 61
13.3 Cook’s distance ......................................................................................................................... 64
13.4 Toepassing ................................................................................................................................. 64
13.5 Wat te doen met invloedrijke subjects? ................................................................................. 65
Part V: Analysis of variance ...................................................................................................................... 65
Chapter 14: 1-way ANOVA ................................................................................................................. 65
14.1 Voorbeeld .................................................................................................................................. 65
14.2 Gepaarde t toetsen.................................................................................................................... 66
14.3 1-way ANOVA ......................................................................................................................... 67
14.4 Illustratie..................................................................................................................................... 69
14.5 Model diagnostieken................................................................................................................. 69
, 14.6 Invloedrijke observaties ........................................................................................................... 71
14.7 SAS voorbeeld voor ANOVA op Captopril ® data ........................................................... 71
14.8 Voorbeeldvragen ....................................................................................................................... 71
Part VI: Logistic regression....................................................................................................................... 72
Chapter 15 Logistic regression............................................................................................................. 72
15.1 Een proportie ............................................................................................................................ 72
15.2 Formulatie van logistische regressie ....................................................................................... 72
15.3 Odds ratio .................................................................................................................................. 73
Chapter 16 Use of logistic regression ................................................................................................. 75
16.1 Mogelijke instellingen ............................................................................................................... 75
16.2 Effect van stratum .................................................................................................................... 75
16.3 Over baseline risico en relatief Risico .................................................................................... 76
16.4 Meerdere strata .......................................................................................................................... 77
16.5 Stratum effect: algemene situatie ............................................................................................ 77
16.6 Prospectief → retrospectief ................................................................................................ 77
16.7 Retrospectieve logistische regressive ..................................................................................... 77
16.8 Analoog: 2 x 2 tabellen............................................................................................................. 78
Chapter 17: Case study Ille-et-Villaine................................................................................................ 78
17.1 Ille-et-Villaine studie................................................................................................................. 78
17.2 De data voor een enkele binaire blootstelling ...................................................................... 78
17.3 De data ....................................................................................................................................... 79
17.4 Modelleren van een enkele binaire blootstelling .................................................................. 79
17.5 Het vergelijken van modellen, likelihood ratio statistiek en Pearson statistiek ............... 82
17.6 Residu’s....................................................................................................................................... 83
17.7 – 17.9 GEEN LEERSTOF..................................................................................................... 84
17.10 SAS illustratie logistische regressive ..................................................................................... 84
17.11 Voorbeeldvragen..................................................................................................................... 84
Part VII Surveys ..................................................................................................................................... 84
Chapter 18: Surveys: the Belgian Health Interview Survey ............................................................. 84
18.1 Achtergrond............................................................................................................................... 84
18.2 Verschillen in de besproken categorieën ............................................................................... 85
............................... 85
, 18.3 Overzicht van ontwerp ............................................................................................................ 85
18.4 Regionale stratificatie................................................................................................................ 85
18.5 Provinciale stratificatie in 1997 ............................................................................................... 86
18.6 Provinciale stratificatie in 2001 ............................................................................................... 86
18.7 Regionale stratificatie en provinciale oversampling ............................................................. 86
18.8 Provinciale stratificatie in 2004 ............................................................................................... 87
18.9 Overzicht van de stratificatie .................................................................................................. 87
18.10 Multi-stage sampling: PSU .................................................................................................... 87
18.11 Multi-stage sampling: SSU ..................................................................................................... 88
18.12 Multi-stage sampling: TSU .................................................................................................... 88
18.13 Overview van multi-stage sampling en clustering.............................................................. 88
18.14 Gewichten ................................................................................................................................ 89
18.15 Design → Analyse .................................................................................................................. 89
18.16 Grootte van steekproeven in deelgebieden ........................................................................ 89
18.17 Hoofdstuk 2: BHIS gedurende 1 week ipv het heel jaar................................................... 90
18.18 Proportionele vertegenwoordiging van statistische sectoren ........................................... 90
18.19 SAS voor schatting van gemiddelden in surveys................................................................ 90
Part VIII Clinical Trials ............................................................................................................................. 90
Chapter 19: Statistical methods in drug development ...................................................................... 90
19.1 Drug ontwikkeling en regulatie problemen .......................................................................... 90
19.2 Fasen van klinische studies ...................................................................................................... 92
19.3 Randomisatie ............................................................................................................................. 93
19.4 Enkele beschouwingen over (balans bij) randomisatie ....................................................... 94
19.5 Blinding ...................................................................................................................................... 95
19.6 Intentie tot behandelen ............................................................................................................ 96
19.7 Ethische overwegingen ............................................................................................................ 97
Chapter 20: Cross-over studies ............................................................................................................ 97
20.1 Cross over studies ..................................................................................................................... 97
20.2 Voordelen .................................................................................................................................. 97
20.3 Nadelen ...................................................................................................................................... 97
20.4 Verschillende vormen .............................................................................................................. 98
20.5 GEEN LEERSTOF ................................................................................................................ 98
Chapter 21 Some concepts on surrogate endpoints ......................................................................... 98
21.22 – 21 GEEN LEERSTOF .............................................................................................. 98
21.22 Voorbeeldvragen..................................................................................................................... 98
Part IX Repeated measures ....................................................................................................................... 98
Chapter 22 : Introduction ..................................................................................................................... 98
22.1 Groeicurves ............................................................................................................................... 98
22.2 Orthodontische groeidata ........................................................................................................ 99
22.3 De depressietrial......................................................................................................................100
22.4 Leeftijdsgerelateerde maculadegeneratie trial......................................................................100
22.5 De pijnstiller trial ....................................................................................................................100
Chapter 23: Het concept van longitudinale studies ........................................................................101
, 23.1 Herhaalde metingen / Longitudinale data ..........................................................................101
23.2 Captopril ® data .....................................................................................................................101
23.2 Lizard data ...............................................................................................................................102
23.4 Waarom is de mixed-model analyse efficienter? Het effect van positieve correlatie bij
herhaalde metingen .........................................................................................................................106
Chapter 24: Cross-sectional vs longitudinal data ............................................................................107
24.1 Introduction.............................................................................................................................107
24.2 Gepaarde vs ongepaarde t test ..............................................................................................107
24.3 Cross-sectionale vs longitudinale data .................................................................................108
Chapter 25: A proper tool: the lineair mixed model .......................................................................109
25.1 Het model ................................................................................................................................109
25.2 Willekeurige intercepten model ............................................................................................110
25.3 Opmerkingen...........................................................................................................................111
25.4 Lineaire mixed models ...........................................................................................................111
25.5 GEEN LEERSTOF ..............................................................................................................113
25.6 Voorbeeldvraag .......................................................................................................................113
Chapter 26 Repeated measures in BHIS & extensions to categorical data .................................114
26.1 – 3 GEEN LEERSTOF ........................................................................................................114
Part X Missing data ..................................................................................................................................114
26.4 Nog eens: Leeftijdsgerelateerde maculadegeneratietrial ....................................................114
26.5 Notatie ......................................................................................................................................115
26.6 Notatie: voorbeeld ..................................................................................................................115
26.7 Spelers op het veld..................................................................................................................115
26.8 Ri : de party crasher ................................................................................................................115
26.9 Het model dat we leuk vinden en het model dat we nodig hebben ................................116
26.10 Het missingness model ........................................................................................................116
26.11 Waar zijn we dan met analyseren van incomplete data ...................................................117
26.12 Direct likelihood/Bayesian interferentie: negeerbaarheid ..............................................117
26.13 Terminologie en verwarring ................................................................................................117
26.14 Taxonomie .............................................................................................................................118
............................................................................................................................................................118
26.15 Een woordje over modelling frameworks.........................................................................118
26.16 Frameworks en hun methoden...........................................................................................119
Chapter 27: Direct likelihood/ignorable likelihood........................................................................119
Chapter 28: Weighted Generalized Estimating Equations ............................................................119
Chapter 29 Multiple imputation ........................................................................................................119
Chapter 30 Overview ..........................................................................................................................119
Chapter 31 Een uitgewerkt voorbeeld met multiple imputation ..................................................119
31.1 – 2 GEEN LEERSTOF .......................................................................................................119
31.3 Voorbeeldvraag .......................................................................................................................119
Part XI Survival Analysis.........................................................................................................................120
Chapter 32 Survival Analysis without censoring .............................................................................120
32.1 Voorbeeld: overlevingstijden van kankerpatienten ............................................................120
, 32.2 The survival curve...................................................................................................................120
32.3 Schatting van een overlevingscurve .....................................................................................120
Chapter 33: Survival analysis with censoring ...................................................................................121
33.1 Het probleem van censoring .................................................................................................121
33.2 Voorbeeld: myelomatosis ......................................................................................................122
33.3 Kaplan-Meier schatting van de overlevingscurve ..............................................................122
33.4 Vergelijking van overlevingscurves ......................................................................................124
33.5 Voorbeelden uit de biomedische literatuur .........................................................................125
Chapter 34: Regressie voor overlevingsdata ....................................................................................125
34.1 Voorbeeld: pneumonia data ..................................................................................................125
34.2 Cox regressive .........................................................................................................................125
,Samenvatting biostatistiek
Chapter 1: Some references
Part 1: Fundamental concepts
Chapter 2: Introductory material
2.1 Motivatie
• Statistiek in de (bio-)medische literatuur
• Correcte analyse van de verzamelde data
• Correcte interpretatie van de resultaten
Chapter 3: What is statistics?
3.1 Voorbeeld: Captopril® data
• 15 pten met hypertensie (hoge bloeddruk)
• De interessante reactie is de bloeddruk in liggende houding voor en na behandeling met
Captopril®
• Onderzoeksvraag: Wat is het effect van de behandeling op BP?
• Dataset ‘Captopril®’:
•
•
•
•
•
•
•
• Het zou interessant zijn om te weten hoe waarschijnlijk de geobserveerde veranderingen in
BP voorkomen door puur toeval
→ Als dit heel onwaarschijnlijk is, zal de data hierboven bewijzen dat de BP inderdaad daalt
na behandeling met Captopril® (als wel waarschijnlijk, dan geen bewijs)
• Natuurlijk niet geïnteresseerd in conclusies over 15 patiënten → wel over het effect van
Captopril® op de totale populatie patiënten met hypertensie
,3.2 Populatie vs random steekproef
• Populatie: hypothetische groep van huidige en toekomstige proefpersonen, met een
specifieke aandoeningen; waarover conclusies moeten worden getrokken
• Steekproef: subgroep van de populatie waarop observaties zullen plaatsvinden
• Om de geobserveerde effecten in de ‘steekproef’ te kunnen generaliseren naar de totale
populatie, moet de steekproef ‘at random’ gekozen worden
3.3 Het doel van statistiek
• Het doel is tweedelig:
→ Beschrijvende statistiek: geobserveerde data samenvatten en beschrijven zodat de
relevante aspecten duidelijk worden
→ Interferentiële statistiek: onderzoeken in hoeverre de geobserveerde trends en effecten
kunnen gegeneraliseerd worden naar een algemene (oneindige) populatie
• Voorbeelden van beschrijvende statistiek: tabellen, grafieken, gemiddelden berekenen
• Geldige interferentiële statistiek vereist een sterke link tussen de
steekproef en de populatie waarvan men conclusies wil trekken.
Dit vereist:
→ Correcte statistische methodologie
→ Correcte interpretative van resultaten
Chapter 4: Summary statistics
4.1 Introductie
• A en B hebben dezelfde locatie, maar een andere
spreiding
• A en C hebben dezelfde spreiding, maar een
andere locatie
4.2 Meten van locatie
• Meten van locatie: Waar bevinden de observaties zich ongeveer
• Bekijk bijvoorbeeld de kleine ‘steekproef’: 1, 3, 3, 4, 5, 14
• Steekproef gemiddelde (sample mean):
→ Heel gevoelig voor uitschieters:
(de mediaan niet)
• Steekproef mediaan is de middelste observatie:
, • De steekproefmodus is de waarde die het meest geobserveerd is:
→ Niet altijd informatief:
• Voor symmetrische data zijn het gemiddelde en de mediaan hetzelfde, in het algemeen zijn ze
dat niet:
• Met scheve data kan het gemiddelde sterk beïnvloed worden door de aanwezigheid van een
of meerdere extreme observaties
→ Om nog steeds een goed idee te hebben over de
locatie van de data, verkiezen we het gebruik van de
mediaan boven het gemiddelde
4.3 Meten van spreading
• Meten van spreiding: Hoe gelijkaardig zijn de observaties?