Biostatistiek: T-toets, lineaire regressie en ANOVA
Door Nicole (studente BMW)
Biomedische Wetenschappen | 2020-2021
,Inhoudsopgave
Terugblik statistiek.................................................................................................................................4
Eenheden............................................................................................................................................4
Variatiebronnen..................................................................................................................................4
Proefopzet..........................................................................................................................................5
Precisie (nauwkeurigheid) en bias......................................................................................................6
Populatie en steekproef.....................................................................................................................6
Puntschatting en intervalschatting.................................................................................................6
Toetsen...............................................................................................................................................8
Vrijheidsgraden...............................................................................................................................8
Significantie....................................................................................................................................8
T-toetsen............................................................................................................................................9
Paired T test (gepaarde T-toets).....................................................................................................9
Independent samples T test (onafhankelijke steekproef T-toets)................................................11
Verschil tussen gepaarde T-toetsen en ongepaarde T-toetsen....................................................12
Overzicht......................................................................................................................................13
Controleren van aannames...........................................................................................................13
QQ-plot (quantile-quantile plot)...................................................................................................14
Robuustheid T-toets.....................................................................................................................16
T-verdeling....................................................................................................................................16
Overzicht soorten toetsen....................................................................................................................18
Simpele lineaire regressie.....................................................................................................................18
Lineaire regressie..............................................................................................................................18
Enkelvoudige lineaire regressie....................................................................................................18
Toetsen van de richtingscoëfficiënt..................................................................................................22
Toetsen van de richtingscoëfficiënt in RStudio.............................................................................23
Controleren van aannames..............................................................................................................28
Residuen plot................................................................................................................................28
Voorbeelden.................................................................................................................................29
Fouten in de aannames................................................................................................................29
Betrouwbaarheidsintervallen en predictie-intervallen.....................................................................31
Betrouwbaarheidsintervallen bij lineaire regressie......................................................................31
Betrouwbaarheidsintervallen en predictie-intervallen in RStudio................................................32
Predictie-intervallen bij lineaire regressie....................................................................................33
Kalibratielijnen (omgekeerde predictie)...........................................................................................34
1
, Betrouwbaarheidsinterval............................................................................................................34
Omgekeerd predictie-interval in RStudio.....................................................................................36
T-toets onafhankelijke steekproeven...............................................................................................36
Multipele lineaire regressie..................................................................................................................40
Vergelijking.......................................................................................................................................40
Schatting van de regressielijn.......................................................................................................40
Doel..............................................................................................................................................40
Regressielijn in RStudio.................................................................................................................40
Controle............................................................................................................................................44
Matching.......................................................................................................................................44
Controleren van aannames..............................................................................................................45
Interactie..........................................................................................................................................46
Interactie in RStudio.....................................................................................................................48
Keuze model.....................................................................................................................................48
Multicollineariteit.............................................................................................................................49
Multicollineariteit in RStudio........................................................................................................49
Verklarende variabelen....................................................................................................................50
Categoriale variabelen..................................................................................................................50
Dummy variabelen.......................................................................................................................51
Logistische regressie.............................................................................................................................54
Logistische regressie in RStudio........................................................................................................54
One-way ANOVA..................................................................................................................................55
Essentie............................................................................................................................................56
Toetsen.............................................................................................................................................56
Standaarddeviatie en variantie.........................................................................................................56
Opsplitsen van de variantie..........................................................................................................57
Variantieanalyse...........................................................................................................................58
One-way ANOVA in RStudio.............................................................................................................59
Controleren van aannames..............................................................................................................60
Normaal verdeelde data...............................................................................................................60
Gelijke varianties..........................................................................................................................61
Post-hoc toetsen...............................................................................................................................62
Fisher’s least significant difference (LSD toets).............................................................................63
Bonferroni correctie.....................................................................................................................63
Tukey’s Honestly Significant Difference........................................................................................64
Dunnett’s test...............................................................................................................................65
2
, Overzicht verschillende post-hoc toetsen.....................................................................................65
Lineaire regressie met dummy variabelen........................................................................................65
Two-way ANOVA..................................................................................................................................67
Factoriële proefopzetten..................................................................................................................67
Algemeen model..............................................................................................................................70
Hypothesen..................................................................................................................................70
Opsplitsen van de variantie..........................................................................................................71
Two-way ANOVA in RStudio.............................................................................................................72
Post-hoc toetsen...........................................................................................................................72
Controleren van aannames..............................................................................................................73
Survival analyse....................................................................................................................................75
Mixed model.........................................................................................................................................76
3
,Terugblik statistiek
Eenheden
µ = populatiegemiddelde
X = steekproefgemiddelde
σ = standaarddeviatie van de populatie
s = standaarddeviatie van de steekproef
Maten voor variabiliteit, met hun notatie Populatie Steekproef
Variantie σ² s²
Standaarddeviatie σ s
Standaardfout van het steekproefgemiddelde σ / √n s / √n
(Standard Error of the Mean, SEM)
De standaardfout van het steekproefgemiddelde, afgekort SEM (σ / √n), is de standaarddeviatie van
de steekproefverdeling van het steekproefgemiddelde en hangt dus af van de populatie
standaarddeviatie (σ) en de grootte van de steekproef (n).
Variatiebronnen
Variatiebronnen zorgen voor een onzekerheid in het gemiddelde. Enkele mogelijke oorzaken van
verschil in variatie zijn:
Persoonskenmerken (bv. geslacht of genetisch profiel)
Verschil in nauwkeurigheid van meetapparatuur
In wetenschappelijk onderzoek zijn conclusies altijd in meer of mindere mate onzeker vanwege:
Biologische variabiliteit tussen individuen
Variabiliteit tussen steekproeven
Experimentele variabiliteit
Experimentele variabiliteit is systemische en toevallig variatie. Systematische variatie
(systematische afwijking) daarentegen, is variatie door bijvoorbeeld een verkeerd geijkt
meetinstrument. Dit leidt tot onzuiverheid (bias). Systematische afwijkingen in een steekproef
kunnen ontstaan door informatie te verzamelen vanuit een niet-passende populatie.
4
, Proefopzet
Er zijn verschillende soorten onderzoeksopzetten, namelijk:
Cross-sectioneel → Op een moment in de tijd, wordt de determinant en uitkomst gemeten.
Case-control → Mensen met de uitkomst die je wilt meten.
Cohort prospectief → Groep mensen die bepaalde kenmerken delen die relevant zijn voor
het onderzoek (domein, determinant, uitkomst).
Experiment (clinical trial) → Uitkomst wordt gemeten na interventie en is dus prospectief.
Case-control studies zijn retroperspectief, dat wil zeggen dat het terugblikkend is. Een cohort studie
zoals hierboven beschreven daarentegen, is prospectief omdat eerst de determinant gemeten wordt
en later, in de toekomst de uitkomst. Je kunt bij een cohort studie ook direct de uitkomsten meten,
de participanten indelen in groepen van determinanten en dan retrospectief het optreden van de
determinanten onderzoeken. Over het algemeen geldt dat er enkel bij prospectieve proefopzetten
een uitspraak gedaan kan worden over oorzaken.
Een case-cohort studie is een combinatie van een case-control en cohort studie. In dit geval begin je
met een cohort sample en daarbinnen wordt een subcohort geselecteerd. In deze subcohort zullen
een aantal cases zitten. Daarnaast worden er cases van buiten het subcohort toegevoegd met het
verstrijken van de tijd. De uiteindelijke steekproef bestaat uit het subcohort (cases + controls) plus de
cases van buiten het subcohort. De controles kunnen voor verschillende uitkomsten als controle
dienen.
Figuur 1 Overzicht met verschillende soorten onderzoeksopzetten.
5