Statistiek
= aan de hand van kleine groep (steekgroep) iets zeggen over een grote groep (studiepopulatie)
NPI = non-pharmaceutical interventions (bv. knuffelcontact, lockdown …)
PI = pharmaceutical intervention (bv. vaccins)
SARS-CoV-2
basis reproductiegetal R0
= het gemiddeld aantal personen dat een geïnfecteerd persoon besmet gedurende zijn/haar volledige
besmettelijke periode, wanneer deze persoon zich bevindt in een populatie die volledig vatbaar is (populatie
zonder bestaande immuniteit)
effectief reproductiegetal = idem, maar rekening houdend met immuniteit binnen de populatie
⇒ hoe meer mensen besmet zijn, hoe hoger de immuniteit binnen de populatie, hoe lager de vatbaarheid,
hoe lager het reproductiegetal
serologische gegevens = gegevens verzameld op basis van bloed, waarbij men nagaat of er antilichamen
aanwezig zijn (kijken of er eerdere besmetting is geweest)
compartimenteel model = model waarbij de populatie wordt ingedeeld op basis van homogene groepen (bv.
vatbare vs. blootgestelde personen)
Data-voorbeeld 1
In een analyse werd gekeken naar het aantal doden voor drie verschillende regio’s, volgens geslacht en
leeftijd (in 6 leeftijdscategorieën - zie tabel) (covid-gerelateerde mortaliteit per miljoen inwoners)
N = totale populatiegrootte
1. Men wil weten of er een verschil bestaat in gemiddeld aantal sterfgevallen tussen de verschillende
leeftijdsgroepen, indien nodig gecorrigeerd voor regio en geslacht.
● getransformeerde uitkomstvariabele Wi = log(Yi + 1)
○ met Yi = uitkomstwaarde
○ + 1 om nul-waarden te vermijden
● meervoudig lineair regressiemodel: (i = 1, . . . , n)
○
○ met ϵ𝑖 ~ 𝑁(0, σ²) = onafhankelijke storingstermen (variatie in het meetproces vermijden)
, ○ uitkomstvariabele Wi regresseren ten opzichte van verklarende variabelen xi (leeftijd,
geslacht, regio …) om verschillen tussen deze variabelen te bepalen
2. Nagaan of er een significant effect van leeftijd op het gemiddelde aantal overlijdens is (s.n. 5%).
● globale F-test voor volgend toetsingsprobleem
○ nulhypothese H0 (geen verschil in leeftijdsgroep)
○ H1: er bestaat een β verschillend van 0
● waarde van de toetsingsgrootheid = 157.2 met p-waarde < 2.2e-16
○ als p-waarde < 5%, dan mag men de nulhypothese verwerpen
● conclusie: we verwerpen de nulhypothese H0 op significantieniveau 5%, hetgeen betekent dat er
een significant effect van leeftijd bestaat op het gemiddeld aantal doden
Data-voorbeeld 2
Wat is de geschatte toename in gemiddelde aantal sterfgevallen per dag?
⇒ het gemiddelde aantal sterfgevallen per dag neemt toe met factor exp(0.123921) = 1.131 = 13%
toename per dag
→ exponentiële functie
Data-voorbeeld 3
Is er een significant verschil in evolutie (d.i. tijdseffect) van het gemiddelde aantal sterfgevallen tussen
Wallonië-Brussel en Vlaanderen-Brussel?
→ duidelijke verschillen, maar zijn deze verschillen significant (structureel) of willekeurig
, BESCHRIJVENDE STATISTIEK
Basis statistische concepten
Steekproef vs. populatie
populatie
● een duidelijk gedefinieerde groep van subjecten waarin de onderzoeker geïnteresseerd is vanuit
wetenschappelijk oogpunt
● vaak te groot om alle subjecten te onderzoeken (te duur, te weinig tijd, te weinig middelen …)
steekproef
● een eindige verzameling van studie objecten, waarvoor geobserveerde karakteristieken en
uitkomstwaarden worden gemeten
● dient representatief te zijn voor de studie populatie
statistiek gebruiken om tot conclusies te komen
● op basis van steekproef conclusies trekken over de studiepopulatie
● populatiegrootheden (bv. gemiddelde) schatten aan de van van geobserveelde steekproefwaarden
𝑛
1
○ steekproefgemiddelde µ = 𝑥 = 𝑛
· ∑ 𝑥𝑖
𝑖=1
● sampling variatie = verschillende steekproefnames van eenzelfde populatie leveren verschillende
resultaten op ten gevolge van ‘kans’ (niet indien men heel de populatie onderzoekt)
○ hoe groter de steekproef, hoe meer precisie, hoe minder de onderzekerheden (varianties)
Methoden van onderzoek
experimentele studies (gecontroleerde experimenten)
● het effect van een behandeling bekijken
● onderzoeker heeft de controle, kan bepalen wat de condities van het experiment zijn
● doel: is er sprake van (oorzakelijk) verband
● bv. klinische studies
○ randomisatie = het willekeurig indelen van subjecten in behandelings- en controlegroep
○ blinding = arts en/of patiënt weten niet tot welke groep patiënten behoren
○ placebo = niet-actieve behandeling
observationele studies
● hierbij gebeuren geen ingrepen bij de onderzochte subjecten
● onderzoeker heeft geen controle, louter observeren
● doel: geen conclusies over oorzakelijke verbanden, enkel associaties
● bv. heeft roken effect op longkanker?
Datastructuur
ruwe data uit een experiment bestaat uit observaties (metingen) met betrekking tot studie subjecten