Statistiek Rania Nagels 2024-2025
Statistiek
Hoofdstuk 1: inleiding
• Toegepaste statistiek
o = analyseren van data om een wetenschappelijke vraag te beantwoorden
• Vertrekken vanuit een wetenschappelijke onderzoeksvraag
• We gaan gegevens analyseren (data) -> waarnemingen op variabelen (kenmerken die kunnen
varieren)
• Doelpopulatie = grotere populatie waar wij uitspraken over willen doen
• Onderzoekspopulatie = steekproef = mensen in je onderzoek
Onderzoeksvormen
• Observationeel = enkel observeren en meten, geen interventie. Metingen aan proefpersonen
zonder dat dit de betreffende persoon beïnvloedt. Vervolgens resultaten van ≠ metingen met
elkaar in verband brengen.
o Cohort
▪ = groep. Dus ieder observationeel onderzoek waarbij een groep
patiënten/proefpersonen wordt geobserveerd = observationeel
cohortonderzoek
▪ Onderscheiding tussen
• Prospectief = informatie verzamelen vooruit in tijd
• Retrospectief = informatie verzamelen van uit verleden
• Transversaal of cross-sectioneel = alle metingen verzamelen op 1 en
zelfde moment van het onderzoek
o Case control
▪ Groep patiënten met een bepaalde ziekte of aandoening (cases) wordt
vergeleken met een groep controlepersonen zonder aandoening (controls)
(beide groepen zijn vergelijkbaar bv qua leeftijd en geslacht)
▪ Terugkerend in tijd onderzoeken gaan doen op dingen die invloed hebben op die
ziekte. De oorzakelijke oorzaken gaan zoeken die in het verleden hebben
plaatsgevonden → = retrospectief
• Experimenteel = interventie toedienen. Hier wordt proefpersoon wel beïnvloed (interventie).
Doel: effect van interventie evalueren.
o Experimenteel is altijd een prospectief cohortonderzoek
1
,Statistiek Rania Nagels 2024-2025
Variabelen
• = Kenmerken die kunnen varieren tussen de onderzoekseenheden
• Uitkomstvariabele (= outcome, dependent variable) (y)
o = afhankelijke variabele
o Waar we willen een uitspraak over gaan doen, willen we verklaren
• Onafhankelijke variabele (= independent) (x)
o Die in relatie staan, een impact hebben op je uitkomstvariabele
o = Determinanten = verklaren
Soorten variabelen
• Categorisch = kwalitatief Dichotoom nominaal of
o = Die maar beperkt aantal modelijke uitkomsten kan hebben dichotoom ordinaal kan ook
o Nominaal (verschillende uitkomsten kunnen niet geordend worden)
o Ordinaal (wel geordend)
o Dichotoom (2 mogelijke uitkomstcategorieën) (maakt niet uit of het geordend is of niet)
▪ Op specifieke manier coderen -> dummy codereing -> 1 of 0
• Numerieke
o Continu (in theorie oneindig aantal mogelijke uitkomsten) (in pratkijk is afhankelijk hoe
nauwkeurig je instrument is)
o Discreet (enkel gehele getallen als uitkomsten)
Hercoderingen
doen, op basis van
variabele die eerst
numeriek was
gemeten ngewest,
die erna een
nieuwe variabele
te maken die
categorisch wordt
2
,Statistiek Rania Nagels 2024-2025
Soorten statistiek
• Beschrijvende statistiek
o = puur gaan beschrijven
o = overzichtelijk samenvatten van data:
▪ Grafische/ numerieke weergave van de variabelen
o Onderzoeksvraag nog niet gaan behandelen
o Meestal is dat de eerste tabel met variabelen
• Verklarende/ inferentiële statistiek
o = verklaringen gaan zoeken, kijken of er relaties zijn tussen x en y
o = schatten van effecten/ relaties
o -> betrouwbaarheid vd onderzoeksresultaten
o -> hypothesen testen
Hoofdstuk 2: beschrijvende statistiek
Illustratieve dataset
Dataset in spss:
= variabelen
Observaties: Per rij: 1 persoon
Geslacht, roken = dichotome
variabele
Alcohol: 3 cateorgieën
3
,Statistiek Rania Nagels 2024-2025
Grafische weergave
Categorische variabelen:
Staafdiagram
Geclusterd/ gesegmenteerd staafdiagram
• Visuele weergave tussen
associatie van 2 variabelen
Taartdiagram
• Visueel minder makkelijk af
te lezen als staafdiagram
4
,Statistiek Rania Nagels 2024-2025
Continue variabele
X as -> mogelijke uitkomstwaarden gegroepeerd in clusters
Y as -> frequentie
Historgam
Tak-en-blad diagram (minder vaak)
• Zoals een histogram maar dan
op zijn kop gezet
• Tientallen (tak
• Eenheden (bladen)
• Meer gedetailleerd dan in
histogram
2 continue variabelen:
Puntenwolk
• Correlatie tussen 2 variabelen
5
, Statistiek Rania Nagels 2024-2025
Numerieke weergave
• Altijd eerst frequentietabel opvragen
Frequentietabel
Categorisch, ordinaal
Valid en cumulative zijn hier hetzelfde
omdat er hier geen missende
waarden zijn, ze gaan verschillend zijn
als er bv een vraag werd overgeslagen
door de mensen, of er werd een
onmogelijke waarde ingevoerd…
Valid, het percent
waarvan je de
gegevens hebt
6
Statistiek
Hoofdstuk 1: inleiding
• Toegepaste statistiek
o = analyseren van data om een wetenschappelijke vraag te beantwoorden
• Vertrekken vanuit een wetenschappelijke onderzoeksvraag
• We gaan gegevens analyseren (data) -> waarnemingen op variabelen (kenmerken die kunnen
varieren)
• Doelpopulatie = grotere populatie waar wij uitspraken over willen doen
• Onderzoekspopulatie = steekproef = mensen in je onderzoek
Onderzoeksvormen
• Observationeel = enkel observeren en meten, geen interventie. Metingen aan proefpersonen
zonder dat dit de betreffende persoon beïnvloedt. Vervolgens resultaten van ≠ metingen met
elkaar in verband brengen.
o Cohort
▪ = groep. Dus ieder observationeel onderzoek waarbij een groep
patiënten/proefpersonen wordt geobserveerd = observationeel
cohortonderzoek
▪ Onderscheiding tussen
• Prospectief = informatie verzamelen vooruit in tijd
• Retrospectief = informatie verzamelen van uit verleden
• Transversaal of cross-sectioneel = alle metingen verzamelen op 1 en
zelfde moment van het onderzoek
o Case control
▪ Groep patiënten met een bepaalde ziekte of aandoening (cases) wordt
vergeleken met een groep controlepersonen zonder aandoening (controls)
(beide groepen zijn vergelijkbaar bv qua leeftijd en geslacht)
▪ Terugkerend in tijd onderzoeken gaan doen op dingen die invloed hebben op die
ziekte. De oorzakelijke oorzaken gaan zoeken die in het verleden hebben
plaatsgevonden → = retrospectief
• Experimenteel = interventie toedienen. Hier wordt proefpersoon wel beïnvloed (interventie).
Doel: effect van interventie evalueren.
o Experimenteel is altijd een prospectief cohortonderzoek
1
,Statistiek Rania Nagels 2024-2025
Variabelen
• = Kenmerken die kunnen varieren tussen de onderzoekseenheden
• Uitkomstvariabele (= outcome, dependent variable) (y)
o = afhankelijke variabele
o Waar we willen een uitspraak over gaan doen, willen we verklaren
• Onafhankelijke variabele (= independent) (x)
o Die in relatie staan, een impact hebben op je uitkomstvariabele
o = Determinanten = verklaren
Soorten variabelen
• Categorisch = kwalitatief Dichotoom nominaal of
o = Die maar beperkt aantal modelijke uitkomsten kan hebben dichotoom ordinaal kan ook
o Nominaal (verschillende uitkomsten kunnen niet geordend worden)
o Ordinaal (wel geordend)
o Dichotoom (2 mogelijke uitkomstcategorieën) (maakt niet uit of het geordend is of niet)
▪ Op specifieke manier coderen -> dummy codereing -> 1 of 0
• Numerieke
o Continu (in theorie oneindig aantal mogelijke uitkomsten) (in pratkijk is afhankelijk hoe
nauwkeurig je instrument is)
o Discreet (enkel gehele getallen als uitkomsten)
Hercoderingen
doen, op basis van
variabele die eerst
numeriek was
gemeten ngewest,
die erna een
nieuwe variabele
te maken die
categorisch wordt
2
,Statistiek Rania Nagels 2024-2025
Soorten statistiek
• Beschrijvende statistiek
o = puur gaan beschrijven
o = overzichtelijk samenvatten van data:
▪ Grafische/ numerieke weergave van de variabelen
o Onderzoeksvraag nog niet gaan behandelen
o Meestal is dat de eerste tabel met variabelen
• Verklarende/ inferentiële statistiek
o = verklaringen gaan zoeken, kijken of er relaties zijn tussen x en y
o = schatten van effecten/ relaties
o -> betrouwbaarheid vd onderzoeksresultaten
o -> hypothesen testen
Hoofdstuk 2: beschrijvende statistiek
Illustratieve dataset
Dataset in spss:
= variabelen
Observaties: Per rij: 1 persoon
Geslacht, roken = dichotome
variabele
Alcohol: 3 cateorgieën
3
,Statistiek Rania Nagels 2024-2025
Grafische weergave
Categorische variabelen:
Staafdiagram
Geclusterd/ gesegmenteerd staafdiagram
• Visuele weergave tussen
associatie van 2 variabelen
Taartdiagram
• Visueel minder makkelijk af
te lezen als staafdiagram
4
,Statistiek Rania Nagels 2024-2025
Continue variabele
X as -> mogelijke uitkomstwaarden gegroepeerd in clusters
Y as -> frequentie
Historgam
Tak-en-blad diagram (minder vaak)
• Zoals een histogram maar dan
op zijn kop gezet
• Tientallen (tak
• Eenheden (bladen)
• Meer gedetailleerd dan in
histogram
2 continue variabelen:
Puntenwolk
• Correlatie tussen 2 variabelen
5
, Statistiek Rania Nagels 2024-2025
Numerieke weergave
• Altijd eerst frequentietabel opvragen
Frequentietabel
Categorisch, ordinaal
Valid en cumulative zijn hier hetzelfde
omdat er hier geen missende
waarden zijn, ze gaan verschillend zijn
als er bv een vraag werd overgeslagen
door de mensen, of er werd een
onmogelijke waarde ingevoerd…
Valid, het percent
waarvan je de
gegevens hebt
6