STATISTIEK - EVIDENCE BASED MEDICINE EN STATISTIEK 1
Zie ufora voor formularium en tabellen
1. Beschrijven en voorstellen van gegevens
1.1 Statistiek
● Biostatistiek: statistiek binnen biomedische context
● Beschrijvende statistiek: descriptieve statistiek
- Data sorteren / beschrijven / voorstellen
- Handig voor onderzoek over weinig patiënten
● Inductieve statistiek: inferentiële statistiek
- Populatieparameters schatten
- Hypotheses opstellen en toetsen
● Statistiek: vaak beide vormen van statistiek combineren
- Eerst beschrijvende statistiek, dan inductieve statistiek
1.2 Populatie
● Populatie: verzameling van subjecten die op zijn minst één karakteristiek
(eigenschap) gemeen hebben
- Groep waarin je geïnteresseerd bent
- Voorstelling: populatiegrootte = N
- N is meestal onbeperkt groot, te groot om volledig te testen
⇒ Daarom altijd onderzoeken op basis van steekproef
⇒ Conclusies trekken uit steekproef, toepassen op populatie
(descriptieve → inductieve statistiek)
● Subjecten: hoeven geen personen te zijn, entiteiten eerder dan subjecten
● Definiëren: populatie moet zeer duidelijk gedefiniëerd worden in de statistiek
1.3 Steekproef
● Steekproef: deelverzameling van subjecten (toevallig) getrokken uit de
studiepopulatie
- Voorstelling: steekproefgrootte = n
- Toevallig: gerandomiseerd samengestelde groep het toeval MOET een rol spelen
● Subjecten: hoeven geen personen te zijn, entiteiten eerder dan subjecten
● Aandachtspunten:
- Steekproef moet representatief zijn voor de populatie (vermijden van bias)
- Steekproef wordt gebruikt voor het schatten van de populatieparameters en voor
het testen van hypotheses
1
,1.4 Variabelen
● Variabele: karakteristiek van een populatie die verschillende waarden (attributen)
kan aannemen
- Wat je onderzoekt
- Voorstelling: vaak met hoofdletter X; vb. X: leeftijd
● Attribuut: specifieke waarde die men aan een variabele toekent
- Voorstelling: vaak met kleine letter x; vb. x1 = 18, x2 = 19, …
● Onafhankelijke variabele: beïnvloedt of veroorzaakt de studievariabelen
- Vb. Onderzoek spierkracht: variabele 1: leeftijd, onafhankelijke variabele
● Afhankelijke variabele: wordt beïnvloed door andere variabelen
- Vb. Onderzoek spierkracht: variabele 2: spierkracht, afhankelijke variabele
1.5 Meetniveau variabele
● Categorische variabelen - kwalitatieve variabelen:
- Nominale variabele:
⇒ Laagste meetniveau
⇒ Variabele die bestaat uit categorieën
⇒ Categorieën van variabele zijn mutueel exclusief (= sluiten elkaar uit, als je in
de ene categorie zit, kan je niet in de andere zitten)
⇒ Er is géén rangorde mogelijk in de categorieën
⇒ Vb. geslacht, oogkleur, ja-nee-vragen, bloedgroep
- Ordinale variabele:
⇒ Variabele die bestaat uit categorieën
⇒ Categorieën van variabele zijn mutueel exclusief
⇒ Er is wél een rangorde mogelijk in de categorieën
⇒ Als je cijfers gebruikt, moet de rangorde behouden blijven (vb. goud = 1,
zilver = 2, brons = 3; niet door elkaar halen)
⇒ Vb. leeftijdsklassen (18-20, 21-23, 24-26, …; orde is jonger/ouder), stadia van
kanker (1, 2, 3 of 4; orde is hoe hoger, hoe erger eraan toe), inkomensniveaus
- Categorische variabelen:
⇒ Categorische variabelen zijn cijfers die toegekend worden aan categorieën;
Cijfers die gebruikt worden hebben geen betekenis
Vb. Vrouw = 1, Man = 2, cijfers hebben geen betekenis
● Numerieke variabelen - kwantitatieve variabelen:
- Intervalvariabele:
⇒ Variabele waarbij op de meetschaal gelijke intervallen overeenkomen met
gelijke verschillen, op die meetschaal is er géén absoluut nulpunt
⇒ Vb. Je mag zeggen dat het verschil tussen 10°C en 20°C hetzelfde is als het
verschil tussen 30°C en 40°, maar je mag niet zeggen dat 40°C het
dubbele is van 20°C, want er is géén absoluut nulpunt
2
, - Ratiovariabele:
⇒ Variabele waarbij op de meetschaal gelijke intervallen overeenkomen met
gelijke verschillen, op die meetschaal is er wél een absoluut nulpunt
⇒ Vb. Je mag zeggen dat het verschil tussen 10K en 20K hetzelfde is als het
verschil tussen 30K en 40K, én je mag zeggen dat 40K het dubbele is van
20K, want er is wél een absoluut nulpunt
● Discrete variabele:
- Variabele is te tellen/turven, volle getallen
- Variabele is ofwel discreet ofwel continu, kan niet allebei
- Vb. Aantal kinderen in een gezin: 1, 2, 3, 4, …
● Continue variabele:
- Variabele kan continu variëren, kommagetallen
- Hoe klein je interval ook maakt, ertussen liggen oneindig veel mogelijkheden
- Vb. lichaamsgewicht: tussen 64kg en 65kg liggen oneindig veel andere waarden
● Dichotome variabelen: slechts twee mogelijkheden
● Binaire variabelen: speciale vorm van dichotome variabele, twee mogelijkheden
zijn enkel de cijfers 0 en 1
● Hercoderen: soms tijdens onderzoek andere variabele kiezen
Vb. Pijn: - Heb je pijn of niet → Dichotome, nominale variabele
- VAS-score (visual analogue scale): op lijn die van 0 begint vragen
waar de pijn op die schaal loopt → Ratiovariabele
- Schaal van 0-10 gebruiken → Ordinale variabele
1.6 Beschrijvende statistiek
● Beschrijvende statistiek: descriptieve statistiek
- Data sorteren / beschrijven / voorstellen
- Handig voor onderzoek over weinig patiënten
● Centrale maten: vaak gebruikt om te kijken rond welke waarde de waarden zich
centreren
- Rekenkundig gemiddelde:
𝑛
∑ 𝑥𝑖 𝑥1+𝑥2+𝑥3+...
⇒𝑥 = 𝑖=1
𝑛
= 𝑛
⇒ Bij steekproeven (S) met steekproefgrootte n om door te trekken naar
populaties (P)
⇒ 𝑥 = steekproefgemiddelde als schatting voor µ = populatiegemiddelde
⇒ Gevoelig voor outliers (extreme waarden)
⇒ WEL: bij intervalvariabele en ratiovariabele
NIET: bij nominale variabele en ordinale variabele
3
Zie ufora voor formularium en tabellen
1. Beschrijven en voorstellen van gegevens
1.1 Statistiek
● Biostatistiek: statistiek binnen biomedische context
● Beschrijvende statistiek: descriptieve statistiek
- Data sorteren / beschrijven / voorstellen
- Handig voor onderzoek over weinig patiënten
● Inductieve statistiek: inferentiële statistiek
- Populatieparameters schatten
- Hypotheses opstellen en toetsen
● Statistiek: vaak beide vormen van statistiek combineren
- Eerst beschrijvende statistiek, dan inductieve statistiek
1.2 Populatie
● Populatie: verzameling van subjecten die op zijn minst één karakteristiek
(eigenschap) gemeen hebben
- Groep waarin je geïnteresseerd bent
- Voorstelling: populatiegrootte = N
- N is meestal onbeperkt groot, te groot om volledig te testen
⇒ Daarom altijd onderzoeken op basis van steekproef
⇒ Conclusies trekken uit steekproef, toepassen op populatie
(descriptieve → inductieve statistiek)
● Subjecten: hoeven geen personen te zijn, entiteiten eerder dan subjecten
● Definiëren: populatie moet zeer duidelijk gedefiniëerd worden in de statistiek
1.3 Steekproef
● Steekproef: deelverzameling van subjecten (toevallig) getrokken uit de
studiepopulatie
- Voorstelling: steekproefgrootte = n
- Toevallig: gerandomiseerd samengestelde groep het toeval MOET een rol spelen
● Subjecten: hoeven geen personen te zijn, entiteiten eerder dan subjecten
● Aandachtspunten:
- Steekproef moet representatief zijn voor de populatie (vermijden van bias)
- Steekproef wordt gebruikt voor het schatten van de populatieparameters en voor
het testen van hypotheses
1
,1.4 Variabelen
● Variabele: karakteristiek van een populatie die verschillende waarden (attributen)
kan aannemen
- Wat je onderzoekt
- Voorstelling: vaak met hoofdletter X; vb. X: leeftijd
● Attribuut: specifieke waarde die men aan een variabele toekent
- Voorstelling: vaak met kleine letter x; vb. x1 = 18, x2 = 19, …
● Onafhankelijke variabele: beïnvloedt of veroorzaakt de studievariabelen
- Vb. Onderzoek spierkracht: variabele 1: leeftijd, onafhankelijke variabele
● Afhankelijke variabele: wordt beïnvloed door andere variabelen
- Vb. Onderzoek spierkracht: variabele 2: spierkracht, afhankelijke variabele
1.5 Meetniveau variabele
● Categorische variabelen - kwalitatieve variabelen:
- Nominale variabele:
⇒ Laagste meetniveau
⇒ Variabele die bestaat uit categorieën
⇒ Categorieën van variabele zijn mutueel exclusief (= sluiten elkaar uit, als je in
de ene categorie zit, kan je niet in de andere zitten)
⇒ Er is géén rangorde mogelijk in de categorieën
⇒ Vb. geslacht, oogkleur, ja-nee-vragen, bloedgroep
- Ordinale variabele:
⇒ Variabele die bestaat uit categorieën
⇒ Categorieën van variabele zijn mutueel exclusief
⇒ Er is wél een rangorde mogelijk in de categorieën
⇒ Als je cijfers gebruikt, moet de rangorde behouden blijven (vb. goud = 1,
zilver = 2, brons = 3; niet door elkaar halen)
⇒ Vb. leeftijdsklassen (18-20, 21-23, 24-26, …; orde is jonger/ouder), stadia van
kanker (1, 2, 3 of 4; orde is hoe hoger, hoe erger eraan toe), inkomensniveaus
- Categorische variabelen:
⇒ Categorische variabelen zijn cijfers die toegekend worden aan categorieën;
Cijfers die gebruikt worden hebben geen betekenis
Vb. Vrouw = 1, Man = 2, cijfers hebben geen betekenis
● Numerieke variabelen - kwantitatieve variabelen:
- Intervalvariabele:
⇒ Variabele waarbij op de meetschaal gelijke intervallen overeenkomen met
gelijke verschillen, op die meetschaal is er géén absoluut nulpunt
⇒ Vb. Je mag zeggen dat het verschil tussen 10°C en 20°C hetzelfde is als het
verschil tussen 30°C en 40°, maar je mag niet zeggen dat 40°C het
dubbele is van 20°C, want er is géén absoluut nulpunt
2
, - Ratiovariabele:
⇒ Variabele waarbij op de meetschaal gelijke intervallen overeenkomen met
gelijke verschillen, op die meetschaal is er wél een absoluut nulpunt
⇒ Vb. Je mag zeggen dat het verschil tussen 10K en 20K hetzelfde is als het
verschil tussen 30K en 40K, én je mag zeggen dat 40K het dubbele is van
20K, want er is wél een absoluut nulpunt
● Discrete variabele:
- Variabele is te tellen/turven, volle getallen
- Variabele is ofwel discreet ofwel continu, kan niet allebei
- Vb. Aantal kinderen in een gezin: 1, 2, 3, 4, …
● Continue variabele:
- Variabele kan continu variëren, kommagetallen
- Hoe klein je interval ook maakt, ertussen liggen oneindig veel mogelijkheden
- Vb. lichaamsgewicht: tussen 64kg en 65kg liggen oneindig veel andere waarden
● Dichotome variabelen: slechts twee mogelijkheden
● Binaire variabelen: speciale vorm van dichotome variabele, twee mogelijkheden
zijn enkel de cijfers 0 en 1
● Hercoderen: soms tijdens onderzoek andere variabele kiezen
Vb. Pijn: - Heb je pijn of niet → Dichotome, nominale variabele
- VAS-score (visual analogue scale): op lijn die van 0 begint vragen
waar de pijn op die schaal loopt → Ratiovariabele
- Schaal van 0-10 gebruiken → Ordinale variabele
1.6 Beschrijvende statistiek
● Beschrijvende statistiek: descriptieve statistiek
- Data sorteren / beschrijven / voorstellen
- Handig voor onderzoek over weinig patiënten
● Centrale maten: vaak gebruikt om te kijken rond welke waarde de waarden zich
centreren
- Rekenkundig gemiddelde:
𝑛
∑ 𝑥𝑖 𝑥1+𝑥2+𝑥3+...
⇒𝑥 = 𝑖=1
𝑛
= 𝑛
⇒ Bij steekproeven (S) met steekproefgrootte n om door te trekken naar
populaties (P)
⇒ 𝑥 = steekproefgemiddelde als schatting voor µ = populatiegemiddelde
⇒ Gevoelig voor outliers (extreme waarden)
⇒ WEL: bij intervalvariabele en ratiovariabele
NIET: bij nominale variabele en ordinale variabele
3