Biostatistiek
Introductie
- Lessen
o Theorie gedeelte: 7 lessen
o Practicum: 5 practica
- Lesmateriaal
o http://www.medstatsaag.com/
Interactieve website multiple choice (waarvan er op het examen komen)
Theorieleerstof = geselecteerde vragen
Vertaallijst
o Practicum
Oefeningen data-analyse
- Examen
o 3 delen
Theorie (6/20)
Practicum (12/20)
Permanente evaluatie practica (2/20)
o Multiple choice op PC
o Gesloten boek
Hoofdstuk 1: kadering
- Statistiek
o Wat wordt ervan gevonden?
Slechte reputatie
Buisvak: “nog erger dan wiskunde”
Niet simpel
“met statistiek kan je alles bewijzen”
o Wat is het echt?
Belangrijk in bijna alle wetenschappelijke domeinen
Proefopzet
Data analyse
Interpretatie
“Zonder statistiek kan je niets bewijzen”
- Onderzoeksvragen
o Geven aanleiding tot statistisch onderzoek
o Bv.: Hoe groot is de gemiddelde Belgische man?
- Wetenschappelijk onderzoek
o Planning
Samenwerkingen
Tijdschema
Budget
o Proefopzet
“Study design”
Plannen van experimenten
, In functie van
Onderzoeksvraag
Latere analyse
Vereiste statistische power
Budget
o Verzamelen van gegevens (data)
“Data collection”
Labo-experimenten
Onderzoek van dieren/mensen
Willekeurige steekproef (“random sample”) uit de populatie
Representatief
Onvertekend
o Data verwerking
Invoeren van gegevens in database
“Data cleaning”
Onvolledige gegevens
Foute gegevens
o Data analyse
Grafische analyse
Statistische testen
o Interpretatie
Terugkoppelen naar ond.vraag
Nieuwe ond.vraag?
Veralgemenen qnaar populatie ?
o Publicatie
Vakbladen
Peer-review proces
- Meta-analyse
o = een bepaalde onderzoeksvraag is pas beantwoord als meerdere mensen onafhankelijk
hetzelfde antwoord opstellen
- Onzekerheid
o Statistiek moet omgaan met onzekerheid (voorbeelden zie PowerPoint)
o Onzekerheid kan je ook hebben in het labo, als je bijvoorbeeld een meetfout hebt
o Aantal observaties is beperkt
Aantal labo-experimenten
Budget voor N proefpersonen/dieren
o Geen onzekerheid als…
Iedereen testen
Oneindig aantal experimenten
o Statistiek :
Helpt omgaan met onzekerheid
Implicaties voor proefopzet, analyse, interpretatie
STATISTIEK VERTELT HOE ZEKER/ONZEKER JE BENT
- Demo’s
o Zie PowerPoint
, - Toevalsvariatie
o Toevalsvariatie in meeste wetenschappelijke experimenten
Experiment = willekeurige steekproef
Vra(a)g(enlijst) van N personen
Labo-experiment met N herhalingen
Klinische trial met N proefpersonen
Je doet het experiment opnieuw en krijgt een andere waarde
o Toeval beantwoordt aan bepaalde wetten: deze wetten laten toe om over heel de
populatie een conclusie te trekken ook al hebben we maar een willekeurige steekproef
(kleine groep) onderzocht
o Laat toe om conclusie te trekken over onbekende populatie gebaseerd op beperkte
steekproef
- Willekeurige steekproef
o Experiment = willekeurige steekproef
o Resultaat van experiment
Antwoord op vragenlijst
Meting van biologische/fysische waarde
Aantal overleden/genezen proefpersonen
Aantal keren “kop” bij tossen
o Random veranderlijke (variabele)
Variabele waarvan waarde afhangt van toevalsvariatie
Hoofdstuk 2: Beschrijvende statistiek
- = samenvatten van gegevens die je hebt en kijken hoe de variabelen zich gedragen
- Soorten variabelen
o Categorisch
Verdeelt populatie in categorieën: bv.: man, vrouw en X
Beperkt (=discreet) aantal niveaus
Zonder orde = nominaal (geen logische volgorde)
o Bloedgroep, nationaliteit
Met orde = ordinaal
o Graad, schaal met 5 niveaus
o (bv. Tripadvisor logische volgorde om bv. een bezienswaardigheid te
beoordelen)
o Numeriek
Kwantitatief = een getal(waarde)
Discreet
o geteld aantal (geheel getal)
o Punten op examen
Continu (met komma’s)
o Meetwaarde, percentage
o Bloeddruk, gewicht, lichaamslengte
o Zie voorbeelden op PowerPoint
- Data beschrijven
o Voor een continue RV (random veranderlijke):
Beschrijvende statistiek
Grafieken
, Verdelingsfunctie
o Hangt af van soort variabele
Continu
Discreet
- Centrale locatie
o Rekenkundig gemiddelde
o Mediaan
Als je rechts scheef hebt, ligt het gemiddelde ook meer
naar rechts en is het dus beter om de mediaan te
nemen als centrale locatie
- Gemiddelde (mean) vs mediaan
o Gemiddelde
Symmetrische verdeling
Gevoelig voor outliers
Gebruikt alle informatie
Relatie met onderliggende verdeling
o Mediaan
Verdeling hoeft niet symmetrisch
Ongevoelig voor outliers
Gebruikt niet alle informatie
- Spreiding
o Spreiding van de individuele observaties rondom gemiddelde
o Symmetrische of asymmetrische verdeling
- Groene bolletjes: meetwaarden
- Lijn: gemiddelde 6
Je kunt zien hoe ver de bolletjes van het
gemiddelde liggen ook hier moet je kijken of
je verdeling symmetrisch of asymmetrisch is
o Symmetrisch
Variantie = gemiddelde kwadratische afwijking van het gemiddelde = hoe ver ligt
een individueel punt van het gemiddelde gemiddeld genomen
s =∑ ¿ ¿ ¿
2
Standaardafwijking (SD): de wortel uit de variantie beschrijven van spreading
Standaardafwijking is geschikt voor symmetrie (bv. lichaamslengte)
s= √∑ ¿¿ ¿ ¿
Noot: geen formules vanbuiten kennen
Introductie
- Lessen
o Theorie gedeelte: 7 lessen
o Practicum: 5 practica
- Lesmateriaal
o http://www.medstatsaag.com/
Interactieve website multiple choice (waarvan er op het examen komen)
Theorieleerstof = geselecteerde vragen
Vertaallijst
o Practicum
Oefeningen data-analyse
- Examen
o 3 delen
Theorie (6/20)
Practicum (12/20)
Permanente evaluatie practica (2/20)
o Multiple choice op PC
o Gesloten boek
Hoofdstuk 1: kadering
- Statistiek
o Wat wordt ervan gevonden?
Slechte reputatie
Buisvak: “nog erger dan wiskunde”
Niet simpel
“met statistiek kan je alles bewijzen”
o Wat is het echt?
Belangrijk in bijna alle wetenschappelijke domeinen
Proefopzet
Data analyse
Interpretatie
“Zonder statistiek kan je niets bewijzen”
- Onderzoeksvragen
o Geven aanleiding tot statistisch onderzoek
o Bv.: Hoe groot is de gemiddelde Belgische man?
- Wetenschappelijk onderzoek
o Planning
Samenwerkingen
Tijdschema
Budget
o Proefopzet
“Study design”
Plannen van experimenten
, In functie van
Onderzoeksvraag
Latere analyse
Vereiste statistische power
Budget
o Verzamelen van gegevens (data)
“Data collection”
Labo-experimenten
Onderzoek van dieren/mensen
Willekeurige steekproef (“random sample”) uit de populatie
Representatief
Onvertekend
o Data verwerking
Invoeren van gegevens in database
“Data cleaning”
Onvolledige gegevens
Foute gegevens
o Data analyse
Grafische analyse
Statistische testen
o Interpretatie
Terugkoppelen naar ond.vraag
Nieuwe ond.vraag?
Veralgemenen qnaar populatie ?
o Publicatie
Vakbladen
Peer-review proces
- Meta-analyse
o = een bepaalde onderzoeksvraag is pas beantwoord als meerdere mensen onafhankelijk
hetzelfde antwoord opstellen
- Onzekerheid
o Statistiek moet omgaan met onzekerheid (voorbeelden zie PowerPoint)
o Onzekerheid kan je ook hebben in het labo, als je bijvoorbeeld een meetfout hebt
o Aantal observaties is beperkt
Aantal labo-experimenten
Budget voor N proefpersonen/dieren
o Geen onzekerheid als…
Iedereen testen
Oneindig aantal experimenten
o Statistiek :
Helpt omgaan met onzekerheid
Implicaties voor proefopzet, analyse, interpretatie
STATISTIEK VERTELT HOE ZEKER/ONZEKER JE BENT
- Demo’s
o Zie PowerPoint
, - Toevalsvariatie
o Toevalsvariatie in meeste wetenschappelijke experimenten
Experiment = willekeurige steekproef
Vra(a)g(enlijst) van N personen
Labo-experiment met N herhalingen
Klinische trial met N proefpersonen
Je doet het experiment opnieuw en krijgt een andere waarde
o Toeval beantwoordt aan bepaalde wetten: deze wetten laten toe om over heel de
populatie een conclusie te trekken ook al hebben we maar een willekeurige steekproef
(kleine groep) onderzocht
o Laat toe om conclusie te trekken over onbekende populatie gebaseerd op beperkte
steekproef
- Willekeurige steekproef
o Experiment = willekeurige steekproef
o Resultaat van experiment
Antwoord op vragenlijst
Meting van biologische/fysische waarde
Aantal overleden/genezen proefpersonen
Aantal keren “kop” bij tossen
o Random veranderlijke (variabele)
Variabele waarvan waarde afhangt van toevalsvariatie
Hoofdstuk 2: Beschrijvende statistiek
- = samenvatten van gegevens die je hebt en kijken hoe de variabelen zich gedragen
- Soorten variabelen
o Categorisch
Verdeelt populatie in categorieën: bv.: man, vrouw en X
Beperkt (=discreet) aantal niveaus
Zonder orde = nominaal (geen logische volgorde)
o Bloedgroep, nationaliteit
Met orde = ordinaal
o Graad, schaal met 5 niveaus
o (bv. Tripadvisor logische volgorde om bv. een bezienswaardigheid te
beoordelen)
o Numeriek
Kwantitatief = een getal(waarde)
Discreet
o geteld aantal (geheel getal)
o Punten op examen
Continu (met komma’s)
o Meetwaarde, percentage
o Bloeddruk, gewicht, lichaamslengte
o Zie voorbeelden op PowerPoint
- Data beschrijven
o Voor een continue RV (random veranderlijke):
Beschrijvende statistiek
Grafieken
, Verdelingsfunctie
o Hangt af van soort variabele
Continu
Discreet
- Centrale locatie
o Rekenkundig gemiddelde
o Mediaan
Als je rechts scheef hebt, ligt het gemiddelde ook meer
naar rechts en is het dus beter om de mediaan te
nemen als centrale locatie
- Gemiddelde (mean) vs mediaan
o Gemiddelde
Symmetrische verdeling
Gevoelig voor outliers
Gebruikt alle informatie
Relatie met onderliggende verdeling
o Mediaan
Verdeling hoeft niet symmetrisch
Ongevoelig voor outliers
Gebruikt niet alle informatie
- Spreiding
o Spreiding van de individuele observaties rondom gemiddelde
o Symmetrische of asymmetrische verdeling
- Groene bolletjes: meetwaarden
- Lijn: gemiddelde 6
Je kunt zien hoe ver de bolletjes van het
gemiddelde liggen ook hier moet je kijken of
je verdeling symmetrisch of asymmetrisch is
o Symmetrisch
Variantie = gemiddelde kwadratische afwijking van het gemiddelde = hoe ver ligt
een individueel punt van het gemiddelde gemiddeld genomen
s =∑ ¿ ¿ ¿
2
Standaardafwijking (SD): de wortel uit de variantie beschrijven van spreading
Standaardafwijking is geschikt voor symmetrie (bv. lichaamslengte)
s= √∑ ¿¿ ¿ ¿
Noot: geen formules vanbuiten kennen