Leerdoelen Statistiek
Leerdoelen LE1
begrijpt het belang van statistiek in de biomedische wetenschappen.
Statistiek is de wetenschap, de methodiek en de techniek van het verzamelen,
bewerken, interpreteren en presenteren van informatie (veelal uit steekproeven).
kan de verschillende meetniveaus van variabelen uitleggen.
Een variabele is een karakteristiek van een individu (bv geslacht, leeftijd en
glucosegehalte).
Een categorische variabele zet een individu in een groep. Een
kwantitatieve variabele bevat een getal (bv sec of kg), waarbij
een gemiddelde gevormd kan worden. sommige hiervan zijn
continu (kunnen elke waarde aannemen, bv steellengte), terwijl
andere discreet zijn (gelimiteerd aantal, bv bloemblaadjes).
Nominale variabele zijn discreet en kwalitatief, het onderscheid
tussen groepen is niet in cijfers uit te drukken (bv de provincies van
Nederland, bloedgroep). Ordinale variabele zit een logische
volgorde in (bv opleidingsniveau van laag naar hoog).
Ratio heeft bovenop interval een absoluut nulpunt (bv lengte, duur,
temperatuur). Interval daarentegen kan je niet zeggen dat iemand met een IQ
van 120 een twee keer zo hoog IQ heeft als iemand met 60.
Kwantitatieve date (getallen) kan je mee rekenen. Met kwalitatieve data kan
dat niet.
kan de betekenis van de verschillende kengetallen uitleggen.
Locatiemaat;
Gemiddelde is alle waardes opgeteld, gedeeld door het totaal aantal waardes
gebruikt. Bevat meer informatie en gevoelig voor uitschieters.
Mediaan, zet alle waarnemingen op volgorde van laagst naar hoogst. De
mediaan is dan de middelste waarde (ook wel het 2e kwartiel, Q2). Minder
gevoelig voor uitschieters, scheefheid, maar bevat minder informatie.
Modus
Proportie
Spreidingsmaat;
Standaarddeviatie is ongeveer de gemiddelde afstand van alle punten tot de
gemiddelde waarde. De som van alle gekwadrateerde afstanden tot het
gemiddelde, gedeeld door n-1 onder het wortelteken (variantie(y)).
s=
√ 1
n−1
Σ ( x i−x )
2
Interkwartielenafstand = Q3 – Q1. Onder het eerste kwartier (Q1) bevindt
zich 25% van de waarnemingen. Onder het derde kwartier (Q3) bevindt zich
75% van de waarnemingen. Hoe geconcentreerder de waarnemingen liggen, hoe
kleiner de interkwartielafstand.
, Range/spreiding is de afstand waartussen alle gegeven waardes zich bevinden.
kan uitleggen welk kengetal gebruikt wordt bij welke data.
kan de visualisatie van kengetallen interpreteren (histogram en boxplot).
Staafdiagrammen of frequentietabellen worden vaak gebruikt voor nominale
en ordinale variabelen (geslacht, bloedgroep). Het is vaak makkelijker de
relatieve frequentie te pakken (in proporties; aantal per categorie OF
percentages %).
Histogram (geeft 1 kwantitatieve variabele weer) is makkelijker af te lezen als
de y-as in procenten wordt gegeven. Voor het interpreteren, zoek naar het
algemene patroon (beschrijven door vorm, midden en spreiding) en voor
opvallende uitwijkingen hiervan (een outlier). De spreiding is de afstand
tussen de kleinste en grootste waarde, hiertussen bevindt zich het midden. Het
kan symmetrisch zijn (links en rechts
bijna spiegelend, mediaan en
gemiddelde waarde bijna hetzelfde, SD
gebruiken). Het kan ook links-scheve
verdeling (negatief) of rechts-scheve
verdeling (positief) liggen als daar de
data veel verder van het midden
afwijken (mediaan beter en IQR).
Bimodale verdeling is eigenlijk twee verdelingen in 1 (gemiddelde en mediaan
beide onhandig).
Kruistabel
Boxplot verandert eigenlijk nooit van vorm. Zet een
streepje bij de mediaan M, rond de mediaan loopt de box
van Q1 tot Q3 (lengte box = interkwartierafstand). De
‘whiskers’ (staartjes) lopen van de kleinste tot aan de
grootste waarneming. De uitbijters worden met een stip
weergeven (vaak gegevens die meer dan 1,5x van de IQR
afwijken).
Spreidingsdiagrammen
side notes
Variantie is de maat voor spreiding, hoe groter de variantie, hoe meer de
afzonderlijke getallen van elkaar verschillen.
Prevalentie is iemand die de ziekte al heeft. incidentie is iemand die de ziekte
krijgt.
Leerdoelen LE1
begrijpt het belang van statistiek in de biomedische wetenschappen.
Statistiek is de wetenschap, de methodiek en de techniek van het verzamelen,
bewerken, interpreteren en presenteren van informatie (veelal uit steekproeven).
kan de verschillende meetniveaus van variabelen uitleggen.
Een variabele is een karakteristiek van een individu (bv geslacht, leeftijd en
glucosegehalte).
Een categorische variabele zet een individu in een groep. Een
kwantitatieve variabele bevat een getal (bv sec of kg), waarbij
een gemiddelde gevormd kan worden. sommige hiervan zijn
continu (kunnen elke waarde aannemen, bv steellengte), terwijl
andere discreet zijn (gelimiteerd aantal, bv bloemblaadjes).
Nominale variabele zijn discreet en kwalitatief, het onderscheid
tussen groepen is niet in cijfers uit te drukken (bv de provincies van
Nederland, bloedgroep). Ordinale variabele zit een logische
volgorde in (bv opleidingsniveau van laag naar hoog).
Ratio heeft bovenop interval een absoluut nulpunt (bv lengte, duur,
temperatuur). Interval daarentegen kan je niet zeggen dat iemand met een IQ
van 120 een twee keer zo hoog IQ heeft als iemand met 60.
Kwantitatieve date (getallen) kan je mee rekenen. Met kwalitatieve data kan
dat niet.
kan de betekenis van de verschillende kengetallen uitleggen.
Locatiemaat;
Gemiddelde is alle waardes opgeteld, gedeeld door het totaal aantal waardes
gebruikt. Bevat meer informatie en gevoelig voor uitschieters.
Mediaan, zet alle waarnemingen op volgorde van laagst naar hoogst. De
mediaan is dan de middelste waarde (ook wel het 2e kwartiel, Q2). Minder
gevoelig voor uitschieters, scheefheid, maar bevat minder informatie.
Modus
Proportie
Spreidingsmaat;
Standaarddeviatie is ongeveer de gemiddelde afstand van alle punten tot de
gemiddelde waarde. De som van alle gekwadrateerde afstanden tot het
gemiddelde, gedeeld door n-1 onder het wortelteken (variantie(y)).
s=
√ 1
n−1
Σ ( x i−x )
2
Interkwartielenafstand = Q3 – Q1. Onder het eerste kwartier (Q1) bevindt
zich 25% van de waarnemingen. Onder het derde kwartier (Q3) bevindt zich
75% van de waarnemingen. Hoe geconcentreerder de waarnemingen liggen, hoe
kleiner de interkwartielafstand.
, Range/spreiding is de afstand waartussen alle gegeven waardes zich bevinden.
kan uitleggen welk kengetal gebruikt wordt bij welke data.
kan de visualisatie van kengetallen interpreteren (histogram en boxplot).
Staafdiagrammen of frequentietabellen worden vaak gebruikt voor nominale
en ordinale variabelen (geslacht, bloedgroep). Het is vaak makkelijker de
relatieve frequentie te pakken (in proporties; aantal per categorie OF
percentages %).
Histogram (geeft 1 kwantitatieve variabele weer) is makkelijker af te lezen als
de y-as in procenten wordt gegeven. Voor het interpreteren, zoek naar het
algemene patroon (beschrijven door vorm, midden en spreiding) en voor
opvallende uitwijkingen hiervan (een outlier). De spreiding is de afstand
tussen de kleinste en grootste waarde, hiertussen bevindt zich het midden. Het
kan symmetrisch zijn (links en rechts
bijna spiegelend, mediaan en
gemiddelde waarde bijna hetzelfde, SD
gebruiken). Het kan ook links-scheve
verdeling (negatief) of rechts-scheve
verdeling (positief) liggen als daar de
data veel verder van het midden
afwijken (mediaan beter en IQR).
Bimodale verdeling is eigenlijk twee verdelingen in 1 (gemiddelde en mediaan
beide onhandig).
Kruistabel
Boxplot verandert eigenlijk nooit van vorm. Zet een
streepje bij de mediaan M, rond de mediaan loopt de box
van Q1 tot Q3 (lengte box = interkwartierafstand). De
‘whiskers’ (staartjes) lopen van de kleinste tot aan de
grootste waarneming. De uitbijters worden met een stip
weergeven (vaak gegevens die meer dan 1,5x van de IQR
afwijken).
Spreidingsdiagrammen
side notes
Variantie is de maat voor spreiding, hoe groter de variantie, hoe meer de
afzonderlijke getallen van elkaar verschillen.
Prevalentie is iemand die de ziekte al heeft. incidentie is iemand die de ziekte
krijgt.