CSI Q2 SAMENVATTING
Disease in numbers
Radboud Universiteit, Nijmegen
Gemaakt door: Georgia Graat
, CSI samenvatting Q2
Statistiek
De normaalverdeling of klokverdeling komt het meest voor in een populatie en wanneer een
onderzoek gedaan wordt. Deze verdeling komt normaal voor in veel soorten situaties. De verdeling is
symmetrisch, met de mean/gemiddelde ook als modus en mediaan. De normaalverdeling hangt
samen met het gemiddelde en de standaard deviatie. Een kleine SD geeft aan dat de gemeten
waardes dicht in de buurt van het gemiddelde zitten, waar de piek dus hoog zal zijn. Een grote SD
zegt dat de spreiding erg groot is en hierbij zal de piek lager
zijn. 68% van alle waarden zal binnen 1 SD van het
gemiddelde afzitten en 95% zal binnen 1.96*SD van het
gemiddelde afzitten. Alle onderzoeken hebben in principe een
normaalverdeling als de sample size groot genoeg is. Een
normaalverdeling kan ook gestandaardiseerd worden, waarbij
het gemiddelde op 0 gezet wordt met een SD van 1. Dit wordt
de Z-score: de gestandaardiseerde waarde voor de gewenste
variabele. Z = (X-mean)/populatie SD.
Een waarschijnlijkheidsverdeling of frequentieverdeling geeft de
waarschijnlijkheid van een variabele van verschillende mogelijke
uitkomsten hiervan. Ze zijn makkelijk te berekenen, want de
waarschijnlijkheden zijn gelijk aan de frequenties. Je hebt hierbij
discrete en continu uitkomsten. Discrete variabelen hebben een
telbaar nummer van verschillende uitkomsten (aantal kinderen,
kleuren in de regenboog). Continu variabelen hebben een oneindig
aantal van mogelijke waarden (gewicht, bloeddruk). Bij deze
variabele is de kans om exact het gemiddelde te krijgen in theorie 0.
Om de waarschijnlijkheden te berekenen, bereken je de
oppervlakte van de grafiek.
De steekproevenverdeling (sampling distribution) is een normaalverdeling van alle gemiddeldes
verkregen tijdens hetzelfde onderzoek dat vaker is gedaan (verdeling
van alle gemiddeldes die je kunt vinden bij een steekproef). Een
normaalverdeling gebruikt waarden van individuele personen van één
studie en berekent hieruit een gemiddelde. Deze gemiddeldes gaan
allemaal in de steekproevenverdeling. De verschillende gemiddeldes
zijn altijd van dezelfde populatie afkomstig! De steekproevenverdeling
heeft van zichzelf ook een mean (de echte populatie mean) en SD. De
SD van deze verdeling wordt de standaard error genoemd. Dit is SE =
SD/wortel sample size n. De standaard error is een maat voor de
precisie van een schatting. Hoe groter de sample size, hoe kleiner de
SE. De SD geeft daarentegen de maat van variatie aan; het geeft de
grootte van variabiliteit in een dataset aan.
Er bestaan verschillende soorten variabelen waar men mee kan werken. Nominale variabelen geven
een keuze tussen weinig waarden waar geen verschil in zit. Er zit geen verschil in rangorde en de
keuzes zijn duidelijk op te delen. Denk aan ja/nee, zwart/wit, man/vrouw. Ordinale variabelen geven
een keuze tussen verschillende categorieën waar een verschil tussen zit. Bij ordinaal zijn er keuzes
waartussen het verschil niet helemaal duidelijk is, waarbij ook geen gemiddelde uit te rekenen is. De
Gemaakt door: Georgia Graat
Disease in numbers
Radboud Universiteit, Nijmegen
Gemaakt door: Georgia Graat
, CSI samenvatting Q2
Statistiek
De normaalverdeling of klokverdeling komt het meest voor in een populatie en wanneer een
onderzoek gedaan wordt. Deze verdeling komt normaal voor in veel soorten situaties. De verdeling is
symmetrisch, met de mean/gemiddelde ook als modus en mediaan. De normaalverdeling hangt
samen met het gemiddelde en de standaard deviatie. Een kleine SD geeft aan dat de gemeten
waardes dicht in de buurt van het gemiddelde zitten, waar de piek dus hoog zal zijn. Een grote SD
zegt dat de spreiding erg groot is en hierbij zal de piek lager
zijn. 68% van alle waarden zal binnen 1 SD van het
gemiddelde afzitten en 95% zal binnen 1.96*SD van het
gemiddelde afzitten. Alle onderzoeken hebben in principe een
normaalverdeling als de sample size groot genoeg is. Een
normaalverdeling kan ook gestandaardiseerd worden, waarbij
het gemiddelde op 0 gezet wordt met een SD van 1. Dit wordt
de Z-score: de gestandaardiseerde waarde voor de gewenste
variabele. Z = (X-mean)/populatie SD.
Een waarschijnlijkheidsverdeling of frequentieverdeling geeft de
waarschijnlijkheid van een variabele van verschillende mogelijke
uitkomsten hiervan. Ze zijn makkelijk te berekenen, want de
waarschijnlijkheden zijn gelijk aan de frequenties. Je hebt hierbij
discrete en continu uitkomsten. Discrete variabelen hebben een
telbaar nummer van verschillende uitkomsten (aantal kinderen,
kleuren in de regenboog). Continu variabelen hebben een oneindig
aantal van mogelijke waarden (gewicht, bloeddruk). Bij deze
variabele is de kans om exact het gemiddelde te krijgen in theorie 0.
Om de waarschijnlijkheden te berekenen, bereken je de
oppervlakte van de grafiek.
De steekproevenverdeling (sampling distribution) is een normaalverdeling van alle gemiddeldes
verkregen tijdens hetzelfde onderzoek dat vaker is gedaan (verdeling
van alle gemiddeldes die je kunt vinden bij een steekproef). Een
normaalverdeling gebruikt waarden van individuele personen van één
studie en berekent hieruit een gemiddelde. Deze gemiddeldes gaan
allemaal in de steekproevenverdeling. De verschillende gemiddeldes
zijn altijd van dezelfde populatie afkomstig! De steekproevenverdeling
heeft van zichzelf ook een mean (de echte populatie mean) en SD. De
SD van deze verdeling wordt de standaard error genoemd. Dit is SE =
SD/wortel sample size n. De standaard error is een maat voor de
precisie van een schatting. Hoe groter de sample size, hoe kleiner de
SE. De SD geeft daarentegen de maat van variatie aan; het geeft de
grootte van variabiliteit in een dataset aan.
Er bestaan verschillende soorten variabelen waar men mee kan werken. Nominale variabelen geven
een keuze tussen weinig waarden waar geen verschil in zit. Er zit geen verschil in rangorde en de
keuzes zijn duidelijk op te delen. Denk aan ja/nee, zwart/wit, man/vrouw. Ordinale variabelen geven
een keuze tussen verschillende categorieën waar een verschil tussen zit. Bij ordinaal zijn er keuzes
waartussen het verschil niet helemaal duidelijk is, waarbij ook geen gemiddelde uit te rekenen is. De
Gemaakt door: Georgia Graat