Samenvatting Biostatistiek ( Januari)
Hoofdstuk 1: General overview
Minder belangrijk hoofdstuk
Twee manieren van waarden voorstellen:
1. Numeriek: In een tabel
2. Grafisch: visueel analyseren
De manier van voorstellen hangt af van de soort data:
1. Continu data: Oneindig veel waarden
2. Discrete data: Een paar mogelijke waarden (bv: Geslacht)
Hoofdstuk 2: Descriptive Statistics
- Beschrijven van informatie
- Gegevens verzamelen
- Datasets genereren
Tekening maken op basis van de data
Verschillende soorten diagrammen:
- Bar Diagram: Staafdiagram
- Scatter plot: Plotten van punten
1: Measures of Location
- Data beschrijven door grafiek: Zichtbaar maken
- Gegevens beschrijven door berekeningen te maken (= Measures of Location)
- Gegevens samenvatten kan via het gemiddelde
Gemiddelde: alle waarden optellen en daarna delen door het aantal gegevens
Gemiddelde is zeer gevoelig voor extreme waarden
1
,Median: is de middelste waarde
Bij even aantal getallen: Gemiddelde tussen de twee middelste waarden
Bloeddruk meten
- X-as: Variabelen die gemeten zijn
- Y-as: Aantal mensen
Bij de eerste grafiek
- De mediaan en het gemiddelde is bijna hetzelfde
- Dit is zo bij symmetrische verdelingen
GRAFIEK 2
- Positief verdeeld: is een verdeling met een lange rechte staart
- Het begin van de grafiek heeft een hoge waarde
2
, GRAFIEK 3
- Negatief verdeeld
- Het einde van de grafiek heeft een hoge waarde
Comparing Average and Median
- Tweede grafiek: Gemiddelde is groter dan de mediaan
- Derde grafiek: Gemiddelde is kleiner dan de mediaan
Twee soorten:
1. Negatief vertekend (= Rechtsscheef): je begint met een staart en stijgt naar de top
2. Positief vertekend (= Linksscheef): Je begint bij de top en daalt steeds (in een
staart)
Modus (= MODE): is de meest voorkomende waarde
Geometrische gemiddelde: is de antilog.
Log gemiddelde is: -0,846
Geometrisch gemiddelde is dan 10^-0,846
Logaritmische concentratie kan er voor zorgen dat de punten beter verdeeld is
Manier 1: Measures of Location
- Locatie samenvatten
- Modus, Gemiddelde, Mediaan, Geometrisch gemiddelde zijn belangrijk
Manier 2: Measures of Spread
- De spreiding van gegevens samenvatten
LES 2
Voorbeeld Verschil tussen Grafieken: De spreiding van de gegevens zijn anders voor de
twee grafieken maar het gemiddelde is hetzelfde (200)
3
Hoofdstuk 1: General overview
Minder belangrijk hoofdstuk
Twee manieren van waarden voorstellen:
1. Numeriek: In een tabel
2. Grafisch: visueel analyseren
De manier van voorstellen hangt af van de soort data:
1. Continu data: Oneindig veel waarden
2. Discrete data: Een paar mogelijke waarden (bv: Geslacht)
Hoofdstuk 2: Descriptive Statistics
- Beschrijven van informatie
- Gegevens verzamelen
- Datasets genereren
Tekening maken op basis van de data
Verschillende soorten diagrammen:
- Bar Diagram: Staafdiagram
- Scatter plot: Plotten van punten
1: Measures of Location
- Data beschrijven door grafiek: Zichtbaar maken
- Gegevens beschrijven door berekeningen te maken (= Measures of Location)
- Gegevens samenvatten kan via het gemiddelde
Gemiddelde: alle waarden optellen en daarna delen door het aantal gegevens
Gemiddelde is zeer gevoelig voor extreme waarden
1
,Median: is de middelste waarde
Bij even aantal getallen: Gemiddelde tussen de twee middelste waarden
Bloeddruk meten
- X-as: Variabelen die gemeten zijn
- Y-as: Aantal mensen
Bij de eerste grafiek
- De mediaan en het gemiddelde is bijna hetzelfde
- Dit is zo bij symmetrische verdelingen
GRAFIEK 2
- Positief verdeeld: is een verdeling met een lange rechte staart
- Het begin van de grafiek heeft een hoge waarde
2
, GRAFIEK 3
- Negatief verdeeld
- Het einde van de grafiek heeft een hoge waarde
Comparing Average and Median
- Tweede grafiek: Gemiddelde is groter dan de mediaan
- Derde grafiek: Gemiddelde is kleiner dan de mediaan
Twee soorten:
1. Negatief vertekend (= Rechtsscheef): je begint met een staart en stijgt naar de top
2. Positief vertekend (= Linksscheef): Je begint bij de top en daalt steeds (in een
staart)
Modus (= MODE): is de meest voorkomende waarde
Geometrische gemiddelde: is de antilog.
Log gemiddelde is: -0,846
Geometrisch gemiddelde is dan 10^-0,846
Logaritmische concentratie kan er voor zorgen dat de punten beter verdeeld is
Manier 1: Measures of Location
- Locatie samenvatten
- Modus, Gemiddelde, Mediaan, Geometrisch gemiddelde zijn belangrijk
Manier 2: Measures of Spread
- De spreiding van gegevens samenvatten
LES 2
Voorbeeld Verschil tussen Grafieken: De spreiding van de gegevens zijn anders voor de
twee grafieken maar het gemiddelde is hetzelfde (200)
3