SAMENVATTING STATISTIEK
MODULE 1
1: INLEIDING
1. DATA TYPES
CATEGORISCHE DATA (= CATEGORIEËN)
- NOMINAAL
o Geen vaste volgorde
o vb. woonplaats, bloedgroep, kleuren, geslacht,…
- ORDINAAL
o Welbepaalde volgorde
o vb. zeer goed – goed – matig – slecht – zeer slecht
NUMERISCHE DATA (= NUMMERS)
- DISCREET
o Gebruik gehele waarden/cijfers/getallen
o vb. 0, 1, 2, 34, 100, 156,…
- CONTINUE
o Gebruik decimalen
o vb. 167.7 cm, 23.6mm,…
2. PROPORTIES
DEFINITIE
Nominale data wordt uitgedrukt in numerische data
- vb. Zijn er caries op de tanden (ja/nee → nominaal), zo ja op hoeveel tanden (3 → numerisch)
3. DISTRIBUTIES
PROBABILITY DENSITY FUNCTION
- Kans dat bepaalde waarde binnen bepaald interval valt.
NORMALE DISTRIBUTIE
- Symmetrie
- Grootste kans in midden
UNIFORME DISTRIBUTIE
- Kans overal hetzelfde
, BIMODALE DISTRIBUTIE
- Twee pieken geven aan dat er twee groepen in dataset zijn
- vb. mannen/vrouwen
SCHEEF VERDEELDE DISTRIBUTIE
- Positively skewed: meeste waarden liggen links
- Negatively skewed: meeste waarden liggen rechts
4. STEEKPROEF
DEFINITIE
Willekeurige data uit dataset
- Hoe kleiner de distributie, hoe kleiner de kans op extremen en hoe groter de kans op gemiddelde
SCHATTING
= theta = gemiddelde
- Kan wijzigen door nieuwe data
o Onzekerheid wordt aangegeven met 95% confidence interval
▪ 95% vertrouwen dat waarde tussen aangegeven grenzen ligt
• Hoe kleiner steekproef, hoe meer onzekerheid
5. PARAMETERS
POPULATIE WAARDEN STEEKPROEF WAARDEN
Theta (= algemeen gebruik)
Gemiddelde van numerische variabel x
Standaardafwijking van numerische variabel s -
Proportie van categorische variabel p
Correlatie tussen twee variabelen r
Verloop tussen twee variabele b
6. HYPOTHESEN TESTEN
1. Nulhypothese (H0) opstellen (vb. schedels mannen = schedels vrouwen)
2. Nulhypothese (H0) ontkrachten door alternatieve hypothese (H1) (vb. mannen > vrouwen)
DEFINITIE HYPOTHESE
- We bewijzen nooit iets
- We aanvaarden hypothese nooit
- We verwerpen hypothese
- We geven steun aan hypothese
7. P – WAARDEN
- Meten hoe extreem streekproef is
- Als streekproef in top 5% ligt, wordt (H0) verworpen en (H1) wordt aangenomen!
o Hoe kleiner p – waarde, hoe groter kans (H0) verworpen wordt
o Hoe groter p – waarde, hoe kleiner kans (H0) verworpen wordt
MODULE 1
1: INLEIDING
1. DATA TYPES
CATEGORISCHE DATA (= CATEGORIEËN)
- NOMINAAL
o Geen vaste volgorde
o vb. woonplaats, bloedgroep, kleuren, geslacht,…
- ORDINAAL
o Welbepaalde volgorde
o vb. zeer goed – goed – matig – slecht – zeer slecht
NUMERISCHE DATA (= NUMMERS)
- DISCREET
o Gebruik gehele waarden/cijfers/getallen
o vb. 0, 1, 2, 34, 100, 156,…
- CONTINUE
o Gebruik decimalen
o vb. 167.7 cm, 23.6mm,…
2. PROPORTIES
DEFINITIE
Nominale data wordt uitgedrukt in numerische data
- vb. Zijn er caries op de tanden (ja/nee → nominaal), zo ja op hoeveel tanden (3 → numerisch)
3. DISTRIBUTIES
PROBABILITY DENSITY FUNCTION
- Kans dat bepaalde waarde binnen bepaald interval valt.
NORMALE DISTRIBUTIE
- Symmetrie
- Grootste kans in midden
UNIFORME DISTRIBUTIE
- Kans overal hetzelfde
, BIMODALE DISTRIBUTIE
- Twee pieken geven aan dat er twee groepen in dataset zijn
- vb. mannen/vrouwen
SCHEEF VERDEELDE DISTRIBUTIE
- Positively skewed: meeste waarden liggen links
- Negatively skewed: meeste waarden liggen rechts
4. STEEKPROEF
DEFINITIE
Willekeurige data uit dataset
- Hoe kleiner de distributie, hoe kleiner de kans op extremen en hoe groter de kans op gemiddelde
SCHATTING
= theta = gemiddelde
- Kan wijzigen door nieuwe data
o Onzekerheid wordt aangegeven met 95% confidence interval
▪ 95% vertrouwen dat waarde tussen aangegeven grenzen ligt
• Hoe kleiner steekproef, hoe meer onzekerheid
5. PARAMETERS
POPULATIE WAARDEN STEEKPROEF WAARDEN
Theta (= algemeen gebruik)
Gemiddelde van numerische variabel x
Standaardafwijking van numerische variabel s -
Proportie van categorische variabel p
Correlatie tussen twee variabelen r
Verloop tussen twee variabele b
6. HYPOTHESEN TESTEN
1. Nulhypothese (H0) opstellen (vb. schedels mannen = schedels vrouwen)
2. Nulhypothese (H0) ontkrachten door alternatieve hypothese (H1) (vb. mannen > vrouwen)
DEFINITIE HYPOTHESE
- We bewijzen nooit iets
- We aanvaarden hypothese nooit
- We verwerpen hypothese
- We geven steun aan hypothese
7. P – WAARDEN
- Meten hoe extreem streekproef is
- Als streekproef in top 5% ligt, wordt (H0) verworpen en (H1) wordt aangenomen!
o Hoe kleiner p – waarde, hoe groter kans (H0) verworpen wordt
o Hoe groter p – waarde, hoe kleiner kans (H0) verworpen wordt