INLEIDING IN STATISTIEK
Wat is (bio) statistiek?
•
• Steekproef uit populatie halen ➔ alleen mensen, moet representatief zijn
• Iets testen bij steekproef
• Resultaat terugkoppelen/generaliseren naar de populatie
• Inductieve tak = schatten en toetsen
• Beschrijvende tak = op basis van numerieke of grafische voorstellingen
Wat is een populatie?
• Een verzameling van subjecten die op z’n minst 1 karakteristiek (eigenschap) gemeen hebben
• N = populatie
• Is doorgaans onbeperkt groot
• Moet duidelijk worden gedefinieerd
• BV lichaamslengte van studenten logo/audio
o Alle logo/audio’s van België
Wat is een steekproef?
• een deelverzameling van subjecten (toevallig) getrokken uit de studiepopulatie
• n = steekproefgrootte
• is beperkt in aantal
• moet representatief zijn voor de populatie
o bias!
1
, • Wordt gebruikt voor
o Schatten vd populatieparameters
o Het testen van hypothesen
• BV BMI van studenten logo/audio studerend aan UGent in academiejaar 2020-2021
o Testen obv steekproef ➔ aantal studenten trekken
Beschrijvende statistiek
• Variabelen
o Karakteristieken van een populatie
o Kunnen verschillende waarden (attributen) aannemen
o 2 hoofdcategorieën
▪ Categorische (kwalitatieve, discontinu)
▪ Continue (kwantitatieve)
• Waarnemingsschalen – indeling
o
o Nominale variabele = categorie heeft geen rangorde
▪ BV kleur van de ogen
o Nominale dichotome variabele ➔ 2 categorieën
▪ BV zwanger: ja/nee
o Nominale polytome variabelen ➔ meer dan 2 categorieën
▪ BV oogkleur
o Ordinaal = er is een rangorde aanwezig
▪ BV mate van gehoorverlies
o Continue variabelen ➔ scale
▪ Worden als een getalwaarde uitgedrukt volgens een continue schaalverdeling
▪ EENHEID VERMELDEN
▪ Intervalschaal = de afstanden op de schaal zijn van een gekende grootte (BV
temp °C)
▪ Ratioschaal = de schaal heeft een reëel nulpunt (BV gewicht)
• Opmerkingen
o Waarnemingsschaal is van zeer groot belang voor uiteindelijke keuze vd te gebruiken
statistische test
o Mogelijk om van continue waarnemingsschaal een hercodering te doen naar ordinale
schaal
2
, o Reductie ➔ DUS informatieverlies
DATACLEANING
Stap 1 = ga op zoek naar onmogelijke waarden
➔ frequentieverdeling
Stap 2 = kopieer niet-cleane variabele naar nieuwe variabele
➔ recode into different variable
Stap 3 = controleer kopie
➔ frequentieverdelingen vergelijken
Stap 4 = eigenlijke datacleaning
➔ recode into same variable
Stap 5 = controleer datacleaning
➔ frequentieverdeling
Beschrijvende statistiek
• Samenvatting van steekproefgegevens op
o Een duidelijk EN
o Bevattelijke manier
• Hoe?
3
Wat is (bio) statistiek?
•
• Steekproef uit populatie halen ➔ alleen mensen, moet representatief zijn
• Iets testen bij steekproef
• Resultaat terugkoppelen/generaliseren naar de populatie
• Inductieve tak = schatten en toetsen
• Beschrijvende tak = op basis van numerieke of grafische voorstellingen
Wat is een populatie?
• Een verzameling van subjecten die op z’n minst 1 karakteristiek (eigenschap) gemeen hebben
• N = populatie
• Is doorgaans onbeperkt groot
• Moet duidelijk worden gedefinieerd
• BV lichaamslengte van studenten logo/audio
o Alle logo/audio’s van België
Wat is een steekproef?
• een deelverzameling van subjecten (toevallig) getrokken uit de studiepopulatie
• n = steekproefgrootte
• is beperkt in aantal
• moet representatief zijn voor de populatie
o bias!
1
, • Wordt gebruikt voor
o Schatten vd populatieparameters
o Het testen van hypothesen
• BV BMI van studenten logo/audio studerend aan UGent in academiejaar 2020-2021
o Testen obv steekproef ➔ aantal studenten trekken
Beschrijvende statistiek
• Variabelen
o Karakteristieken van een populatie
o Kunnen verschillende waarden (attributen) aannemen
o 2 hoofdcategorieën
▪ Categorische (kwalitatieve, discontinu)
▪ Continue (kwantitatieve)
• Waarnemingsschalen – indeling
o
o Nominale variabele = categorie heeft geen rangorde
▪ BV kleur van de ogen
o Nominale dichotome variabele ➔ 2 categorieën
▪ BV zwanger: ja/nee
o Nominale polytome variabelen ➔ meer dan 2 categorieën
▪ BV oogkleur
o Ordinaal = er is een rangorde aanwezig
▪ BV mate van gehoorverlies
o Continue variabelen ➔ scale
▪ Worden als een getalwaarde uitgedrukt volgens een continue schaalverdeling
▪ EENHEID VERMELDEN
▪ Intervalschaal = de afstanden op de schaal zijn van een gekende grootte (BV
temp °C)
▪ Ratioschaal = de schaal heeft een reëel nulpunt (BV gewicht)
• Opmerkingen
o Waarnemingsschaal is van zeer groot belang voor uiteindelijke keuze vd te gebruiken
statistische test
o Mogelijk om van continue waarnemingsschaal een hercodering te doen naar ordinale
schaal
2
, o Reductie ➔ DUS informatieverlies
DATACLEANING
Stap 1 = ga op zoek naar onmogelijke waarden
➔ frequentieverdeling
Stap 2 = kopieer niet-cleane variabele naar nieuwe variabele
➔ recode into different variable
Stap 3 = controleer kopie
➔ frequentieverdelingen vergelijken
Stap 4 = eigenlijke datacleaning
➔ recode into same variable
Stap 5 = controleer datacleaning
➔ frequentieverdeling
Beschrijvende statistiek
• Samenvatting van steekproefgegevens op
o Een duidelijk EN
o Bevattelijke manier
• Hoe?
3