HOOFDSTUK 1 : KADERING
“Met statistiek kan je alles bewijzen” belangrijk in bijna alle wetenschapsdomeinen
Wetenschappelijk onderzoek :
- Planning (samenwerking, tijdschema, budget)
- Proefopzet
- Verzamelen van gegevens (data)
- Data verwerking
- Data analyse
- Interpretatie
- Publicatie
deze cursus : data analyse en interpretatie
Onzekerheid
Aantal observaties is beperkt (aantal labo-exp , budget voor N proefpersonen/dieren)
Er zou geen onzekerheid zijn als je iedereen kan testen / oneindig aantal experimenten hebt
Statistiek :
- Helpt omgaan met onzekerheid
- Implicaties voor proefopzet, analyse, interpretatie
3 demo’s
Muntstuk : hoe meer personen hoe meer je bij 50/50 komt
Schrijfhand bij mannen/vrouwen
Dataset lichaamslengte : gemiddelde berekenen door willekeurige steekproef van 20
personen uit populatie van 10.000
Gemiddelde lengte fluctueert , toevalsvariatie in steekproef maar niet ver van “echte”
waarde
Toevalsvariatie
Toevalsvariatie in meeste wetenschappelijke experimenten
- Experiment = willekeurige steekproef
Toeval beantwoordt aan bepaalde wetten
Laat toe om conclusie te trekken over onbekende populatie gebaseerd op beperkte
steekproef
Willekeurige steekproef
Experiment = willekeurige steekproef
Random veranderlijke = variabele waarvan waarde afhangt van toevalsvariatie
,HOOFDSTUK 2 : BESCHRIJVENDE STATISTIEK
Soorten variabelen
Categorisch
- Verdeelt populatie in categoriën
- Beperkt (=discreet) aantal niveau’s
Nominaal : zonder orde (bloedgroep, nationaliteit)
Ordinaal : met orde (graad, schaal met 5 niveau’s bv hotel beoordelen van slecht –
super goed)
Numeriek
- Discreet
Geteld aantal (geheel getal)
Bv punten op examen, # ongelukken
- Continu (met komma’s)
Meetwaarde, percentage
Bv bloeddruk, gewicht, lichaamslengte
Enkele voorbeelden :
- Rookt u? categorisch , nominaal
- Meting lichsnelheid numeriek, continu
- # ongevallen op de ring afgelopen week numeriek, discreet
- Bloeddruk numeriek, continu
- Bloedgroep categorisch , nominaal
- Slaagpercentage 1e BA FAR numeriek , continu
- Behaald # punten op examen numeriek, discreet
- Graad op einde van het jaar categorisch , ordinaal
Beschrijvende statistiek
Beste manier om data samen te vatten
- Centrale locatie
- Spreiding
Afhankelijk v/d symmetrie van de verdeling
- Rechts scheef (bv sekspartners voornamelijk 0/1)
- Links scheef
Centrale locatie
Bv lichaamslengte
Gemiddelde en mediaan belangrijk
Bij symmetrische verdeling mediaan en gemiddelde ongeveer samen
Bij scheve verdeling gemiddelde en mediaan verschillen
Gemiddelde of mediaan
, Gemiddelde wordt beïnvloed door 1 uitsteker, mediaan niet
Gemiddelde
- Symmetrische verdeling
- Gevoelig voor outliers
- Gebruikt alle informatie
- Relatie met onderliggende verdeling
Mediaan
- Verdeling hoeft niet symmetrisch
- Ongevoelig voor outliers
- Gebruikt niet alle informatie
Spreiding
Spreiding van de individuele observaties rondom gemiddelde
Symmetrische of asymmetrische verdeling
Spreiding – symmetrisch
Variantie = gemiddelde kwadratische afwijking van het gemiddelde
elk individueel punt heeft
een bepaalde meetwaarde
Xi. Het maakt niet uit of
het boven of
onder het gemiddelde ligt
dus neemt men het
kwadraat. En daarvan
wordt dan het gemiddelde
, afgetrokken. Dit wordt dan
gedeeld door n-1. Dit geeft
een variantie.
elk individueel punt heeft
een bepaalde meetwaarde
Xi. Het maakt niet uit of
het boven of
onder het gemiddelde ligt
dus neemt men het
kwadraat. En daarvan
wordt dan het gemiddelde
afgetrokken. Dit wordt dan
gedeeld door n-1. Dit geeft
een variantie.
elk individueel punt heeft
een bepaalde meetwaarde
Xi. Het maakt niet uit of
het boven of