HOOFDSTUK 1: KADERING
WETENSCHAPPELIJK ONDERZOEK
Planning
- Samenwerkingen, tijdschema, budget
Proefopzet
- Study design, plannen van experimenten ifv onderzoeksvraag, latere analyse & vereiste statistische
power
Verzamelen van gegevens = data
- Data collection, willekeurige steekproef uit populatie representatief & envertekend
Data verwerking
- Invoeren van gegevens in database, data cleaning onvolledige/foute gegevens
Data analyse
- Grafische analyse, statistische testen
Interpretatie
- Terugkoppelen nr onderzoeksvragen: nieuwe vraag?, veralgemenen nr populaite?
Publicatie
- Vakbladen, peer-review proces
ONZEKERHEID
Meting beperkt in tijd & plaats
onnauwkeurigheid op meting
Aantal observaties is beperkt aantal experimenten & budget
TOEVALSVARIATIE
Toeval beantwoordt aan bepaalde wetten
laat toe conclusie te treken over onbekende populatie gebaseerd op steekproef
WILLEKEURIGE STEEKPROEF
= experiment
- Resultaat experiment
o Antwoord op vragenlijst, meting biologische/fysische waarde
- Variabele = random veranderlijke = variabele waarvan waarde afhangt van toevalsvariatie
,HOOFDSTUK 2: BESCHRIJVENDE STATISTIEK
SOORTEN VARIABELE
Categorisch
- Verdeelt populaite in categoriën
- Beperkt (discreet) aantal niveaus
o Zonder orde: nominaal bv bloedgroep, nationaliteit
o Met orde: ordinaal bv graad, schaal met 5 niveau’s
Numeriek
- Kwantitateif
- Discreet: geteld aantal, punten op examen geheel getal
continu: meetwaarde, percentage, bloeddruk, lichaamslengte met komma’s
DATA BESCHRIJVEN
- Continue variabele: beschrijvende statistiek, grafieken & verdelingsfunctie
- Afhankelijk soort variabele: continu of discreet
BESCHRIJVENDE STATISTIEK
- Data samenvatten adhv centrale locatie & spreiding
- Afhankelijk symmetrie verdeling: rechts/links scheef
CENTRALE LOCATIE
= rekenkundig gemiddelde of mediaan
- Symmetrische verdeling: gemiddelde = +/- mediaan
asymmetrisch: mediaan gebruiken
o Extreme waarden trekken gemiddelde naar zich toe
Gemiddelde
- Bij symmetrische verdeling WANT gevoelig voor outliers
- Gebruikt alle informatie
- Relatie met onderliggende verdeling
Mediaan
- Verdeling moet niet symmetrisch zijn WANT ongevoelig outliers
- Gebruikt niet alle informatie
, SPREIDING
- Spreiding van individuele observaties rondom gemiddelde
symmetrische of asymmetrische verdeling
Symmetrisch
- Variantie = gemiddelde kwadratische afwijking van gemiddelde s2
- Standaardafwijking= SD= standard deviation
o Zelfde meetschaal als oorspronkelijke meetwaarden
- Met X i = individuele meting/waarde
n = aantal metingen
= gemiddelde
Asymmetrisch
- Range = volledige data (van grootste tot kleinste)
- Percentielen: rangschik observaties van klein nr groot
o Voor p-de percentiel geldt p% van alle observaties kleiner
en (1-p)% alle observaties is groter
o Bv: 28ste percentiel zegt dat 28% mensen kleiner is dan mij
- Speciale percentielen
o P50 = mediaan
o P25 & p75 = kwartielen
o P10, p20, p30 = decielen
o Data tss p25-p75 = interkwartielafstand
BOX-WHISKER PLOT
X = uitschieter = outlier
rechthoek = interkwartielafstand
= helft observaties
Whisker: tot op punt waar
waarden zijn
SPREIDINGSMATEN
Variantie & SD
- Bij symmetrische verdeling, gevoelig outliers
gebruikt alle informatie & relatie met onderliggende verdeling
Interkwartielafstand
- Moet niet symmetrisch zijn, ongevoelig outliers
gebruikt niet alle info
WETENSCHAPPELIJK ONDERZOEK
Planning
- Samenwerkingen, tijdschema, budget
Proefopzet
- Study design, plannen van experimenten ifv onderzoeksvraag, latere analyse & vereiste statistische
power
Verzamelen van gegevens = data
- Data collection, willekeurige steekproef uit populatie representatief & envertekend
Data verwerking
- Invoeren van gegevens in database, data cleaning onvolledige/foute gegevens
Data analyse
- Grafische analyse, statistische testen
Interpretatie
- Terugkoppelen nr onderzoeksvragen: nieuwe vraag?, veralgemenen nr populaite?
Publicatie
- Vakbladen, peer-review proces
ONZEKERHEID
Meting beperkt in tijd & plaats
onnauwkeurigheid op meting
Aantal observaties is beperkt aantal experimenten & budget
TOEVALSVARIATIE
Toeval beantwoordt aan bepaalde wetten
laat toe conclusie te treken over onbekende populatie gebaseerd op steekproef
WILLEKEURIGE STEEKPROEF
= experiment
- Resultaat experiment
o Antwoord op vragenlijst, meting biologische/fysische waarde
- Variabele = random veranderlijke = variabele waarvan waarde afhangt van toevalsvariatie
,HOOFDSTUK 2: BESCHRIJVENDE STATISTIEK
SOORTEN VARIABELE
Categorisch
- Verdeelt populaite in categoriën
- Beperkt (discreet) aantal niveaus
o Zonder orde: nominaal bv bloedgroep, nationaliteit
o Met orde: ordinaal bv graad, schaal met 5 niveau’s
Numeriek
- Kwantitateif
- Discreet: geteld aantal, punten op examen geheel getal
continu: meetwaarde, percentage, bloeddruk, lichaamslengte met komma’s
DATA BESCHRIJVEN
- Continue variabele: beschrijvende statistiek, grafieken & verdelingsfunctie
- Afhankelijk soort variabele: continu of discreet
BESCHRIJVENDE STATISTIEK
- Data samenvatten adhv centrale locatie & spreiding
- Afhankelijk symmetrie verdeling: rechts/links scheef
CENTRALE LOCATIE
= rekenkundig gemiddelde of mediaan
- Symmetrische verdeling: gemiddelde = +/- mediaan
asymmetrisch: mediaan gebruiken
o Extreme waarden trekken gemiddelde naar zich toe
Gemiddelde
- Bij symmetrische verdeling WANT gevoelig voor outliers
- Gebruikt alle informatie
- Relatie met onderliggende verdeling
Mediaan
- Verdeling moet niet symmetrisch zijn WANT ongevoelig outliers
- Gebruikt niet alle informatie
, SPREIDING
- Spreiding van individuele observaties rondom gemiddelde
symmetrische of asymmetrische verdeling
Symmetrisch
- Variantie = gemiddelde kwadratische afwijking van gemiddelde s2
- Standaardafwijking= SD= standard deviation
o Zelfde meetschaal als oorspronkelijke meetwaarden
- Met X i = individuele meting/waarde
n = aantal metingen
= gemiddelde
Asymmetrisch
- Range = volledige data (van grootste tot kleinste)
- Percentielen: rangschik observaties van klein nr groot
o Voor p-de percentiel geldt p% van alle observaties kleiner
en (1-p)% alle observaties is groter
o Bv: 28ste percentiel zegt dat 28% mensen kleiner is dan mij
- Speciale percentielen
o P50 = mediaan
o P25 & p75 = kwartielen
o P10, p20, p30 = decielen
o Data tss p25-p75 = interkwartielafstand
BOX-WHISKER PLOT
X = uitschieter = outlier
rechthoek = interkwartielafstand
= helft observaties
Whisker: tot op punt waar
waarden zijn
SPREIDINGSMATEN
Variantie & SD
- Bij symmetrische verdeling, gevoelig outliers
gebruikt alle informatie & relatie met onderliggende verdeling
Interkwartielafstand
- Moet niet symmetrisch zijn, ongevoelig outliers
gebruikt niet alle info