Moore – McCabe - Craig
CHAPTER 1: LOOKING AT DATA-DISTRIBUTIONS
INTRODUCTION
Statistics = wetenschap waarbij kennis wordt verkregen uit data, zorgt ervoor dat informatie
compact kan worden genoteerd. Twee doelen:
1) Organiseren en opsommen van informatie zodat onderzoeksresultaten bekend
gemaakt kunnen worden
2) Beantwoorden van de onderzoeksvragen die de onderzoeker heeft
Data = gegevens, numerieke of kwalitatieve beschrijvingen van objecten die we willen
bestuderen.
Population = populatie, staat voor alle individuen waarover een onderzoeker uitspraken wil
doen. De populatie wordt beschreven met parameters.
Sample = steekproef, geselecteerde representatieve groep uit een populatie. Deze wordt
beschreven met statistics.
Er bestaan twee soorten statistiek:
- Beschrijvende statistiek = onderzoeker gebruikt statistische methode om data op te
sommen, te organiseren of te verduidelijken.
- Inferentiële statistiek = technieken waarmee steekproeven worden bestudeerd,
hierdoor kunnen uitspraken worden gedaan over de populatie.
Sampling error = verschil tussen de sample statistiek en een parameter van de
populatie.
1.1 DATA
Cases = objecten die worden beschreven door data. Bv. klanten, bedrijven, deelnemers aan
een studie, onderdelen in een experiment (groepen) etc.
Label = een speciale variabele die wordt gebruikt in sommige data om onderscheid te
maken tussen de verschillende cases.
Variable = variabele een karakteristiek/kenmerk van een case, variabelen kunnen
verschillende waarden aannemen.
Categorical variable = plaatst een case in een groep/categorie.
Quantitative variable = geeft numerieke waarden aan een variabele, waarmee
berekeningen kunnen worden gedaan.
Distribution = verdeling, zegt iets over welke waarden een variabele kan aannemen
en hoe vaak dit gebeurt.
Constante = variabele is voor iedereen hetzelfde.
Units of measurement = geeft de meeteenheid weer. Meet je bv. seconden of minuten,
meters of centimeters? Dit is belangrijk bij kwantitatieve variabelen.
1