onzekerheid. Gegeven verzamelen, bewerken, interpreteren en presenteren.
Toepassingen van statistiek:
* betrouwbaarheid vaststellen: Hoe betrouwbaar is mijn conclusie als ik weet dat er onzekerheid
zit in de gegevens die ik heb gebruikt?
* significantie bepalen: helpt bij toeval onderscheiden van reëel effect.
* voorspellen: helpt bij op basis van waarnemingen uit het verleden toekomstige waarnemingen te
voorspellen.
Er zijn globaal twee soorten statistiek:
1. Beschrijvende statistiek. Het beschrijven en karakteriseren van een dataset. Het gaat hierbij
om de dataset als geheel. Ruwe data samenvatten in getallen en grafieken. (kengetallen)
2. Verklarende statistiek. Het gaat vaak over een deel van de populatie, een steekproef. Je trekt
op basis van een steekproef conclusies over de populatie als geheel. Eigenschappen van
populatie en systeem afleiden.
Er zijn vier meetschalen van categoriseren:
* Nominaal. Gaat enkel om categorieën (blauwe ogen/bruine ogen/man/vrouw)
* Ordinaal. Gaat om categorieën waarin je orde kunt aanbrengen. Verschillen kun je niet
interpreteren. (mbo, havo, vwo)
* Interval. Gaat om getallen met een waarde en het verschil tussen twee van deze getallen heeft
een betekenis (verschil tussen twee datums, temperaturen)
* Ratio. Gaat om getallen met een waarde waarbij je niet alleen naar het verschil maar ook naar
de verhouding kunt kijken. (het nulpunt is belangrijk; lengte, gewicht)
centrummaten: ze vertellen iet z over wat het ‘centrum’ van een data set is. (gemiddelde, de
mediaan en de modus)
gemiddelde
Bij het gemiddelde kun je onderscheid maken tussen het populatiegemiddelde (het gemiddelde
van alle leden van een populatie) of het steekproefgemiddelde (het gemiddelde van een deel van
de leden van een populatie)
Het gemiddelde is niet altijd even goed als centrummaat te gebruiken. Als er bijvoorbeeld
uitschieters voorkomen kan het gemiddelde erg beïnvloedt worden. Men noemt daarom het
gemiddelde en niet robuuste maat.
mediaan
De mediaan is de middelste waarde (of bij een even aantal het gemiddelde van de twee middelste
waarden). Je krijgt de mediaan door de data oplopend of aflopend te sorteren en zo de middelste
waarde te bekijken.
modus
Bij de modus kijken we naar de meest voorkomende waardes in een lijst. Er kunnen meerdere
modi zijn.
standaarddeviatie
Maat voor hoeveel de waarnemingen gemiddeld verschillen van het gemiddelde. De
standaarddeviatie is een maat voor de spreiding of variatie in de data. Data met weinig variatie
rond het gemiddelde heeft een kleine standaarddeviatie en met een grote standaarddeviatie een
grote.
Jet Wardenier