1 Een eerste stap
1.1 Wat is statistiek
Data: gegevens, een vastgelegd feit. Data heeft geen waarde vóór deze omgewandeld is in informatie.
Doel: het verzamelen van gegevens, ordenen, samenvatten en analyseren, met als doel om meer te
begrijpen van de wereld om je heen.
Soorten statistiek:
- Beschrijvende statistiek: een grote verzameling gegevens op een doelgerichte manier te
beschrijven door middel van tabellen, grafieken en maatstaven (kort en krachtig).
- Kansrekening: voorspellingen doen voor de toekomst of beslissingen nemen rekening
houdend met allerlei onzekerheden.
Het verzamelen van data:
- Populatie: de totale verzameling elementen waarop het onderzoek betrekking heeft.
- Steekproef: een onderzoek bij een deelverzameling (een deel van de populatie). Een
steekproef is een goede afspiegeling van de gehele populatie: representatief.
1.2 Typen variabelen
Kwantitatieve variabelen:
- Discrete variabele: een beperkt aantal mogelijke uitkomsten (tellen/telproces).
- Continue variabele: oneindig veel denkbare uitkomsten (meten/meetproces).
Kwalitatieve variabelen: aanduiding middels tekst, label.
Meetniveaus: NOIR.
- Nominaal (N): de denkbare uitkomsten zijn niet op een logische manier op een vaste
volgorde te zetten.
- Ordinaal (O): een vaste logische volgorde van uitkomsten.
- Interval (I): de verschillen tussen twee uitkomsten hebben een eenduidige betekenis.
Bevat geen natuurlijk nulpunt/vrij willekeurig gekozen.
- Ratio (R): bevat een natuurlijk nulpunt.
1.3 Tabellen maken
Ordenen: een overzichtelijk geheel vormen.
1. De gegevens indelen in groepen: klassen.
2. Vaststellen per klasse hoeveel waarnemingen daartoe behoren: frequenties.
3. Tabel of grafiek maken (INCLUSIEF opschrift, kopregel, klassen in logische volgorde,
totaalregel en bronvermelding).
Kruistabel: de waarnemingen worden ingedeeld aan de hand van twee kenmerken tegelijk. De
samenhang tussen twee variabelen wordt dus zichtbaar.
2 Werken met grafieken
2.1 Grafieken maken
Presenteren:
- Doel 1: de onderzoeker met een grafische voorstelling in één oogopslag een indruk van
bepaalde kenmerken van de beschikbare occasions weergeven.
- Doel 2: buitenstaanders op een gemakkelijke manier een schets geven van een verschijnsel of
variabele waarover men een verslag wil doen.
Eisen grafiek:
- Opschrift. Waar gaat de grafiek over?
- Bronvermelding. Waar komen de gegevens vandaan?
- Assenstelsel inclusief vermelde variabelen (eenheden) op de x-as en y-as.
- Regelmatig de waarden van een variabele weergegeven op de assen (zinvol nulpunt).
- Arceringen of kleuren weergeven in een legenda (lijstje met betekenis ervan).
, 2.2 Vier grafieken
1. Staafdiagram: de lengte van een kolom geeft de waargenomen frequentie weer.
Verticale staafdiagram.
Horizontale staafdiagram.
Stapeldiagram.
2. Cirkeldiagram: aangeven hoe een totaal van 100% is opgebouwd uit een aantal onderdelen.
!!! Een staafdiagram en cirkeldiagram worden vooral gebruikt bij nominale variabelen.
!!! Variabele op een intervalschaal of ratioschaal worden weergegeven in een assenstelsel.
3. Lijndiagram: een variabele in de tijd weergegeven.
4. Spreidingsdiagram: twee variabelen die in de vorm van paren worden weergegeven. Elke
waarneming (zowel A als B) wordt dan als een punt in de grafiek aangegeven: alle punten
tezamen, puntenwolk. Een spreidingsdiagram word gebruikt om een samenhang/verband
tussen de twee variabelen te bekijken.
2.3 Het histogram
Histogram: de oppervlakten van de kolommen komen overeen met de frequenties.
1. Indeling in klassen.
2. Tabel maken.
3. De hoogte van een kolom bepalen door de frequentiedichtheid.
frequentiedichtheid = aantal waarnemingen in klasse / klassebreedte
4. Histogram maken (Y-as met frequentiedichtheid).
3 Centrummaten en spreidingsmaten
3.1 Centrummaten
Centrummaten: maatstaven om een middenwaarde aan te geven.
- Rekenkundig gemiddelde ( X ): alle beschikbare uitkomsten gedeeld door het aantal. Het
rekenkundig gemiddelde wordt sterk beïnvloed door extreem hoge of lage waarden.
Σ Xi
X=
n
- Modus: het bekijken van een dataset; de waarde met de hoogste frequentie wordt als modus
aangeduid. (De piek van de verdeling). Extremen die weinig voorkomen, hebben dus geen
invloed op de ligging van de modus.
→ Nominale variabelen.
- Mediaan ( X me): de middelste waarneming (bij een sortering van laag naar hoog). Extreme
waarden hebben dus geen invloed op de mediaan. Bij een even getal aan waarnemingen (X i)
(geen midden), wordt het gemiddelde berekend van de twee uitkomsten die samen het
midden vormen: 50% percentiel.
→ Ordinale schaal.
3.2 Spreidingsmaten
Spreidingsmaten
- Variatiebreedte: de mate van spreiding is het verschil tussen de grootste en kleinste
uitkomst. Snel en eenvoudig.
variatiebreedte=hoogste waarde−laagste waarde
- Afwijkingen of deviaties: (di) de mate waarin de uitkomsten afwijken van het rekenkundig
gemiddelde. Kan zowel een positieve als negatieve uitkomst laten zien. Voor elke waarde
moet de deviatie afzonderlijk worden berekend, de som van alle deviaties is gelijk aan nul.
Di= X i−X