P. Claeys & N. Vamvas Ferrández
Samenvatting Statistiek I, academiejaar 2017-2018
Maxime Deveen
,Samenvatting Statistiek I
Module 1
Kwalitatieve variabelen of categorische variabelen: hebben betrekking op categorieën die met tekst
worden uitgedrukt. Bv: ijssmaak, geboorteland …
Kwantitatieve variabelen: worden steeds met een getal uitgedrukt. Bv: aandelen die worden
uitgedrukt in euro’s, opbrengst van een film dat wordt uitgedrukt in euro’s …
• Discrete kwantitatieve variabelen: meestal betrekking op aantallen; in sprongen. Het wordt
uitgedrukt in gehele getallen. Bv: 1 of 2 honden, geen 1,5 honden!
• Continue kwantitatieve variabelen: Een continue variabele kan in een bepaald interval iedere
waarde aannemen. Bv: de procentuele groei van het bbp 2,72%.
Meetniveaus onderscheiden:
Als de 0 iets betekent: intervalschaal:
• Temperatuur
• IQ
• Frequentie waarmee iets gedaan wordt
Als de 0 staat voor afwezigheid: ratioschaal:
• Percentages (die alleen positief kunnen zijn)
• Inkomen
• Leeftijd
1
,Grafische presentatie van data:
Kwalitatieve variabelen Kwantitatieve variabelen
Tabel met frequentietabel Tabel met frequentietabel
Staafdiagram Histogram (= staafdiagram maar bij klassen)
Taart / cirkeldiagram Stam- en bladdiagram
Paretodiagram1 Tijdreeksdiagram / lijndiagram
Stapeldiagram (bij meerdere variabelen) …
… …
Paretodiagram:
Stapeldiagram:
Tijdreeksdiagram:
1
Staafdiagram waarbij de categorieën worden getoond met een dalende frequentie
2
, Module 2
Centrummaten: mediaan, modus, gemiddelde, percentiel
• Nuttig om te weten rond welke waarden de waarnemingen liggen. Bijvoorbeeld om de
productiviteit te meten van personeel.
Spreidingsmaten: spreidingsbreedte of rang, interkwartielafstand (IKA), variantie,
standaardafwijking, variatiecoëfficiënt
• Nuttig om risico’s van 2 portfolio’s te vergelijken met elkaar.
Vormmaten: scheefheid
Centrummaten:
Mediaan bij oneven aantal: het middelste getal.
𝑁+1ste
Mediaan bij even aantal: het getal → Of gemiddelde van de 2 middelste getallen.
2
Percentielen: duiden de positie van een waarde tegen over de gehele dataset aan.
Percentiel = om het 1 gegevens. Bv: 10e percentiel = 10e waarde van de 100 gegevens.
Deciel = om de 10 gegevens. Bv: 5e deciel = 50e waarde van de 100 gegevens.
Kwartiel = om de 25 gegevens. Bv: 2e kwartiel = 50e waarde van de 100 gegevens.
Q1 = eerste kwartiel 0,25 x (N + 1)
Q2 = tweede kwartiel = mediaan 0,50 x (N + 1)
Q3 = derde kwartiel 0,75 x (N + 1)
Voorbeelden:
N = 9; Q1 is dan op positie 0,25 x (9 + 1) = 2,5
N = 50; 30e percentiel is dan op positie 0,3 x 50 = 15
Opm: Q3 kan soms gelijk zijn aan Q1 bij een constante reeks.
Modus: waarde die het meeste voorkomt. Het kan ook zijn dat er geen modus is, als alle waarden
bijvoorbeeld hetzelfde zijn. Meerdere modusen kunnen ook voorkomen, bijvoorbeeld 2 waarden met
dezelfde hoogste waarde.
𝑎1+𝑎2+𝑎3+⋯+𝑎𝑛
Rekenkundig gemiddelde:
𝑁
𝑁
Geometrisch of meetkundig gemiddelde: wordt gebruikt bij tijdsreeksen: √𝑎1 𝑥 𝑎2 𝑥 𝑎3 𝑥 … 𝑥 𝑎𝑛
𝑊1𝑋1+𝑊2𝑋2+𝑊3𝑋3+⋯𝑊𝑁𝑋𝑁
Gewogen gemiddelde: 𝑁
3