Centrummaten:
̅): Som van alle waardes / aantal waardes.
Gemiddelde (𝒙
o Werkt goed als er ongeveer evenveel hoge als lage waardes zijn. (gevoelig voor uitbijters)
Mediaan: Rangschikt waarde van laag naar hoog, kiest dan de middelste waarde
Modus: Meest voorkomende waarde. (pas op met kleine datasets)
o Bij meerdere meest voorkomende waardes wordt het eerste getal in reeks gepakt.
Spreidingsmaten:
Range (R): Verschil tussen de hoogste en de laagste waarde. (bij de waardes 4, 5 en 6 is de range 2)
o Geeft meer informatie over de spreiding van data dan het gemiddelde
o Vertelt niks over alle data tussen de max en min, uitschieters hebben hierdoor veel invloed
Sum of Squares (SS) = de som van gekwadrateerde afwijkingsscores (tussen data). ∑(xi−𝑥̅ )2
o Het verschil tussen een gegevenswaarde en het gemiddelde opgeteld.
o Hoe groter die is hoe groter de verschillen tussen de data (SD neemt niet alles mee, want
kijkt naar gemiddelde)
Standaarddeviatie (SD, σ ): Geeft spreiding/afwijking van het gemiddelde weer. (wortel van variatie)
o Hoe ver liggen waardes weg van gem., bij kleine SD ligt de data dicht bij het gemiddelde.
o σ = SS/(N-1) (alleen bij volledige populatie deel je door N ipv N-1)
Variance (s2): De SS gedeeld door de steekproefgrootte in het kwadraat.
o Houd rekening met alle waardes
o Vanwege het kwadraat is bij grote getallen de variatie waarde buiten proportie groot
Standard error of mean (SEM): Standaardfout van het gemiddelde, onzekerheid van data.
o Meet hoe ver het steekproefgemiddelde van de gegevens waarschijnlijk afwijkt van het
σ
werkelijke populatiegemiddelde. De SEM is altijd kleiner dan de SD, want SEM = 𝑁
√
Voorbeeld: Verschillende datasets: fictief_1 en fictief_2
• Evenveel meetpunten (32)
• Mediaan en Gemiddelde zijn hetzelfde (5,5) in de 2 datasets en Mediaan = Gemiddelde
• De Range, inclusief Maximum en Minimum is hetzelfde (11, loopt van 0 tot 12)
• de Som van de getallen is hetzelfde (logisch bij een identiek Gemiddelde en Aantal
meetpunten)
• Het grote verschil zit in de afgeleide parameters van de kwadraatverschillen (SS): de
Variantie, SD en SEM
• Ook de Modus wijkt behoorlijk af, van centraal naar periferie
,Normaalverdeling:
o Mediaan = Gemiddelde = Modus
o Binnen 𝒙̅ ± 1,96 SD liggen 95% van alle waardes
Voorbeeld: Verschillende datasets: Gelijk verdeeld en Normaal verdeeld
• Gelijk gemiddelde
• In Gelijk verdeeld komen alle getallen, 0 t/m 10, 4x voor; in Normaal verdeeld komen de
getallen rond het gemiddelde (5) vaker voor dan de perifere getallen.
• Omdat het aantal getallen dat ver van het gemiddelde ligt minder wordt, zal SD afnemen
,Opdracht: Koppel de juiste grafiek aan het juiste datasetje (figuur-1 t/m figuur-10; Groep-1 t/m
Groep-10)
, Groep 1 2 3 4 5 6 7 8 9 10
Figuur H E I F A B J C G D
Oplossen via Range, aantal metingen of SD/Variance. Valid = som van (waarde staaf x frequency)