samenvatting Spreidingsmaten
1.1 enkel kwantitatieve niveau.................................................................3
1.1.1 variatiebreedte (range).................................................................3
1.1.2 interkwartielafstand (ika)..............................................................3
1.1.3 interdecielafstand (ida).................................................................4
1.1.4 standaardafwijking/deviatie (sd)...................................................4
1.1.5 rekenkundig variant van (populatie variantie)............................13
1.1.6 rekenkundig variant van.............................................................14
1.1.7 lineaire transformatie.................................................................15
1.1.8 stelling van chebyshev...............................................................20
1.1.9 variatiecoëfficiënt.......................................................................25
1.2 enkel ordinaal niveau........................................................................27
1.2.1 ordinale spreidingsindex (oDI)....................................................27
1.3 enkel nominaal niveau......................................................................31
1.3.1 nominale spreidingsindex...........................................................31
Pagina 1 van 35
, SPREIDINGSMATEN
WAT IS SPREIDING?
Geeft aan hoe ver datapunten van elkaar en van het centrum v/e
verdeling verwijderd zijn.
= variabiliteit
Spreiding druk uit hoe variabel de meetwaarden v/e variabele zijn
de invulling van ‘variabiliteit’ is afhankelijk van het meetniveau v/d
variabele
Vraag: grote spreiding van meetwaarden?
WAAROM IS SPREIDING VAN BELANG?
Centrummaten vertellen waar de meeste data ligt
Spreidingsmaten zeggen hoe ver de datapunten uit elkaar liggen
o Veel spreiding/variatie: waarden minder consistent (=
moeilijker te voorspellen)
o Weinig spreiding/variabiliteit: ++ voorspellingen
SPREIDINGMATEN
NIET ROBUUST ROBUUST
o Variatiebreedte o IKA-afstand
o Standaardafwijking o IDE-afstand
o Variantie o IKA-spreidingscoëfficiënt
o variatiecoëfficiënt o IDE-spreidingscoëfficiënt
SOORTEN SPREIDINGSMATEN
Enkel kwantitatieve Enkel ordinaal Enkel nominaal
meetniveaus (I&R) meetniveau meetniveau
1. Variatiebreedte 8. Ordinale 9. Nominale
2. Interdecielafstand spreidingsinde spreidingsinde
3. Interkwartielafstand x x
4. Standaardafwijking &
variantie
5. Variatiecoëficiënt
6. Interkwartiele
spreidingscoëfficiënt
7. Interdeciele
spreidingscoëfficiënt
Pagina 2 van 35
,1.1 ENKEL KWANTITATIEVE NIVEAU
1.1.1 VARIATIEBREEDTE (RANGE)
WAT IS HET? Verschil tussen de grootste & kleinste waarde
FORMULE? Maximum – minimum
WAAROM Het zegt hoe “breed” de data ligt, maar let op:
BELANGRIJK? als er een uitschieter is dan verandert dit cijfer
heel erg. Dus: niet robuust
1.1.2 INTERKWARTIELAFSTAND (IKA)
WAT IS HET? Informatie over inte
(Q1) & derde kwa
Dat zijn de grenzen
data
voor iedere verd
gerangschikt is, be
waarden
FORMULE? Q3 – Q1
WAAROM o Negeert extre
BELANGRIJK? “midden”
o Dus: robuus
IQR: bereik v/d middelste
helft v/d dataset
Waarom < gevoelig dan
VB? berekenen met slechts
2 waarden uit het midden
v/d dataset minder
kans op extreme waarden
Pagina 3 van 35
, 1.1.3 INTERDECIELAFSTAND (IDA)
WAT IS HET? Verschil tussen 1e deciel (D1) & 9e deciel (D9)
Dat zijn de grenzen v/d middelste 80% van je data
FORMULE? D9 - D1
WAAROM o Robuuster dan variatiebreedte, < IKA
BELANGRIJK?
1.1.4 STANDAARDAFWIJKING/DEVIATIE (SD)
WAT IS HET? Het gemiddelde van hoe ver elke waarde v/h
gemiddelde ligt
OF gemiddelde hoeveelheid spreiding i/j dataset
DUS Hoe groter SD, Hoe ++ spreiding
WAAROM o Het gebruikt alle data, maar is gevoelig
BELANGRIJK? voor uitschieters
o Dus niet robuust
STAPPENPLAN V/D BEREKENING
1. Maak een overzicht van alle waarden & bepaald het gemiddelde
2. Bepaal de afstand tot het gemiddelde, door het gemiddelde af te
trekken van iedere waarde
3. Kwadrateer al deze afwijkingen v/h gemiddelde
4. Tel alle gekwadrateerde afwijkingen bij elkaar op
5. Deel de som van de gekwadrateerde afwijking door:
a. n-1 (v/e steekproef)
b. N (v/e populatie)
6. Bepaal de wortel v/d uitkomst bij Stap 5
Pagina 4 van 35
1.1 enkel kwantitatieve niveau.................................................................3
1.1.1 variatiebreedte (range).................................................................3
1.1.2 interkwartielafstand (ika)..............................................................3
1.1.3 interdecielafstand (ida).................................................................4
1.1.4 standaardafwijking/deviatie (sd)...................................................4
1.1.5 rekenkundig variant van (populatie variantie)............................13
1.1.6 rekenkundig variant van.............................................................14
1.1.7 lineaire transformatie.................................................................15
1.1.8 stelling van chebyshev...............................................................20
1.1.9 variatiecoëfficiënt.......................................................................25
1.2 enkel ordinaal niveau........................................................................27
1.2.1 ordinale spreidingsindex (oDI)....................................................27
1.3 enkel nominaal niveau......................................................................31
1.3.1 nominale spreidingsindex...........................................................31
Pagina 1 van 35
, SPREIDINGSMATEN
WAT IS SPREIDING?
Geeft aan hoe ver datapunten van elkaar en van het centrum v/e
verdeling verwijderd zijn.
= variabiliteit
Spreiding druk uit hoe variabel de meetwaarden v/e variabele zijn
de invulling van ‘variabiliteit’ is afhankelijk van het meetniveau v/d
variabele
Vraag: grote spreiding van meetwaarden?
WAAROM IS SPREIDING VAN BELANG?
Centrummaten vertellen waar de meeste data ligt
Spreidingsmaten zeggen hoe ver de datapunten uit elkaar liggen
o Veel spreiding/variatie: waarden minder consistent (=
moeilijker te voorspellen)
o Weinig spreiding/variabiliteit: ++ voorspellingen
SPREIDINGMATEN
NIET ROBUUST ROBUUST
o Variatiebreedte o IKA-afstand
o Standaardafwijking o IDE-afstand
o Variantie o IKA-spreidingscoëfficiënt
o variatiecoëfficiënt o IDE-spreidingscoëfficiënt
SOORTEN SPREIDINGSMATEN
Enkel kwantitatieve Enkel ordinaal Enkel nominaal
meetniveaus (I&R) meetniveau meetniveau
1. Variatiebreedte 8. Ordinale 9. Nominale
2. Interdecielafstand spreidingsinde spreidingsinde
3. Interkwartielafstand x x
4. Standaardafwijking &
variantie
5. Variatiecoëficiënt
6. Interkwartiele
spreidingscoëfficiënt
7. Interdeciele
spreidingscoëfficiënt
Pagina 2 van 35
,1.1 ENKEL KWANTITATIEVE NIVEAU
1.1.1 VARIATIEBREEDTE (RANGE)
WAT IS HET? Verschil tussen de grootste & kleinste waarde
FORMULE? Maximum – minimum
WAAROM Het zegt hoe “breed” de data ligt, maar let op:
BELANGRIJK? als er een uitschieter is dan verandert dit cijfer
heel erg. Dus: niet robuust
1.1.2 INTERKWARTIELAFSTAND (IKA)
WAT IS HET? Informatie over inte
(Q1) & derde kwa
Dat zijn de grenzen
data
voor iedere verd
gerangschikt is, be
waarden
FORMULE? Q3 – Q1
WAAROM o Negeert extre
BELANGRIJK? “midden”
o Dus: robuus
IQR: bereik v/d middelste
helft v/d dataset
Waarom < gevoelig dan
VB? berekenen met slechts
2 waarden uit het midden
v/d dataset minder
kans op extreme waarden
Pagina 3 van 35
, 1.1.3 INTERDECIELAFSTAND (IDA)
WAT IS HET? Verschil tussen 1e deciel (D1) & 9e deciel (D9)
Dat zijn de grenzen v/d middelste 80% van je data
FORMULE? D9 - D1
WAAROM o Robuuster dan variatiebreedte, < IKA
BELANGRIJK?
1.1.4 STANDAARDAFWIJKING/DEVIATIE (SD)
WAT IS HET? Het gemiddelde van hoe ver elke waarde v/h
gemiddelde ligt
OF gemiddelde hoeveelheid spreiding i/j dataset
DUS Hoe groter SD, Hoe ++ spreiding
WAAROM o Het gebruikt alle data, maar is gevoelig
BELANGRIJK? voor uitschieters
o Dus niet robuust
STAPPENPLAN V/D BEREKENING
1. Maak een overzicht van alle waarden & bepaald het gemiddelde
2. Bepaal de afstand tot het gemiddelde, door het gemiddelde af te
trekken van iedere waarde
3. Kwadrateer al deze afwijkingen v/h gemiddelde
4. Tel alle gekwadrateerde afwijkingen bij elkaar op
5. Deel de som van de gekwadrateerde afwijking door:
a. n-1 (v/e steekproef)
b. N (v/e populatie)
6. Bepaal de wortel v/d uitkomst bij Stap 5
Pagina 4 van 35