3.3 Spreiding
Wanneer men een verdeling met één getal moet weergeven, kiest men meestal voor
een maat van centrale tendens (modus, mediaan, …). Twee verdelingen kunnen
echter eenzelfde centrale maat hebben, terwijl ze er helemaal anders uitzien.
Vb.: 10, 20, 30, 40, 50 met mediaan 30
ô
28, 29, 30, 31, 32 met mediaan 30
3.3.1 relatieve heterogeniteit
Relatieve heterogeniteit:
k (1 - pmodus )
h=
k -1
Met k gelijk aan het aantal klassen/ categorieën en de 𝑝 𝑚𝑜𝑑𝑢𝑠 gelijk aan de
relatieve frequentie van de modus/ modale klasse/ modale categorie. Deze maat
wordt enkel gebruikt bij kwantitatieve gegevens.
Er geldt: 𝟎 ≤ 𝐡 ≤ 𝟏 waarbij
0: volledige homogeniteit à alle gegevens zijn hetzelfde à 𝑝 𝑚𝑜𝑑𝑢𝑠 = 1
1: maximale relatieve heterogeniteit à 𝑝 𝑚𝑜𝑑𝑢𝑠 = 1 𝑛
Vb.: h= 5 (1 − 0,7) 5 − 1 = 0, 375 Studierichting Aantal afgestudeerden
Latijn-Grieks 70%
modus: Latijn-Grieks Latijn-Wiskunde 15%
𝑝 𝑚𝑜𝑑𝑢𝑠 : 0, 70 Latijn-Wetenschappen 8%
Wetenschappen A 5%
Wetenschappen B 2%
, 3.3.2 bereik, interkwartielbereik en semi-interkwartielbereik
Bereik: verschil tussen maximum en het minimum. Het bereik is extreem gevoelig
voor uitschieters.
𝑋 1 is de waarde van de allerlaagste X-waarde in de tabel.
𝑋 𝑛 is de waarde van de allerhoogste X-waarde in de tabel.
Interkwartielbereik: verschil tussen het derde en het eerste kwartiel. Dit is een
robuuste maat van spreiding bij kwantitatieve variabelen.
Semi-interkwartielbereik: de helft van het interkwartielbereik. Dit is ook een
robuuste maat van spreiding bij kwantitatieve variabelen.
3.3.3 variantie en standaardafwijking
Variantie 𝑺 𝑿 𝟐 en standaardafwijking 𝑺 𝒙 zijn de meest populaire maten van spreiding.
De standaardafwijking is voordeliger aangezien deze in de standaard meeteenheden
blijft staan. Men mag de eenheden ook niet vergeten: bij variantie zijn de eenheden
dus altijd tot de tweede macht.
Variantie 𝑺 𝑿 𝟐 : geeft weer hoeveel de scores van elkaar verschillen.
Standaardafwijking 𝑺 𝒙 : geeft weer hoeveel de scores afwijken van het
gemiddelde.
De standaardafwijking geeft voor een score c weer hoeveel procent van de scores
afwijkt van het rekenkundig gemiddelde. Als dat percentage groot is, dan is de
spreiding klein omdat er veel scores rond het gemiddelde liggen. Als dat
percentage klein is, dan is de spreiding groot omdat niet veel scores rond het
gemiddelde liggen.
OEFENING
Gevraagd: X f(X)
relatieve heterogeniteit 7 2
bereik 3 3
interkwartielbereik -5 1
standaardawfijking
Oplossing:
» relatieve heterogeniteit
h= 3 (1 − 0,5) 3 − 1 = 0, 75
» bereik: 12
» interkwartielbereik: 4 ( 𝑄 1 = 3 ; 𝑄 3 = 7)
» Standaardafwijking: 4 (rekenmachine)
Wanneer men een verdeling met één getal moet weergeven, kiest men meestal voor
een maat van centrale tendens (modus, mediaan, …). Twee verdelingen kunnen
echter eenzelfde centrale maat hebben, terwijl ze er helemaal anders uitzien.
Vb.: 10, 20, 30, 40, 50 met mediaan 30
ô
28, 29, 30, 31, 32 met mediaan 30
3.3.1 relatieve heterogeniteit
Relatieve heterogeniteit:
k (1 - pmodus )
h=
k -1
Met k gelijk aan het aantal klassen/ categorieën en de 𝑝 𝑚𝑜𝑑𝑢𝑠 gelijk aan de
relatieve frequentie van de modus/ modale klasse/ modale categorie. Deze maat
wordt enkel gebruikt bij kwantitatieve gegevens.
Er geldt: 𝟎 ≤ 𝐡 ≤ 𝟏 waarbij
0: volledige homogeniteit à alle gegevens zijn hetzelfde à 𝑝 𝑚𝑜𝑑𝑢𝑠 = 1
1: maximale relatieve heterogeniteit à 𝑝 𝑚𝑜𝑑𝑢𝑠 = 1 𝑛
Vb.: h= 5 (1 − 0,7) 5 − 1 = 0, 375 Studierichting Aantal afgestudeerden
Latijn-Grieks 70%
modus: Latijn-Grieks Latijn-Wiskunde 15%
𝑝 𝑚𝑜𝑑𝑢𝑠 : 0, 70 Latijn-Wetenschappen 8%
Wetenschappen A 5%
Wetenschappen B 2%
, 3.3.2 bereik, interkwartielbereik en semi-interkwartielbereik
Bereik: verschil tussen maximum en het minimum. Het bereik is extreem gevoelig
voor uitschieters.
𝑋 1 is de waarde van de allerlaagste X-waarde in de tabel.
𝑋 𝑛 is de waarde van de allerhoogste X-waarde in de tabel.
Interkwartielbereik: verschil tussen het derde en het eerste kwartiel. Dit is een
robuuste maat van spreiding bij kwantitatieve variabelen.
Semi-interkwartielbereik: de helft van het interkwartielbereik. Dit is ook een
robuuste maat van spreiding bij kwantitatieve variabelen.
3.3.3 variantie en standaardafwijking
Variantie 𝑺 𝑿 𝟐 en standaardafwijking 𝑺 𝒙 zijn de meest populaire maten van spreiding.
De standaardafwijking is voordeliger aangezien deze in de standaard meeteenheden
blijft staan. Men mag de eenheden ook niet vergeten: bij variantie zijn de eenheden
dus altijd tot de tweede macht.
Variantie 𝑺 𝑿 𝟐 : geeft weer hoeveel de scores van elkaar verschillen.
Standaardafwijking 𝑺 𝒙 : geeft weer hoeveel de scores afwijken van het
gemiddelde.
De standaardafwijking geeft voor een score c weer hoeveel procent van de scores
afwijkt van het rekenkundig gemiddelde. Als dat percentage groot is, dan is de
spreiding klein omdat er veel scores rond het gemiddelde liggen. Als dat
percentage klein is, dan is de spreiding groot omdat niet veel scores rond het
gemiddelde liggen.
OEFENING
Gevraagd: X f(X)
relatieve heterogeniteit 7 2
bereik 3 3
interkwartielbereik -5 1
standaardawfijking
Oplossing:
» relatieve heterogeniteit
h= 3 (1 − 0,5) 3 − 1 = 0, 75
» bereik: 12
» interkwartielbereik: 4 ( 𝑄 1 = 3 ; 𝑄 3 = 7)
» Standaardafwijking: 4 (rekenmachine)