Hoofdstuk 1: Beschrijvende
statistiek
Beschrijvende statstei is het beschrijven van de gegevensverzameling vanuit de steekproef. Het
wordt gebruiit bij exploratieve data-anaalsse waarbij elie variabele individueel verient wordt. Je
werit eerst GRAFISCH (visueel), dana NUMERIEK (data-reducte).
Weergeven van verdelingen met GRAFIEKEN
Grafieken voor kaalitatieve variaeelen
Kwalitateve variabelen zijn categorische variabelen. Je iunt niets doen met woorden, daarom
worden ze in aantallen weergegeven (liefst in % (duidelijier)) . Ze iunnen worden weergegeven in
een staafdiagram of taartdiagram .
Grafieken voor kaantitatieve variaeelen
Geef de variate binnen verzameling van getallen weer. Een variatiepatroon van iwanttateve
variabelen is een verdelinag van de variabelen. Hierbij wordt er gebruiigemaait van
- Frequentetabel
- Grafische voorstelling
Stamdiagram: geef de vorm van de verdeling weer
Voorbeeld: Aantal doelpunten per seizoen van 10 ploegen
In de STAM iolom worden alle 1e getallen
weergegeven. In de BLAD iolom worden eniel
de laatste getallen weergegeven van ilein naar
groot.
Je ian ooi een rug-aan-rug stamdiagram maien waarbij 2 verdelingen met eliaar
worden vergeleien.
Eigenschappen:
Niet geschiit voor grote groepen of veel observates.
Histogrammena: Aantal (frequente) of % waarnemingen in eli interval.
De data wordt hierbij eerst verdeeld in ilassen van gelijke breedte. De ieuze van het
aantal ilassen is belangriji: Te weinig zorgt voor allemaal hoge bloiien in je histogram,
te veel zorgt voor het omgeieerde. In tegenstelling tot de staafdiagram worden er hier
geena ruimtes gelaten tussen de verschillende staafes.
Onderzoeien van verdelingen
Een iiji in de grafische voorstellingen zorgt voor een zicht op het globale patroon en
opvallende afwijiingen.
Eigenschappen verdelingen
De cenatrum van de verdeling wordt door de MEDIAAN (M) of het GEMIDDELDE ( x́ )
aangeduid.
De spreidinag is de RANGE tussen het minimum en maximum. Het is de spreiding
t.o.v. de centrummaat. Het geef aan in welie mate de data verspreid is van het
gemiddelde/mediaan. De modus is de score die het meest frequent vooriomt en
dus ooi de top van de grafiei is. (een top of verschillende is uni- of multmodaal)
De vorm van de verdeling ian scheef of symmetrisch zijn.
1
, De uitbijters zijn afwijiingen van de algemene vorm. Deze ian langs de minimum of
maximum iant vooriomen. Soms hebben ze een beteienis en mogen ze dan NIET
weggelaten worden (M gebruiken), indien ze een fout voorstellen en dus geen
beteienis hebben mogen ze WEL weggelaten worden ( x́ gebruiken). De uitbijters
hebben een invloed op het gemiddelde!
Tijdreeksgrafiekena: lijndiagrammen
Hierbij worden gegevens uitgezet tegen tjd of volgorde, waarbij de tijd altjd op de
horizonatale as wordt voorgesteld:
Verdelingen numeriek eeschrijven
Herhaling: Eerst iijien we naar de vorm van de verdeling op een GRAFISCHE manier. Deze geef ons
eniel een idee “OP HET ZICHT” en dus geen exacte gegevens. Vervolgens is er de NUMERIEK
beschrijving, met de cenatrum en spreidinag die wordt bereiend voor geliji welie iwanttateve
variabele.
Meten van het centrum: Gemiddelde en Mediaan
Rekenkundig gemiddelde of gemiddelde
Het gemiddelde bereienen doen we door alle waarnemingen op te tellen en deze te delen door het
1
n ∑ 1
aantal waarnemingen: x́ = . x . Het gemiddelde is GEEN resistente maat!
Mediaan
De mediaan is de middelste waarneming in geordende lijst. Bij een oneven lijst neem je het
middelste, bij een even lijst neem je het gemiddelde van de twee middelste. Om de posite van M te
(n+1)
vinden: . De mediaan is gemaiieliji af te lezen uit een STAMdiagram en is WEL een resistente
2
centrummaat.
Gemiddelde vs. Mediaan
Bij een ssmmetrische verdeling is het gemiddelde geliji aan de mediaan. Naarmate de verdelingen
schever worden, gaan de gemiddelde en mediaan verder uit eliaar liggen.
- Uitbijters corrigeren of weglaten x́
- Uitbijters erin laten M
Meten van spreiding: Kaartielen (M)
Kaartielen
Kwartelen worden gebruiit bij het beschrijven een verdeling: Centrummaat en spreidingsmaat. Een
spreidinagsmaat gaat de variabiliteit1 van een verdeling uitdruiien. De spreidinag is het verschil tussen
het maximum en het minimum. Resultaten iunnen een gelijie M en x́ hebben, maar een
verschillende spreiding.
1
Variabiliteit = spreiding
2
statistiek
Beschrijvende statstei is het beschrijven van de gegevensverzameling vanuit de steekproef. Het
wordt gebruiit bij exploratieve data-anaalsse waarbij elie variabele individueel verient wordt. Je
werit eerst GRAFISCH (visueel), dana NUMERIEK (data-reducte).
Weergeven van verdelingen met GRAFIEKEN
Grafieken voor kaalitatieve variaeelen
Kwalitateve variabelen zijn categorische variabelen. Je iunt niets doen met woorden, daarom
worden ze in aantallen weergegeven (liefst in % (duidelijier)) . Ze iunnen worden weergegeven in
een staafdiagram of taartdiagram .
Grafieken voor kaantitatieve variaeelen
Geef de variate binnen verzameling van getallen weer. Een variatiepatroon van iwanttateve
variabelen is een verdelinag van de variabelen. Hierbij wordt er gebruiigemaait van
- Frequentetabel
- Grafische voorstelling
Stamdiagram: geef de vorm van de verdeling weer
Voorbeeld: Aantal doelpunten per seizoen van 10 ploegen
In de STAM iolom worden alle 1e getallen
weergegeven. In de BLAD iolom worden eniel
de laatste getallen weergegeven van ilein naar
groot.
Je ian ooi een rug-aan-rug stamdiagram maien waarbij 2 verdelingen met eliaar
worden vergeleien.
Eigenschappen:
Niet geschiit voor grote groepen of veel observates.
Histogrammena: Aantal (frequente) of % waarnemingen in eli interval.
De data wordt hierbij eerst verdeeld in ilassen van gelijke breedte. De ieuze van het
aantal ilassen is belangriji: Te weinig zorgt voor allemaal hoge bloiien in je histogram,
te veel zorgt voor het omgeieerde. In tegenstelling tot de staafdiagram worden er hier
geena ruimtes gelaten tussen de verschillende staafes.
Onderzoeien van verdelingen
Een iiji in de grafische voorstellingen zorgt voor een zicht op het globale patroon en
opvallende afwijiingen.
Eigenschappen verdelingen
De cenatrum van de verdeling wordt door de MEDIAAN (M) of het GEMIDDELDE ( x́ )
aangeduid.
De spreidinag is de RANGE tussen het minimum en maximum. Het is de spreiding
t.o.v. de centrummaat. Het geef aan in welie mate de data verspreid is van het
gemiddelde/mediaan. De modus is de score die het meest frequent vooriomt en
dus ooi de top van de grafiei is. (een top of verschillende is uni- of multmodaal)
De vorm van de verdeling ian scheef of symmetrisch zijn.
1
, De uitbijters zijn afwijiingen van de algemene vorm. Deze ian langs de minimum of
maximum iant vooriomen. Soms hebben ze een beteienis en mogen ze dan NIET
weggelaten worden (M gebruiken), indien ze een fout voorstellen en dus geen
beteienis hebben mogen ze WEL weggelaten worden ( x́ gebruiken). De uitbijters
hebben een invloed op het gemiddelde!
Tijdreeksgrafiekena: lijndiagrammen
Hierbij worden gegevens uitgezet tegen tjd of volgorde, waarbij de tijd altjd op de
horizonatale as wordt voorgesteld:
Verdelingen numeriek eeschrijven
Herhaling: Eerst iijien we naar de vorm van de verdeling op een GRAFISCHE manier. Deze geef ons
eniel een idee “OP HET ZICHT” en dus geen exacte gegevens. Vervolgens is er de NUMERIEK
beschrijving, met de cenatrum en spreidinag die wordt bereiend voor geliji welie iwanttateve
variabele.
Meten van het centrum: Gemiddelde en Mediaan
Rekenkundig gemiddelde of gemiddelde
Het gemiddelde bereienen doen we door alle waarnemingen op te tellen en deze te delen door het
1
n ∑ 1
aantal waarnemingen: x́ = . x . Het gemiddelde is GEEN resistente maat!
Mediaan
De mediaan is de middelste waarneming in geordende lijst. Bij een oneven lijst neem je het
middelste, bij een even lijst neem je het gemiddelde van de twee middelste. Om de posite van M te
(n+1)
vinden: . De mediaan is gemaiieliji af te lezen uit een STAMdiagram en is WEL een resistente
2
centrummaat.
Gemiddelde vs. Mediaan
Bij een ssmmetrische verdeling is het gemiddelde geliji aan de mediaan. Naarmate de verdelingen
schever worden, gaan de gemiddelde en mediaan verder uit eliaar liggen.
- Uitbijters corrigeren of weglaten x́
- Uitbijters erin laten M
Meten van spreiding: Kaartielen (M)
Kaartielen
Kwartelen worden gebruiit bij het beschrijven een verdeling: Centrummaat en spreidingsmaat. Een
spreidinagsmaat gaat de variabiliteit1 van een verdeling uitdruiien. De spreidinag is het verschil tussen
het maximum en het minimum. Resultaten iunnen een gelijie M en x́ hebben, maar een
verschillende spreiding.
1
Variabiliteit = spreiding
2