H1: Gegevens meten, ordenen & weergeven
1. Soorten Data en Concepten
De keuze voor een grafiek of statistische analyse hangt af van het meetniveau
van de variabele.
Type Kenmerken Voorbeeld uit de slides
Categorische data, uniek en Naam beschuldigde,
Nomina
afgescheiden, geen rangorde. Soms Omschrijving misdaad,
al
dichotoom (twee waarden). Soort misdaad.
Sociale klassen
Geordend, met een hiërarchie. De
(Wereldlijke heren,
Ordinaal afstand tussen categorieën hoeft niet
Baronnen, Ridders,
even groot te zijn.
etc.).
Numerieke data, het interval of de
Interval afstand is altijd betekenisvol. Continue Leeftijd, Jaar proces.
schaal.
Numerieke data, nooit onder nul. De
ratio of verhouding tussen de data is Wolprijs per stone,
Ratio
belangrijk. Voorbeelden zijn Waarde gestolen goed.
opbrengsten en lonen.
De Datamatrix = algemene manier om data te ordenen.
Waarnemingseenheid (rij): Het object of individu dat bestudeerd wordt (bv.
Jan Sels).
Variabele (kolom): Het gemeten kenmerk (bv. Leeftijd).
Waarde (cel): De specifieke meting (bv. 15).
De organisatie is relatief en wordt bepaald door de onderzoeksvraag.
2. Gegevens Ordenen en Weergeven
Frequentie: Hoeveelheid of aantal keer dat een waarde voorkomt.
Frequentietabel: Tabel van de frequentie waarmee een specifieke variabele
voorkomt
1
,Soorten Frequentietabellen
1. Simpele (Ongegroepeerde) Frequentietabel: Toont de absolute en relatieve
frequenties van elke afzonderlijke waarde.
2. Gegroepeerde Frequentietabel: Groepeert numerieke waarden in klassen
o Nadeel: verlies van detail, de exacte individuele waarde is niet meer
te achterhalen.
3. Cumulatieve Frequentietabel: Toont cumulatieve frequenties. Ideaal om het
aandeel van het totaal in een hiërarchische variant weer te geven.
Grafieken
Type
Definitie / Kenmerken Geschikt voor
Grafiek
Grafiek die met horizontale of verticale
Staafdiagr Nominale en ordinale
staven de waarden of frequenties van
am data.
een variabele weergeeft.
Wordt gebruikt voor numerieke Numerieke
Lijngrafiek variabelen. Ideaal om een variabele af variabelen,
te zetten tegenover de tijd. tijdreeksanalyse.
Zeer eenvoudige grafiek met slechts
Taartdiagr Nominale en ordinale
één variabele. Ideaal om het aandeel
am variabelen.
van het totaal weer te geven
De Logaritmische Schaal (Semi-logaritmische grafiek)
De Y-as is uitgedrukt in een logaritmische schaal.
Toont de snelheid van verandering (relatieve verandering) in plaats van de
exacte verandering (absolute verandering).
Werking: Afstand 1-10 is even groot als 10-100.
2
, H2: Verdeling, centrale tendentie & spreiding
1. Maatstaven van Centrale Tendentie (Zwaartepunt)
Invloe
Geschikt d van
voor Extre
Maatstaf Definitie Excel Formule (Engels)
(Meetniv me
eau) Waard
en
De meest
voorkomen
de waarde
Nominale
uit een
en =MODE.SNGL(gegeven
Modus reeks Laag.
ordinale s)
waarnemin
data.
gen. Kan
multimodaa
l zijn.
De
middelste Ordinale
waarnemin en
Mediaan Laag. =MEDIAN(gegevens)
g in een numeriek
geordende e data.
reeks
De som van
alle
Alleen
waarden
numeriek
Gemidde gedeeld Zeer hoog (gevoelig
e
lde door het voor uitschieters).
variabele
aantal
n.
waarnemin
gen.
Trimmed Gemiddelde Numerie Lager =TRIMMEAN(gegevens;
Mean waarbij een ke data. dan percentage)
percentage het
van de gewo
hoogste en ne
laagste gemid
3
1. Soorten Data en Concepten
De keuze voor een grafiek of statistische analyse hangt af van het meetniveau
van de variabele.
Type Kenmerken Voorbeeld uit de slides
Categorische data, uniek en Naam beschuldigde,
Nomina
afgescheiden, geen rangorde. Soms Omschrijving misdaad,
al
dichotoom (twee waarden). Soort misdaad.
Sociale klassen
Geordend, met een hiërarchie. De
(Wereldlijke heren,
Ordinaal afstand tussen categorieën hoeft niet
Baronnen, Ridders,
even groot te zijn.
etc.).
Numerieke data, het interval of de
Interval afstand is altijd betekenisvol. Continue Leeftijd, Jaar proces.
schaal.
Numerieke data, nooit onder nul. De
ratio of verhouding tussen de data is Wolprijs per stone,
Ratio
belangrijk. Voorbeelden zijn Waarde gestolen goed.
opbrengsten en lonen.
De Datamatrix = algemene manier om data te ordenen.
Waarnemingseenheid (rij): Het object of individu dat bestudeerd wordt (bv.
Jan Sels).
Variabele (kolom): Het gemeten kenmerk (bv. Leeftijd).
Waarde (cel): De specifieke meting (bv. 15).
De organisatie is relatief en wordt bepaald door de onderzoeksvraag.
2. Gegevens Ordenen en Weergeven
Frequentie: Hoeveelheid of aantal keer dat een waarde voorkomt.
Frequentietabel: Tabel van de frequentie waarmee een specifieke variabele
voorkomt
1
,Soorten Frequentietabellen
1. Simpele (Ongegroepeerde) Frequentietabel: Toont de absolute en relatieve
frequenties van elke afzonderlijke waarde.
2. Gegroepeerde Frequentietabel: Groepeert numerieke waarden in klassen
o Nadeel: verlies van detail, de exacte individuele waarde is niet meer
te achterhalen.
3. Cumulatieve Frequentietabel: Toont cumulatieve frequenties. Ideaal om het
aandeel van het totaal in een hiërarchische variant weer te geven.
Grafieken
Type
Definitie / Kenmerken Geschikt voor
Grafiek
Grafiek die met horizontale of verticale
Staafdiagr Nominale en ordinale
staven de waarden of frequenties van
am data.
een variabele weergeeft.
Wordt gebruikt voor numerieke Numerieke
Lijngrafiek variabelen. Ideaal om een variabele af variabelen,
te zetten tegenover de tijd. tijdreeksanalyse.
Zeer eenvoudige grafiek met slechts
Taartdiagr Nominale en ordinale
één variabele. Ideaal om het aandeel
am variabelen.
van het totaal weer te geven
De Logaritmische Schaal (Semi-logaritmische grafiek)
De Y-as is uitgedrukt in een logaritmische schaal.
Toont de snelheid van verandering (relatieve verandering) in plaats van de
exacte verandering (absolute verandering).
Werking: Afstand 1-10 is even groot als 10-100.
2
, H2: Verdeling, centrale tendentie & spreiding
1. Maatstaven van Centrale Tendentie (Zwaartepunt)
Invloe
Geschikt d van
voor Extre
Maatstaf Definitie Excel Formule (Engels)
(Meetniv me
eau) Waard
en
De meest
voorkomen
de waarde
Nominale
uit een
en =MODE.SNGL(gegeven
Modus reeks Laag.
ordinale s)
waarnemin
data.
gen. Kan
multimodaa
l zijn.
De
middelste Ordinale
waarnemin en
Mediaan Laag. =MEDIAN(gegevens)
g in een numeriek
geordende e data.
reeks
De som van
alle
Alleen
waarden
numeriek
Gemidde gedeeld Zeer hoog (gevoelig
e
lde door het voor uitschieters).
variabele
aantal
n.
waarnemin
gen.
Trimmed Gemiddelde Numerie Lager =TRIMMEAN(gegevens;
Mean waarbij een ke data. dan percentage)
percentage het
van de gewo
hoogste en ne
laagste gemid
3