visualiseren van data : figuren en
tabellen
data verkennen
● exploratorische data-analyse : proces waarbij statistische technieken en
hulpmiddelen worden gebruikt om data te onderzoeken en de kenmerken ervan na te
gaan
1. elke variabele apart onderzoeken (gem, med, uitschieters, spreiding, ..)
2. gebruik vn grafieken
3. karakteristieke maten en cijfermatige beschrijvingen
4. verband tussen variabelen
data-matrix :
variabelen (m) (geslacht, leeftijd, score, ..)
analyse-eenheid (n)
(personen, objecten, …)
→ cellen = meetwaarden : bevat de waarde van één variabele voor één persoon
● ruwe data : zoals origineel verzameld
↓
● verzameltabel : ruwe data netjes onder elkaar
↓
● data-matrix : kan gebruikt worden voor analyse
→ gebeurd door coderen : tekst omzetten in cijfers
(vb man : 1, vrouw : 2)
vb datamatrix met 1 variabele → wordt een kolom (vb één vraag in een enquête)
Hans Rosling : toont hoe data verkennen inzicht brengt en hoe anders misvattingen kunnen
ontstaan
, tabellen
● verzameltabel / datafile : ruwe meetwaarden, alle individuele antwoorden per
persoon
● samenvattende tabel : ruwe data samenvatten om sneller inzicht te krijgen
(groeperen of optellen)
● frequentietabel (soort samenvattende tabel) :
○ absolute frequentie (F) : hoe vaak een waarde voorkomt
○ relatieve frequentie (f) : welk percentage deze frequentie inhoud
○ cumulatieve frequentie (C) : optelling tot en met een bepaalde waarde
○ relatieve cumulatieve frequentie (c) : opgetelde percentage
grafische voorstelling van een verdeling
→ verdeling van een variabele : geeft weer welke waarden die variabele aanneemt en hoe
vaak die waarden voorkomen
↳ welke verdeling wordt bepaald :
● in functie van de aard van de variabele
● de ‘leesbaarheid’
grafieken voor kwalitatieve variabelen (categorisch)
→ gebaseerd op ‘gewone’ frequentietabel
● staafdiagram (barplot) : grafiek met losse staven (bijna lijnen)
waarbij elke staaf een categorie voorstelt
○ hoogte van de staven = frequentie of percentage (is gelijk)
○ staven staan los van elkaar : om aan te duiden dat er geen
continuüm, verband of verbondenheid is (kwalitatieve variabelen)
○ wordt gebruikt op nominaal niveau of op ordinaal niveau
(indien op volgorde)
→ nadruk ligt op vergelijking
● strookdiagram (wisselbaar met staafdiagram) : horizontale staafdiagram
○ gestapelde strook-/staafdiagram :
strook-/staafdiagram waarbij elke staaf wordt opgedeeld in meerdere
segmenten. Elk segment stelt een deelcategorie voor, en samen
vormen ze de totale waarde van die categorie.
→ de volledige lengte/hoogte van de staaf toont de totale waarde, de
segmenten binnen de staaf tonen hoe dat totaal is opgebouwd
● kolomdiagram : bredere staven dan staafdiagram
→ nadruk ligt op categorieën
● taartdiagram : cirkel wordt opgedeeld in verschillende stukken die elks een
categorie voorstellen
tabellen
data verkennen
● exploratorische data-analyse : proces waarbij statistische technieken en
hulpmiddelen worden gebruikt om data te onderzoeken en de kenmerken ervan na te
gaan
1. elke variabele apart onderzoeken (gem, med, uitschieters, spreiding, ..)
2. gebruik vn grafieken
3. karakteristieke maten en cijfermatige beschrijvingen
4. verband tussen variabelen
data-matrix :
variabelen (m) (geslacht, leeftijd, score, ..)
analyse-eenheid (n)
(personen, objecten, …)
→ cellen = meetwaarden : bevat de waarde van één variabele voor één persoon
● ruwe data : zoals origineel verzameld
↓
● verzameltabel : ruwe data netjes onder elkaar
↓
● data-matrix : kan gebruikt worden voor analyse
→ gebeurd door coderen : tekst omzetten in cijfers
(vb man : 1, vrouw : 2)
vb datamatrix met 1 variabele → wordt een kolom (vb één vraag in een enquête)
Hans Rosling : toont hoe data verkennen inzicht brengt en hoe anders misvattingen kunnen
ontstaan
, tabellen
● verzameltabel / datafile : ruwe meetwaarden, alle individuele antwoorden per
persoon
● samenvattende tabel : ruwe data samenvatten om sneller inzicht te krijgen
(groeperen of optellen)
● frequentietabel (soort samenvattende tabel) :
○ absolute frequentie (F) : hoe vaak een waarde voorkomt
○ relatieve frequentie (f) : welk percentage deze frequentie inhoud
○ cumulatieve frequentie (C) : optelling tot en met een bepaalde waarde
○ relatieve cumulatieve frequentie (c) : opgetelde percentage
grafische voorstelling van een verdeling
→ verdeling van een variabele : geeft weer welke waarden die variabele aanneemt en hoe
vaak die waarden voorkomen
↳ welke verdeling wordt bepaald :
● in functie van de aard van de variabele
● de ‘leesbaarheid’
grafieken voor kwalitatieve variabelen (categorisch)
→ gebaseerd op ‘gewone’ frequentietabel
● staafdiagram (barplot) : grafiek met losse staven (bijna lijnen)
waarbij elke staaf een categorie voorstelt
○ hoogte van de staven = frequentie of percentage (is gelijk)
○ staven staan los van elkaar : om aan te duiden dat er geen
continuüm, verband of verbondenheid is (kwalitatieve variabelen)
○ wordt gebruikt op nominaal niveau of op ordinaal niveau
(indien op volgorde)
→ nadruk ligt op vergelijking
● strookdiagram (wisselbaar met staafdiagram) : horizontale staafdiagram
○ gestapelde strook-/staafdiagram :
strook-/staafdiagram waarbij elke staaf wordt opgedeeld in meerdere
segmenten. Elk segment stelt een deelcategorie voor, en samen
vormen ze de totale waarde van die categorie.
→ de volledige lengte/hoogte van de staaf toont de totale waarde, de
segmenten binnen de staaf tonen hoe dat totaal is opgebouwd
● kolomdiagram : bredere staven dan staafdiagram
→ nadruk ligt op categorieën
● taartdiagram : cirkel wordt opgedeeld in verschillende stukken die elks een
categorie voorstellen