1.1 DATA
Cases
o Individuele objecten binnen een dataset.
Variabele
o Een kenmerk van een case
Waardes
o Verschillende cases kunnen verschillende waardes hebben.
Label
o Een beschrijvende tag of categorie die wordt toegepast op gegevens om ze te identificeren,
te organiseren of te classificeren.
Categorische variabele
o Een type variabele die waarden vertegenwoordigt die in discrete categorieën of groepen
vallen, zoals geslacht en oogkleur.
Kwantitatieve variabele
o Een type die numerieke waarden aanneemt en meetbare hoeveelheden vertegenwoordigt.
De hoofdkenmerken van een dataset beantwoorden de vragen Wie? Wat? en Waarom?
1.2 DISPLAYING DISTRIBUTIONS WITH GRAPHS
Distributie
o De manier waarop de waarden van een variabele verdeeld zijn over een bepaalde populatie
of steekproef.
Exploratory Data Analysis / Verkennende data-analyse
o Een cruciale fase in het proces van gegevensanalyse waarbij onderzoekers de kenmerken en
patronen van de gegevens verkennen om inzicht te krijgen in hun structuur, distributie en
onderlinge relaties.
o Het hoofddoel hiervan is om hypotheses te genereren, belangrijke variabelen te identificeren
en de data beter te begrijpen voordat meer geavanceerde statistische technieken worden
toegepast.
o Voorbeelden: Grafieken zoals histogrammen en scatterplots
Hoe verkennende data-analyse uitvoeren?
1. Examineer elke variabele onafhankelijk. Vervolgens examineer de relatie tussen de
variabele.
2. Begin met een grafiek of grafieken. Voeg vervolgens numerische samenvattingen van de
verschillende aspecten van de data.
Predictive Analysis / Voorspellende Analyse
o Het gebruik van een beschrijving van de waarden van de variabelen in een dataset om iets in
de toekomst te voorspellen.
Categorische variabelen
o Kenmerken die in discrete categorieën vallen, zoals geslacht of opleidingsniveau.
o Staafdiagrammen of cirkeldiagrammen
o Geeft het aantal gevallen of het percentage weer van de cases die in een bepaalde categorie
vallen. Alternatief op de percentage is de proportie (gevallen in de categorie / totale
gevallen) percentage is de proportie x 100.