1. Exploration
Histogram
Boxplot
→ punten erbuiten zijn uitschieters, zijn opvallend verschillend
→ 50% van data in doos (oranje) Q3 = 25% en Q1 = 25%
verdeling box → zegt symmetrisch of asymmetrisch
Time series
→ uitzetting van tijd→ hoe evolutie in tijd
Scatterplots
→ uitzetting van punten is handig om eventuele verbanden te zien
( eerste = lineair verband, tweede = kwadratisch, exponentieel verband)
, Spatial
→ groote bolletje→ hoe vaak voorkomt
→ kleuren → hoeveel punten
→ bv voetbal wereld → geeft bv info voor verdediging
2. KNN Classification
voronoi diagram tussen alle punten middelloodlijn
valt punt binnen bepaald vak dan is die het meest aansluitend bij dat punt
→ bv: nationaliteiten belg, italiaan
KNN =k-nearest-neighbor classification
meest nabije buren
Histogram
Boxplot
→ punten erbuiten zijn uitschieters, zijn opvallend verschillend
→ 50% van data in doos (oranje) Q3 = 25% en Q1 = 25%
verdeling box → zegt symmetrisch of asymmetrisch
Time series
→ uitzetting van tijd→ hoe evolutie in tijd
Scatterplots
→ uitzetting van punten is handig om eventuele verbanden te zien
( eerste = lineair verband, tweede = kwadratisch, exponentieel verband)
, Spatial
→ groote bolletje→ hoe vaak voorkomt
→ kleuren → hoeveel punten
→ bv voetbal wereld → geeft bv info voor verdediging
2. KNN Classification
voronoi diagram tussen alle punten middelloodlijn
valt punt binnen bepaald vak dan is die het meest aansluitend bij dat punt
→ bv: nationaliteiten belg, italiaan
KNN =k-nearest-neighbor classification
meest nabije buren