Concepts of Data & Analytics
1 Quick Tour
1.1 What is this all about
AI-systeem
= system that performs a task that implies some intelligence or complexity
= optimaliseren van taken we gebruiken regels om betere beslissingen te gaan nemen ≠ software
systeem
Machine learning
= AI gebruiken om AI te leren
= Derive rules from example data to get something done
Training
= we geven voorbeeld data aan onze software & de software komt met een model (voorbeeld om
input data om te zetten naar output data)
Deployment
= apply model on new data
= er word teen software gemaakt & mijn software geeft het resultaat
! Machine learning does not only learn from example data, it allows for far more complex models !
Blackbox modellen = we begrijpen zelf de uitkomst niet meer
Welke problemen kan je oplossen met machine learning?
Value estimation / regression = waarde voorspellen bv. Verkoop
Classification = categorische variabele voorspellen bv. Diagnose
Segmentation / clustering = observaties splitsen of groeperen bv. Customer segmentation
Co-occurrence / association rule discovery = welke gebeurtenissen gebeuren samen?
Data mining
= het ontdekken van onbekende patronen in een datacollectie
Machine learning is 1 van de manieren om aan data mining te doen.
Data analytics
= iets doen met die data, systeem bouwen rond die gegevens
Descriptive = gaan beschrijven
Exploratory = berekenen van correlaties / verbanden
Confirmtory = vermoeden van verbanden & dit checken
Predictive = voorspellen van data (machine learning)
Prescriptive = wat moeten we gaan doen om betere resultaten te hebben?
Big data
= massieve integratie van heel veel verschillende soorten data om iets te gaan doen
Data science
= science about extracting knowledge and actionable insights
AI, Machine learning, (Big) data analytics
Robotics niet (aansturen wel)
1
, 1.2 What to do with it
Find and validate patterns, links, relations in data
Why?
Understand events
Predict events
What are the 3 ways to create value from data analytics?
Cost reduction
Faster, better, decision making
New products & services
2 The field of data analytics
2.1 The evolution of AI and the field of data analytics
Descriptive analysis
= beschrijven en samenvatten van gegevens
Beschrijvende statistieken die de verdeling beschrijven (min, max, gem, mediaan, variantie,
standaardafwijking, kwantielen, scheefheid, …)
Meer gedetailleerde informatie over de verdeling: histogram, verdeling functie in kaart
brengen
Exploratory analysis
= verken gegevens om nuttige inzichten te vinden
Trends
Correlaties tussen twee variabelen
Correlaties tussen meer dan twee variabelen
Confirmatory analysis
= bevestiging van veronderstelde verbanden in gegevens met behulp van statistische technieken
Modeltoetsing (controleren of gegevens in een verondersteld model passen)
Vergelijking van variantie voor categorische gegevens
Predictive analytics
= een model afleiden uit gegevens met behulp van machine learning
Clustering (zonder toezicht)
Ontginning van associatieregels (zonder toezicht)
Regressie (gecontroleerd)
Classificatie (gecontroleerd)
Prescriptive analytics
= acties afleiden om te profiteren van de voorspellingen en de implicaties van dergelijke acties:
Wat zal er gebeuren
Wanneer gebeurt het
Waarom gebeurt het
2
1 Quick Tour
1.1 What is this all about
AI-systeem
= system that performs a task that implies some intelligence or complexity
= optimaliseren van taken we gebruiken regels om betere beslissingen te gaan nemen ≠ software
systeem
Machine learning
= AI gebruiken om AI te leren
= Derive rules from example data to get something done
Training
= we geven voorbeeld data aan onze software & de software komt met een model (voorbeeld om
input data om te zetten naar output data)
Deployment
= apply model on new data
= er word teen software gemaakt & mijn software geeft het resultaat
! Machine learning does not only learn from example data, it allows for far more complex models !
Blackbox modellen = we begrijpen zelf de uitkomst niet meer
Welke problemen kan je oplossen met machine learning?
Value estimation / regression = waarde voorspellen bv. Verkoop
Classification = categorische variabele voorspellen bv. Diagnose
Segmentation / clustering = observaties splitsen of groeperen bv. Customer segmentation
Co-occurrence / association rule discovery = welke gebeurtenissen gebeuren samen?
Data mining
= het ontdekken van onbekende patronen in een datacollectie
Machine learning is 1 van de manieren om aan data mining te doen.
Data analytics
= iets doen met die data, systeem bouwen rond die gegevens
Descriptive = gaan beschrijven
Exploratory = berekenen van correlaties / verbanden
Confirmtory = vermoeden van verbanden & dit checken
Predictive = voorspellen van data (machine learning)
Prescriptive = wat moeten we gaan doen om betere resultaten te hebben?
Big data
= massieve integratie van heel veel verschillende soorten data om iets te gaan doen
Data science
= science about extracting knowledge and actionable insights
AI, Machine learning, (Big) data analytics
Robotics niet (aansturen wel)
1
, 1.2 What to do with it
Find and validate patterns, links, relations in data
Why?
Understand events
Predict events
What are the 3 ways to create value from data analytics?
Cost reduction
Faster, better, decision making
New products & services
2 The field of data analytics
2.1 The evolution of AI and the field of data analytics
Descriptive analysis
= beschrijven en samenvatten van gegevens
Beschrijvende statistieken die de verdeling beschrijven (min, max, gem, mediaan, variantie,
standaardafwijking, kwantielen, scheefheid, …)
Meer gedetailleerde informatie over de verdeling: histogram, verdeling functie in kaart
brengen
Exploratory analysis
= verken gegevens om nuttige inzichten te vinden
Trends
Correlaties tussen twee variabelen
Correlaties tussen meer dan twee variabelen
Confirmatory analysis
= bevestiging van veronderstelde verbanden in gegevens met behulp van statistische technieken
Modeltoetsing (controleren of gegevens in een verondersteld model passen)
Vergelijking van variantie voor categorische gegevens
Predictive analytics
= een model afleiden uit gegevens met behulp van machine learning
Clustering (zonder toezicht)
Ontginning van associatieregels (zonder toezicht)
Regressie (gecontroleerd)
Classificatie (gecontroleerd)
Prescriptive analytics
= acties afleiden om te profiteren van de voorspellingen en de implicaties van dergelijke acties:
Wat zal er gebeuren
Wanneer gebeurt het
Waarom gebeurt het
2