Python for Machine Learning
Lecture 1: Intro to machine learning
What is…
Key concepts/Terms
Data science
• het proces waarbij inzichten en kennis uit gegevens worden gehaald met behulp van
technieken uit de statistiek, informatica en domeinexpertise
• de breedste van de termen
• Gebruikt door mensen met een achtergrond in
-> Statistics, computer science, mathematics, economics, engineering, or business analytics
(So everyone, essentially)
Data analytics
• het proces van het onderzoeken, opschonen, transformeren en modelleren van gegevens om
bruikbare informatie te ontdekken en besluitvorming te ondersteunen....
• de meest handmatige van de ‘datawetenschappen’
• Gebruikt door mensen met een achtergrond in...
-> Business, economics, marketing, finance, or statistics
Data mining
• het proces waarbij patronen, verbanden of afwijkingen in grote datasets worden ontdekt met
behulp van statistische en computationele methoden....
• de oudste van de ‘datawetenschappen’
• Gebruikt door mensen met een achtergrond in...
-> Business intelligence, marketing, statistics, or computer science
Machine learning
• het proces van het bouwen van algoritmen die kunnen leren van gegevens en voorspellingen
of beslissingen kunnen nemen zonder expliciet te zijn geprogrammeerd....
• de hoogste waarde van de “datawetenschappen” (naar mijn persoonlijke mening)
• Gebruikt door mensen met een achtergrond in...
-> Computer science, data science, (digital business) engineering, mathematics, or physics
1
,Artificial intelligence
• de kunst van het creëren van systemen die specifieke taken kunnen uitvoeren waarvoor
doorgaans menselijke intelligentie vereist is, zoals redeneren, leren en waarnemen....
• de hipste van de ‘datawetenschappen’
• Gebruikt door mensen met een achtergrond in...
-> Computer science, robotics, cognitive science, or philosophy of mind
Artificial (general)intelligence is…
• de zoektocht naar een theoretische vorm van AI die elke intellectuele taak kan uitvoeren die
een mens kan uitvoeren, met algemene redeneervaardigheden en leervermogen op
verschillende gebieden
-> het is een theoretische vorm want deze bestaat nog niet
• de absoluut hipste van de ‘datawetenschappen’
• Meest gebruikt door...
-> Sam Altman, Ilya Sutskever, and other AI prophets
Big data
• extreem grote en complexe datasets die geavanceerde tools en infrastructuur vereisen om op
te slaan, te verwerken en te analyseren
• een ietwat verouderde term in 2025
-> Deze term was vooral belangrijk van 2000-2010, nu is die al ouder want bijna alles is big
data
• Gebruikt door mensen met een achtergrond in…
-> Computer science, information systems, cloud computing, or data engineering
Data engineering
• een discipline voor het ontwerpen en bouwen van systemen voor het efficiënt en
betrouwbaar verzamelen, opslaan en verwerken van (grote hoeveelheden) data
• onderschat, maar naar mijn ervaring de belangrijkste reden waarom
datawetenschapsprojecten slagen of mislukken
• Gebruikt door mensen met een achtergrond in…
-> Software engineering, computer science, or information technology
Machine learning engineering
• het implementeren, inzetten en onderhouden van machine learning-modellen in
productieomgevingen....
• een van de moeilijkste dingen om goed te doen, naar mijn ervaring
-> Bv in en rond covid faalde alle modellen omdat dat een situatie was dat we nog nooit
eerder hadden meegemaakt
• Gebruikt door mensen met een achtergrond in...
-> Computer science, software engineering, or applied mathematics
2
,Data governance
• een reeks beleidsregels, processen en normen die ervoor zorgen dat gegevens nauwkeurig en
veilig zijn en op verantwoorde wijze worden gebruikt binnen een organisatie.
• het meest over het hoofd geziene aspect van datawetenschap
• Gebruikt door mensen met een achtergrond in…
-> Information systems, law, business administration, or data management
Voorbeeld:
Hebben enorm veel geld betaald om hun data terug te krijgen
Enkele oefeningen rond deze termen:
Exercise 1: Airport Retail
Scenario:
Brussels Airport wants to investigate how many passengers make use of their airport shops and
generate ideas for how that number can be increased.
Question:
Which concept(s) best apply here?
Data analytics: management bekijkt de data en neemt op basis van de resultaten een beslissing
Data mining kan eventueel ook wel
Exercise 2: E-Commerce
Scenario:
An e-commerce company wants to build a system that recommends products to users based on their
browsing and purchase history.
Question:
Which concept(s) best apply here?
Machine learning: build a recommendersystem
-> Om aankoopgeschiedenis te zien en op basis daarvan te kijken wat ze moeten aanbieden
Exercise 3: Customer Service
Scenario:
A telecom provider wants to develop a chatbot that can understand and respond to customer
questions in natural language.
Question:
Which concept(s) best apply here?
AI: want dit is human intelligence
Data governance is heel belangrijk hier: omdat er veel mensendie chatbots misbruiken
3
, Exercise 4: Streaming
Scenario:
A streaming platform is struggling to manage and process the massive volume of user data generated
every day.
Question:
Which concept(s) best apply here?
Big data: large en difficult data
Data engineering: nodig voor big data
Exercise 5: Health Care
Scenario:
A healthcare company wants to use their data to optimize patient care while ensuring that patient
data is handled securely and complies with GDPR regulations.
Question:
Which concept(s) best apply here?
Data governance: we moeten die veilig managen in health care, heel belangrijk
Data analytics/ machine learning: zijn allebei nog mogelijk
-> ML is heel usefull for decision making
Exercise 6: Bank Fraud
Scenario:
A bank wants to detect and combat fraud in their real-time transaction system.
Question:
Which concept(s) best apply here?
Machine learning: een algoritme bouwen
Big data: het zijn grote en moeilijke datasets
Data mining
Machine learining engineering: monitoren van het systeem
Data enineering
4
Lecture 1: Intro to machine learning
What is…
Key concepts/Terms
Data science
• het proces waarbij inzichten en kennis uit gegevens worden gehaald met behulp van
technieken uit de statistiek, informatica en domeinexpertise
• de breedste van de termen
• Gebruikt door mensen met een achtergrond in
-> Statistics, computer science, mathematics, economics, engineering, or business analytics
(So everyone, essentially)
Data analytics
• het proces van het onderzoeken, opschonen, transformeren en modelleren van gegevens om
bruikbare informatie te ontdekken en besluitvorming te ondersteunen....
• de meest handmatige van de ‘datawetenschappen’
• Gebruikt door mensen met een achtergrond in...
-> Business, economics, marketing, finance, or statistics
Data mining
• het proces waarbij patronen, verbanden of afwijkingen in grote datasets worden ontdekt met
behulp van statistische en computationele methoden....
• de oudste van de ‘datawetenschappen’
• Gebruikt door mensen met een achtergrond in...
-> Business intelligence, marketing, statistics, or computer science
Machine learning
• het proces van het bouwen van algoritmen die kunnen leren van gegevens en voorspellingen
of beslissingen kunnen nemen zonder expliciet te zijn geprogrammeerd....
• de hoogste waarde van de “datawetenschappen” (naar mijn persoonlijke mening)
• Gebruikt door mensen met een achtergrond in...
-> Computer science, data science, (digital business) engineering, mathematics, or physics
1
,Artificial intelligence
• de kunst van het creëren van systemen die specifieke taken kunnen uitvoeren waarvoor
doorgaans menselijke intelligentie vereist is, zoals redeneren, leren en waarnemen....
• de hipste van de ‘datawetenschappen’
• Gebruikt door mensen met een achtergrond in...
-> Computer science, robotics, cognitive science, or philosophy of mind
Artificial (general)intelligence is…
• de zoektocht naar een theoretische vorm van AI die elke intellectuele taak kan uitvoeren die
een mens kan uitvoeren, met algemene redeneervaardigheden en leervermogen op
verschillende gebieden
-> het is een theoretische vorm want deze bestaat nog niet
• de absoluut hipste van de ‘datawetenschappen’
• Meest gebruikt door...
-> Sam Altman, Ilya Sutskever, and other AI prophets
Big data
• extreem grote en complexe datasets die geavanceerde tools en infrastructuur vereisen om op
te slaan, te verwerken en te analyseren
• een ietwat verouderde term in 2025
-> Deze term was vooral belangrijk van 2000-2010, nu is die al ouder want bijna alles is big
data
• Gebruikt door mensen met een achtergrond in…
-> Computer science, information systems, cloud computing, or data engineering
Data engineering
• een discipline voor het ontwerpen en bouwen van systemen voor het efficiënt en
betrouwbaar verzamelen, opslaan en verwerken van (grote hoeveelheden) data
• onderschat, maar naar mijn ervaring de belangrijkste reden waarom
datawetenschapsprojecten slagen of mislukken
• Gebruikt door mensen met een achtergrond in…
-> Software engineering, computer science, or information technology
Machine learning engineering
• het implementeren, inzetten en onderhouden van machine learning-modellen in
productieomgevingen....
• een van de moeilijkste dingen om goed te doen, naar mijn ervaring
-> Bv in en rond covid faalde alle modellen omdat dat een situatie was dat we nog nooit
eerder hadden meegemaakt
• Gebruikt door mensen met een achtergrond in...
-> Computer science, software engineering, or applied mathematics
2
,Data governance
• een reeks beleidsregels, processen en normen die ervoor zorgen dat gegevens nauwkeurig en
veilig zijn en op verantwoorde wijze worden gebruikt binnen een organisatie.
• het meest over het hoofd geziene aspect van datawetenschap
• Gebruikt door mensen met een achtergrond in…
-> Information systems, law, business administration, or data management
Voorbeeld:
Hebben enorm veel geld betaald om hun data terug te krijgen
Enkele oefeningen rond deze termen:
Exercise 1: Airport Retail
Scenario:
Brussels Airport wants to investigate how many passengers make use of their airport shops and
generate ideas for how that number can be increased.
Question:
Which concept(s) best apply here?
Data analytics: management bekijkt de data en neemt op basis van de resultaten een beslissing
Data mining kan eventueel ook wel
Exercise 2: E-Commerce
Scenario:
An e-commerce company wants to build a system that recommends products to users based on their
browsing and purchase history.
Question:
Which concept(s) best apply here?
Machine learning: build a recommendersystem
-> Om aankoopgeschiedenis te zien en op basis daarvan te kijken wat ze moeten aanbieden
Exercise 3: Customer Service
Scenario:
A telecom provider wants to develop a chatbot that can understand and respond to customer
questions in natural language.
Question:
Which concept(s) best apply here?
AI: want dit is human intelligence
Data governance is heel belangrijk hier: omdat er veel mensendie chatbots misbruiken
3
, Exercise 4: Streaming
Scenario:
A streaming platform is struggling to manage and process the massive volume of user data generated
every day.
Question:
Which concept(s) best apply here?
Big data: large en difficult data
Data engineering: nodig voor big data
Exercise 5: Health Care
Scenario:
A healthcare company wants to use their data to optimize patient care while ensuring that patient
data is handled securely and complies with GDPR regulations.
Question:
Which concept(s) best apply here?
Data governance: we moeten die veilig managen in health care, heel belangrijk
Data analytics/ machine learning: zijn allebei nog mogelijk
-> ML is heel usefull for decision making
Exercise 6: Bank Fraud
Scenario:
A bank wants to detect and combat fraud in their real-time transaction system.
Question:
Which concept(s) best apply here?
Machine learning: een algoritme bouwen
Big data: het zijn grote en moeilijke datasets
Data mining
Machine learining engineering: monitoren van het systeem
Data enineering
4