100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.6 TrustPilot
logo-home
Summary

Data Mining and its Applications summary - GRADE - 8,5

Rating
-
Sold
-
Pages
50
Uploaded on
26-06-2025
Written in
2024/2025

Summary for the Data Mining and its Applications open book exam, contains all the LATEST material. 8.5 achieved with this summary! Week 1 in Dutch, the rest in English

Institution
Course











Whoops! We can’t load your doc right now. Try again or contact support.

Written for

Institution
Study
Course

Document information

Uploaded on
June 26, 2025
Number of pages
50
Written in
2024/2025
Type
Summary

Subjects

Content preview

Data Mining and its Applications
Samenvatting open boek tentamen blok 2.b

Week 1- Introduction to data mining

Lecture
1. Wat is Data Mining?
Definitie:
Data Mining is het proces waarbij je uit grote, vaak heterogene datasets interessante patronen
of inzichten haalt door middel van statistiek, machine learning of AI-technieken.
●​ NIST: analyseren van grote datasets om patronen te ontdekken die leiden tot kennis.
●​ ISO: patroonherkenning in kwantitatieve data door analyse vanuit meerdere
perspectieven.​

Kenmerken:
●​ Werkt met grote volumes data
●​ Data vaak verzameld voor andere doeleinden
●​ Richt zich op het vinden van bruikbare kennis, bijv. in de commerciële,
maatschappelijke of wetenschappelijke context
●​ Maakt gebruik van machine learning, statistiek en rekenkracht

2. Data Mining & AI
Data mining maakt vaak deel uit van of maakt gebruik van:
Term Omschrijving

AI Simuleren van menselijke intelligentie

ML Algoritmen leren uit data zonder expliciete
programmering

Deep Learning Neurale netwerken herkennen complexe patronen

LLM (Large Language Models) AI-modellen zoals ChatGPT die tekst begrijpen/genereren


Toepassingen: aanbevelingssystemen, beeldherkenning, automatische tekstgeneratie,
fraudedetectie, voorspellingen.

,4. Het Data Mining Proces (CRISP-DM)
CRISP-DM fasen:
1.​ Inception/discovery​
Doelstelling bepalen, context schetsen, eerste hypothese formuleren
2.​ Data preparation​
Data extraheren, transformeren, semantisch begrijpen
3.​ Model planning​
Selectie van technieken, bepalen van procesflow
4.​ Model building​
Trainen, testen en valideren van modellen
5.​ Resultaatcommunicatie​
Presentatie en evaluatie bij stakeholders
6.​ Operationalisatie​
Pilot, implementatie, en eventueel continu gebruik

Alternatief projectmodel (volgens college):
1.​ Inception
2.​ Understanding
3.​ Prepare
4.​ Model
5.​ Evaluate
6.​ Operationalize

5. Betrokken stakeholders
Rol Verantwoordelijkheden

Business user Domeinkennis, doelbepaling, interpretatie

Project sponsor ROI, strategische doelen

Project manager Tijd, scope, kwaliteit, budget

BI-analist KPI’s, dashboards, brugfunctie

Data admin/integrator Toegang, security, dataflow

Data Modellering, analyse,
scientist/engineer methodeverantwoording
→ Goed samenspel tussen deze rollen voorkomt communicatieproblemen of mismatch in
verwachtingen.

,6. Type problemen in Data Mining
Type Voorbeelden

Clustering / Welke klantgroepen bestaan er?
Segmentatie

Classificatie Gaat iemand reageren? Is iemand
kredietwaardig?

Regressie Hoe verandert een koers of prijs over tijd?

Generatie (GenAI) Scenario's of visualisaties genereren o.b.v. input


7. Exploratory Data Analysis (EDA)
Doel:
●​ Vertrouwen krijgen in de data
●​ Inzichten in verdelingen, verbanden en datakwaliteit
●​ Valideren van aannames over representativiteit en relevantie
●​
Attribuutanalyse:
●​ Nominaal: labels (man/vrouw, producttype)
●​ Ordinaal: gesorteerde categorieën (BSc < MSc < PhD)
●​ Numeriek:
○​ Discreet: hele getallen (aantal kinderen)
○​ Continu: kommagetallen (lengte, gewicht)
○​ Schaaltypes: interval (datum), ratio (afstand), absoluut (telling)

Visualisatieprincipes (college)
Bij datavisualisatie draait het om begrijpelijkheid:
●​ Simplicity: toon alleen wat nodig is.
●​ Focus: leg nadruk op relevante info.
●​ Contrast: gebruik kleur en vorm verstandig.
●​ Storytelling: breng een boodschap over, niet alleen een beeld.
Visualisatietypen:
●​ 1D: histogram, barplot
●​ 2D: scatterplot, heatmap
●​ 3D: scatterplot matrix, parallel coordinates

, Hoofdstuk 1 - inleiding
1.1 Motivatie: Waarom data science?
●​ Door technologische vooruitgang kunnen we enorme hoeveelheden gegevens
verzamelen en opslaan.
●​ Gegevens ≠ kennis: patronen blijven vaak verborgen in ruwe data.
●​ Belangrijk doel: gegevens omzetten in kennis → inzichten en voorspellingen.
●​ “We verdrinken in informatie, maar hongeren naar kennis.” – John Naisbett​

1.1.1 Gegevens vs. Kennis
Gegevens (data) Kennis (knowledge)

Gaat over individuele Gaat over algemene
gevallen regels/wetten

Makkelijk te verzamelen Moeilijk te vinden

Laat geen voorspellingen Maakt voorspellingen
toe mogelijk


Goede kennis voldoet aan:
●​ Correctheid
●​ Algemeenheid
●​ Bruikbaarheid
●​ Begrijpelijkheid
●​ Nieuwheid​

1.1.2 Kepler vs. Brahe – een historisch voorbeeld
●​ Tycho Brahe verzamelde nauwkeurige astronomische data.
●​ Johannes Kepler ontdekte uit die data de wetten van planeetbeweging.
●​ Illustratie van: data ≠ kennis, analyse vereist modellen, interpretatie en intuïtie.​

1.1.3 Intelligente gegevens wetenschap
●​ Statistiek is slechts een deel van data science.
●​ Twee soorten studies:
○​ Experimenteel: data-generatie wordt gestuurd.
○​ Observationeel: data wordt enkel waargenomen.
●​ Veel data science technieken zijn verkennend (hypothese-genererend), niet altijd
hypothese-toetsend.​
$9.44
Get access to the full document:

100% satisfaction guarantee
Immediately available after payment
Both online and in PDF
No strings attached

Get to know the seller
Seller avatar
sjmvriesde

Get to know the seller

Seller avatar
sjmvriesde Rijksuniversiteit Groningen
Follow You need to be logged in order to follow users or courses
Sold
1
Member since
1 year
Number of followers
0
Documents
2
Last sold
1 month ago

0.0

0 reviews

5
0
4
0
3
0
2
0
1
0

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions