Data Mining
= automatische extractie van kennis uit data
Vb. uit de credit scoring context
- Banken: zou ik krediet verlenen aan deze aanvrager van een lening?
- Voorspel kredietwaardigheid, gebaseerd op historische data
Banken beschikken over informatie (inkomen, gender, beroep, grote
van lening,..) over klanten in het verleden en dus ook of ze de
leningen hebben terug betaald.
Data en doelvariabelen worden gegeven aan een Data Mining
algoritme. Het zal proberen patronen te herkennen in data die
specifiek zijn voor het onderscheid tussen klanten die wel of niet
defaulten (terugbetalen).
Bij nieuwe klant: kijken naar de waarde voor alle variabelen van de
klant (inkomen, hoeveel men wel lenen,…), Data Mining algoritme
zal zeggen of klant de lening zal kunnen terug betalen.
1
, Data Mining vs Statistiek
Modellen in Data Mining:
Explanatory modellen
= We hebben een hypothese (bv armoede lijdt tot criminaliteit), we
gaan onderzoeken of er een oorzaak-gevolgrelatie bestaat (is armoede wel
de oorzaak van criminaliteit of is dit een toevallige samenhang?) en
vervolgens theorieën zoeken om deze te onderbouwen.
Predictive modellen
= niet geïnteresseerd in oorzaken, we willen enkel weten of dat een
variabele accuraat kan worden voorspeld o.b.v. andere variabelen.
Data Mining voorbeelden
Data Mining bij
marketing:
Voorspellen of klant
geïnteresseerd is in
een bepaald
product. Telefoons
verkopen; welke
klanten zouden
geïnteresseerd zijn
in deze nieuwe gsm?
Op deze manier
gerichte advertenties sturen naar deze groep mensen.
Of onderzoeken of dat klant bij dit bedrijf zal blijven of zal overstappen?
Gerichte advertenties sturen om te zorgen dat persoon toch zal blijven.
2