Business intelligence
THEORIE-LESSEN
1.1 Data-analytical thinking
Big data = een brede verzameling van gegevens uit verschillende bronnen
Maslows hiërarchie van big data: Maslow zegt dus dat data de basis is en dat die data
aangewend kan worden om er zo informatie uit te halen. Die informatie is omzetbaar in
kennis en die kennis zal leiden tot wijsheid.
Data lakes = een systeem of opslagplaats van gegevens die in het natuurlijke formaat
opgeslagen zijn.
Data warehouse → data lakes
Bij een data warehouse worden de gegevens verwerkt en georganiseerd voordat ze in het
warehouse worden geplaatst. De analyse wordt uitgevoerd op de opgeschoonde gegevens in
het warehouse. De data is dus gestructureerd.
Bij een data lake gaat het om de ongestructureerde en ruwe gegevens. De gegevens worden
enkel geselecteerd en georganiseerd wanneer dat nodig is.
Data analytical thinking & Data science
Waarom?
- Allerlei opportuniteiten door data
- Belangrijke om te kunnen bewijzen dat ze aan bepaalde regelgeving voldoen
- Verschillende applicaties mogelijk die kunnen worden ingezet in een bedrijf
Opportuniteiten van data
We beschikken over een gigantische hoeveelheid data + deze zijn in talrijke bronnen aanwezig.
Door technologische vooruitgang worden computers almaar krachtiger en kunnen ze almaar
meer
We beschikken over netwerken die gigantische connectiviteit teweeg brengen
Web 1.0 = de basistechnologie die nodig is om het web uit te bouwen
,Big data 1.0 = mogelijk om een grote hoeveelheid data te gaan verwerken + we zijn in staat om
met die data de efficiëntie te gaan verbeteren
Web 2.0 = enduser content = eindgebruikers kunnen informatie gaan toevoegen aan het web
Big data 2.0 = halen van waarde uit data via geavanceerde analysetechnieken zoals real-time
verwerking, kunstmatige intelligentie en machine learning
Belangrijk om te bewijzen dat de bedrijven voldoen aan de regelgeving
2 belangrijke regelgevingen:
1) Basel II
2) Solvency II
Basel II
= voor banken, ze moeten kunnen bewijzen dat ze aan de richtlijnen van Basel II voldoen.
Ze moeten in staat zijn om risicomodellen uit te bouwen, zowel voor een krediet, als voor een
marktaandeel, als voor de operationele manier waarop de bank werkt.
➔ Kunnen gebruik maken van analyses van de data die voor hen beschikbaar staat
Solvency II
= voor de verzekeringsmaatschappijen. Ze moeten kunnen bewijzen dat ze in staat zijn om de
polissen die ze dekken effectief uit te betalen.
➔ Analyse van data kan hier weer een rol spelen. Ze kunnen met data bewijzen dat ze
hieraan voldoen
Mogelijke applicaties
Marketing:
bv. targeted marketing = op voorhand bepalen welke doelgroep je wil bereiken.
Online advertising = er voor zorgen dat bepaalde groepen de marketing krijgen
Recommendations for cross selling = mensen die dit product kochten, kochten ook dit → zo
gekochte hoeveelheid bij klant laten toenemen
Customer relationship management → door op de juiste manier data te analyseren kan je ervoor
zorgen dat de relatie naar de klant toe verbetert
(bv. voorspellen hoe vaak een klant een helpdesk zal gebruiken → zo bepalen hoeveel die klant
moet betalen voor de helpdesk)
,(Bv. managen van churn → kiezen om contract bij concurrentie af te sluiten. ➔ via data
analyseren welke klanten er gaan overstappen en zo via gerichte marketing hen proberen te
behouden)
(bv. waarde die je denkt dat een klant kan opbrengen voor je bedrijf optimaliseren)
Finance
Toekennen van een krediet aan klanten zou je kunnen analyseren
Operationele management
Bv. fraude detecteren
Corporate performance management
= manier waarop het bedrijf in staat is om zijn doelstellingen waar te maken
Marktanalyses
Om fusies tussen bedrijven te stroomlijnen of om globalisering makkelijker te maken
Voorbeeld 1 Hurricane Frances
➔ Niet eerste orkaan die aan land ging in de VS ➔ hebben geanalyseerd welke producten
populair worden op het moment dat een orkaan aan land ging (bv. kaarsen, zaklampen
→ want kans groot dat stroom wegvalt) (MAAR minder voor de hand liggend: bier, koekje)
Voorbeeld 2 voorspellen of koppel zwanger is:
➔ Proberen voorspellen vooraleer het koppel de eerste pamper koopt welk koppel zwanger
is. Want ze gaan er vanuit dat waar je je pamper koopt je ook de rest van de
boodschappen doet, aangezien je niet veel tijd hebt als verse ouders
➔ Gingen aan de hand van mensen die nu pampers kopen gaan kijken naar hun
aankoopgedrag 9 maanden terug, om zo zicht te krijgen op de verandering in koopgedrag
tijdens de zwangerschap.
➔ Is gelukt om van 3e tot 4e maand vanaf zwangerschap heel precies te bepalen
Voorbeeld 3: Megatelco telebedrijf: churn predictie
Markt is verzadigd, iedereen heeft al een abonnement op mobiele communicatie. De manier om
aan nieuwe klanten te geraken is dus klanten wegsnoepen bij concurrentie. Megatelco heeft
proberen voorspellen welke klanten gingen churnen. Om zo via gerichte marketing hen te
behouden (bv. gratis toestel aanbieden)
, NIET GELIJK AAN HYPOTHESETESTEN: Hier worden modellen opgesteld die niet vertrekken van
hypotheses, maar van het idee: zouden we het probleem kunnen oplossen met data
Wat is data analytical thinking
Probeert antwoord te geven op een bepaald aantal vragen. Kan data helpen bij het oplossen van
bedrijfsproblemen? Indien ja, kunnen we dit systematisch herhalen?
Je moet dus een model kunnen maken die zich systematisch kan herhalen → (bv. google die
gerichte reclame kan plaatsen per persoon en die dat moeten kunnen vernieuwen bij nieuwere
zoekopdrachten)
➔ Kunnen we een model opbouwen, zodanig dat we bij een nieuwe instantie van data in
staat zijn dezelfde besluiten te nemen als bij de data die we al kennen
Big data = big business geworden
Bedrijven moeten zich dus bewust worden dat het toepassen van data een strategisch
onderdeel is geworden in de bedrijfsvoering (zien we ook aan die 3 voorbeelden hierboven dat
het belangrijk kan zijn voor het succes van bedrijven)
Voorbeeld 1: Signet bank vs Capital one
Signet bank = klein bankje in de VS
Capital one = grote verstrekker van kredietkaarten in de VS
Slechts beperkte groep waarbij kredietkaarten een grote winst opleveren. Als je die groep
voordelige kredietkaarten geeft, kan je hen aantrekken en zo meeste winst maken. 2 mensen zijn
van bank naar bank getrokken om hen te overtuigen om dit aan de hand van datamining op te
lossen.
➔ Voor zo’n analyse was het nodig om random kredieten te verstrekken ➔ KOST VEEL
GELD
Signet ging akkoord → daardoor uitgegroeid tot Capital One
Voorbeeld 2: Amazon
Recommendation system is goed bij Amazon → = klanten die dit kochten, kochten ook dit. En er
werd ook klantenervaringen toegevoegd aan die producten die werden aanbevolen
➔ Veel klanten gingen terug kopen bij Amazon omdat die aanbevelingen zo goed waren
Voorbeeld 3: Harrah’s casinos
THEORIE-LESSEN
1.1 Data-analytical thinking
Big data = een brede verzameling van gegevens uit verschillende bronnen
Maslows hiërarchie van big data: Maslow zegt dus dat data de basis is en dat die data
aangewend kan worden om er zo informatie uit te halen. Die informatie is omzetbaar in
kennis en die kennis zal leiden tot wijsheid.
Data lakes = een systeem of opslagplaats van gegevens die in het natuurlijke formaat
opgeslagen zijn.
Data warehouse → data lakes
Bij een data warehouse worden de gegevens verwerkt en georganiseerd voordat ze in het
warehouse worden geplaatst. De analyse wordt uitgevoerd op de opgeschoonde gegevens in
het warehouse. De data is dus gestructureerd.
Bij een data lake gaat het om de ongestructureerde en ruwe gegevens. De gegevens worden
enkel geselecteerd en georganiseerd wanneer dat nodig is.
Data analytical thinking & Data science
Waarom?
- Allerlei opportuniteiten door data
- Belangrijke om te kunnen bewijzen dat ze aan bepaalde regelgeving voldoen
- Verschillende applicaties mogelijk die kunnen worden ingezet in een bedrijf
Opportuniteiten van data
We beschikken over een gigantische hoeveelheid data + deze zijn in talrijke bronnen aanwezig.
Door technologische vooruitgang worden computers almaar krachtiger en kunnen ze almaar
meer
We beschikken over netwerken die gigantische connectiviteit teweeg brengen
Web 1.0 = de basistechnologie die nodig is om het web uit te bouwen
,Big data 1.0 = mogelijk om een grote hoeveelheid data te gaan verwerken + we zijn in staat om
met die data de efficiëntie te gaan verbeteren
Web 2.0 = enduser content = eindgebruikers kunnen informatie gaan toevoegen aan het web
Big data 2.0 = halen van waarde uit data via geavanceerde analysetechnieken zoals real-time
verwerking, kunstmatige intelligentie en machine learning
Belangrijk om te bewijzen dat de bedrijven voldoen aan de regelgeving
2 belangrijke regelgevingen:
1) Basel II
2) Solvency II
Basel II
= voor banken, ze moeten kunnen bewijzen dat ze aan de richtlijnen van Basel II voldoen.
Ze moeten in staat zijn om risicomodellen uit te bouwen, zowel voor een krediet, als voor een
marktaandeel, als voor de operationele manier waarop de bank werkt.
➔ Kunnen gebruik maken van analyses van de data die voor hen beschikbaar staat
Solvency II
= voor de verzekeringsmaatschappijen. Ze moeten kunnen bewijzen dat ze in staat zijn om de
polissen die ze dekken effectief uit te betalen.
➔ Analyse van data kan hier weer een rol spelen. Ze kunnen met data bewijzen dat ze
hieraan voldoen
Mogelijke applicaties
Marketing:
bv. targeted marketing = op voorhand bepalen welke doelgroep je wil bereiken.
Online advertising = er voor zorgen dat bepaalde groepen de marketing krijgen
Recommendations for cross selling = mensen die dit product kochten, kochten ook dit → zo
gekochte hoeveelheid bij klant laten toenemen
Customer relationship management → door op de juiste manier data te analyseren kan je ervoor
zorgen dat de relatie naar de klant toe verbetert
(bv. voorspellen hoe vaak een klant een helpdesk zal gebruiken → zo bepalen hoeveel die klant
moet betalen voor de helpdesk)
,(Bv. managen van churn → kiezen om contract bij concurrentie af te sluiten. ➔ via data
analyseren welke klanten er gaan overstappen en zo via gerichte marketing hen proberen te
behouden)
(bv. waarde die je denkt dat een klant kan opbrengen voor je bedrijf optimaliseren)
Finance
Toekennen van een krediet aan klanten zou je kunnen analyseren
Operationele management
Bv. fraude detecteren
Corporate performance management
= manier waarop het bedrijf in staat is om zijn doelstellingen waar te maken
Marktanalyses
Om fusies tussen bedrijven te stroomlijnen of om globalisering makkelijker te maken
Voorbeeld 1 Hurricane Frances
➔ Niet eerste orkaan die aan land ging in de VS ➔ hebben geanalyseerd welke producten
populair worden op het moment dat een orkaan aan land ging (bv. kaarsen, zaklampen
→ want kans groot dat stroom wegvalt) (MAAR minder voor de hand liggend: bier, koekje)
Voorbeeld 2 voorspellen of koppel zwanger is:
➔ Proberen voorspellen vooraleer het koppel de eerste pamper koopt welk koppel zwanger
is. Want ze gaan er vanuit dat waar je je pamper koopt je ook de rest van de
boodschappen doet, aangezien je niet veel tijd hebt als verse ouders
➔ Gingen aan de hand van mensen die nu pampers kopen gaan kijken naar hun
aankoopgedrag 9 maanden terug, om zo zicht te krijgen op de verandering in koopgedrag
tijdens de zwangerschap.
➔ Is gelukt om van 3e tot 4e maand vanaf zwangerschap heel precies te bepalen
Voorbeeld 3: Megatelco telebedrijf: churn predictie
Markt is verzadigd, iedereen heeft al een abonnement op mobiele communicatie. De manier om
aan nieuwe klanten te geraken is dus klanten wegsnoepen bij concurrentie. Megatelco heeft
proberen voorspellen welke klanten gingen churnen. Om zo via gerichte marketing hen te
behouden (bv. gratis toestel aanbieden)
, NIET GELIJK AAN HYPOTHESETESTEN: Hier worden modellen opgesteld die niet vertrekken van
hypotheses, maar van het idee: zouden we het probleem kunnen oplossen met data
Wat is data analytical thinking
Probeert antwoord te geven op een bepaald aantal vragen. Kan data helpen bij het oplossen van
bedrijfsproblemen? Indien ja, kunnen we dit systematisch herhalen?
Je moet dus een model kunnen maken die zich systematisch kan herhalen → (bv. google die
gerichte reclame kan plaatsen per persoon en die dat moeten kunnen vernieuwen bij nieuwere
zoekopdrachten)
➔ Kunnen we een model opbouwen, zodanig dat we bij een nieuwe instantie van data in
staat zijn dezelfde besluiten te nemen als bij de data die we al kennen
Big data = big business geworden
Bedrijven moeten zich dus bewust worden dat het toepassen van data een strategisch
onderdeel is geworden in de bedrijfsvoering (zien we ook aan die 3 voorbeelden hierboven dat
het belangrijk kan zijn voor het succes van bedrijven)
Voorbeeld 1: Signet bank vs Capital one
Signet bank = klein bankje in de VS
Capital one = grote verstrekker van kredietkaarten in de VS
Slechts beperkte groep waarbij kredietkaarten een grote winst opleveren. Als je die groep
voordelige kredietkaarten geeft, kan je hen aantrekken en zo meeste winst maken. 2 mensen zijn
van bank naar bank getrokken om hen te overtuigen om dit aan de hand van datamining op te
lossen.
➔ Voor zo’n analyse was het nodig om random kredieten te verstrekken ➔ KOST VEEL
GELD
Signet ging akkoord → daardoor uitgegroeid tot Capital One
Voorbeeld 2: Amazon
Recommendation system is goed bij Amazon → = klanten die dit kochten, kochten ook dit. En er
werd ook klantenervaringen toegevoegd aan die producten die werden aanbevolen
➔ Veel klanten gingen terug kopen bij Amazon omdat die aanbevelingen zo goed waren
Voorbeeld 3: Harrah’s casinos