BUSINESS INTELLIGENCE
1.0 INTRODUCTIE BUSINESS INGELLIGENCE
WAAROM IS DATA SCIENCE BELANGRIJ K VOOR BEDRIJVEN?
Wet van de massale digitale opslag: hoeveelheid gegevens verdubbelt op jaarbasis.
➔ Hoeveelheid data in 2020 = alle data sinds begin dataopslag (1960 – 2019).
➔ Kosten voor het opslaan van gegevens worden exponentieel goedkoper.
Big data = brede verzameling van gegevens uit verschillende bronnen.
➔ Bv. machines met eigen ERP-systeem, telefoongesprekken klanten, IoT…
Maslows hiërarchie van Big data.
Gegevens, informatie en kennis worden beschouwd als het gebied
van wetenschap en bewijsvoering.
Wijsheid wordt beschouwd als het gebied van de beslissingen.
Data is de basis en moet aangewend worden om er info uit te halen.
Die data is omzetbaar in kennis en zal leiden tot wijsheid.
Data warehouses en data marts.
Een bedrijf bestaat uit interne en externe data opgeslagen in een
warehouse. Als er een probleem opgelost moet worden, dan kunnen
ze uit de data warehouse
informatie halen. Die data is zelden in die vorm beschikbaar om
direct een bedrijfsprobleem op te lossen. Je moet dus manipuleren.
Data lake = systeem of opslagplaats van gegevens die in het natuurlijke formaat opgeslagen zijn.
➔ Bestaat uit machine learning, analytics, on-premises en real-time data movement.
Data warehouse Data lake
Gegevens worden verwerkt in een enkel schema Ongestructureerde en ruwe gegevens. Deze
voordat ze in de warehouse worden geplaatst. worden enkel geselecteerd en georganiseerd
Analyse wordt uitgevoerd op de opgeschoonde wanneer het nodig is.
gegevens in het warehouse. De data is
gestructureerd.
Data science in bedrijven
Bedrijven moeten investeren in data (kost geld)
om problemen om te lossen. Ze moeten de
aangekochte data organiseren, analyseren en zo
ontplooien dat data inzetbaar wordt.
1
,Data value trap: welke waarde heeft data is
bedrijfsvoering?
Verschillende analytics. Hoe verder, hoe hoger de
waarde, maar hoe complexer.
Beschrijvend (wat?) – diagnostisch (waarom?) –
voorspellend – voorschrijvend.
2
,1.1 DATA-ANALYTICAL THINKING & DATA SCIENCE
INTRODUCTIE
Er is afgelopen jaren veel geïnvesteerd in bedrijfsinfrastructuur, waardoor vermogen om gegevens te
verzamelen enorm is verbeterd. Elk aspect van bedrijfsleven staat nu open voor gegevensverzameling.
➔ Bv. operaties, productie, SC-management, prestaties van marketingcampagnes…
Tegelijk is er nu op grote schaal info beschikbaar over externe gebeurtenissen.
➔ Bv. markttrends, sectornieuws, bewegingen van concurrenten…
Dit leidt tot een toenemende belangstelling voor methoden om nuttige info en kennis uit gegevens te
halen.
Data science = data prepareren, modelleren, verzamelen…
WAAROM DATA-ANALYTICAL THINKING EN DATA SCIENCE?
Verschillende redenen waarom DAT en DS belangrijk zijn:
− Veel mogelijkheden dankzij de beschikbare data.
− Probleem m.b.t. naleving van de regels
− Veel applicaties mogelijk.
DATA OPPORTUNITEITEN
3 kenmerken:
1. Gigantische hoeveelheid data.
o Nu zijn bedrijven in bijna elke sector gericht op het benutten van gegevens voor
concurrentievoordeel.
2. Enorme variëteit aan data.
o Verschillende bronnen: interne bedrijfssystemen, internet…
3. Technologische vooruitgang.
Gevolgen technologische vooruitgang:
− Pc’s zijn sterker geworden
o We kunnen complexere berekeningen uitvoeren.
− Netwerken die gigantische connectiviteit tot stand brengen zowel voor mensen en databanken.
− Betere algoritmes die ons in staat stellen om alles beter te analyseren.
Dit alles zorgt voor een bredere zakelijke toepassing van datawetenschappelijke principes en
dataminingtechnieken.
Wat bedoelen we met data opportuniteiten? Big Data 1.0 en Big Data 2.0.
Big Data 1.0: hier bevinden we ons vandaag.
Big Data 2.0: toekomstig doel.
Om een onderscheid te maken tussen Big Data 1.0 en Big Data 2.0, kijken we naar een ander begrip.
We zouden dit kunnen vergelijken met Web 1.0 t.o.v. Web 2.0.
3
, Web 1.0 Web 2.0
= basistechnologie die nodig is om internet uit te = end-user content
bouwen. Men wil online aanwezigheid creëren en = eindgebruikers kunnen info toevoegen aan
elektronische handel opbouwen. website. Maakt gebruik van het interactieve
karakter van het web, alsook focus op sociaal
Net presence = bedrijven willen actief zijn op netwerk.
internet.
Bv. social media…
Stap 1: website om producten te tonen.
Stap 2: e-commerce om producten te verkopen.
Vergelijken met Big Data 1.0. Vergelijken met Big Data 2.0.
Big Data 1.0 Big Data 2.0
= grote hoeveelheden data verwerken en hiermee = nadenken in welke mate end-user content zou
efficiëntie verbeteren. kunnen bijdragen aan de manier waarop
bedrijfsvoering wordt gedaan.
= op een flexibele manier grote hoeveelheden
data verwerken.
We kunnen Big Data verwerken, maar wat kan dit
doen voor onze bedrijfsvoering?
COMPLIANCE TO REGULATIONS – NALEVING VAN DE VOORSCHRIFTEN
Bedrijven kunnen bewijzen dat aan bepaalde regelgeving voldoen.
Belangrijke regelgevingen:
− Basel II = banken moeten kunnen bewijzen dat ze voldoen aan de richtlijnen.
o Risicomodellen uitbouwen voor krediet- en marktaandeel en voor operationele manier
waarop de bank werkt.
o Analyses van beschikbare data kunnen hierbij helpen.
o Risicomodellen: kredietrisico, marktrisico en operationeel risico.
− Solvency II = Verzekeringsmaatschappijen moeten kunnen bewijzen dat ze in staat zijn om de
policies die ze dekken effectief te kunnen uitbetalen.
o Als klant bepaalde policy opvraagt, moet je deze kunnen uitbetalen.
o Analyses van beschikbare data kunnen hierbij helpen.
4
1.0 INTRODUCTIE BUSINESS INGELLIGENCE
WAAROM IS DATA SCIENCE BELANGRIJ K VOOR BEDRIJVEN?
Wet van de massale digitale opslag: hoeveelheid gegevens verdubbelt op jaarbasis.
➔ Hoeveelheid data in 2020 = alle data sinds begin dataopslag (1960 – 2019).
➔ Kosten voor het opslaan van gegevens worden exponentieel goedkoper.
Big data = brede verzameling van gegevens uit verschillende bronnen.
➔ Bv. machines met eigen ERP-systeem, telefoongesprekken klanten, IoT…
Maslows hiërarchie van Big data.
Gegevens, informatie en kennis worden beschouwd als het gebied
van wetenschap en bewijsvoering.
Wijsheid wordt beschouwd als het gebied van de beslissingen.
Data is de basis en moet aangewend worden om er info uit te halen.
Die data is omzetbaar in kennis en zal leiden tot wijsheid.
Data warehouses en data marts.
Een bedrijf bestaat uit interne en externe data opgeslagen in een
warehouse. Als er een probleem opgelost moet worden, dan kunnen
ze uit de data warehouse
informatie halen. Die data is zelden in die vorm beschikbaar om
direct een bedrijfsprobleem op te lossen. Je moet dus manipuleren.
Data lake = systeem of opslagplaats van gegevens die in het natuurlijke formaat opgeslagen zijn.
➔ Bestaat uit machine learning, analytics, on-premises en real-time data movement.
Data warehouse Data lake
Gegevens worden verwerkt in een enkel schema Ongestructureerde en ruwe gegevens. Deze
voordat ze in de warehouse worden geplaatst. worden enkel geselecteerd en georganiseerd
Analyse wordt uitgevoerd op de opgeschoonde wanneer het nodig is.
gegevens in het warehouse. De data is
gestructureerd.
Data science in bedrijven
Bedrijven moeten investeren in data (kost geld)
om problemen om te lossen. Ze moeten de
aangekochte data organiseren, analyseren en zo
ontplooien dat data inzetbaar wordt.
1
,Data value trap: welke waarde heeft data is
bedrijfsvoering?
Verschillende analytics. Hoe verder, hoe hoger de
waarde, maar hoe complexer.
Beschrijvend (wat?) – diagnostisch (waarom?) –
voorspellend – voorschrijvend.
2
,1.1 DATA-ANALYTICAL THINKING & DATA SCIENCE
INTRODUCTIE
Er is afgelopen jaren veel geïnvesteerd in bedrijfsinfrastructuur, waardoor vermogen om gegevens te
verzamelen enorm is verbeterd. Elk aspect van bedrijfsleven staat nu open voor gegevensverzameling.
➔ Bv. operaties, productie, SC-management, prestaties van marketingcampagnes…
Tegelijk is er nu op grote schaal info beschikbaar over externe gebeurtenissen.
➔ Bv. markttrends, sectornieuws, bewegingen van concurrenten…
Dit leidt tot een toenemende belangstelling voor methoden om nuttige info en kennis uit gegevens te
halen.
Data science = data prepareren, modelleren, verzamelen…
WAAROM DATA-ANALYTICAL THINKING EN DATA SCIENCE?
Verschillende redenen waarom DAT en DS belangrijk zijn:
− Veel mogelijkheden dankzij de beschikbare data.
− Probleem m.b.t. naleving van de regels
− Veel applicaties mogelijk.
DATA OPPORTUNITEITEN
3 kenmerken:
1. Gigantische hoeveelheid data.
o Nu zijn bedrijven in bijna elke sector gericht op het benutten van gegevens voor
concurrentievoordeel.
2. Enorme variëteit aan data.
o Verschillende bronnen: interne bedrijfssystemen, internet…
3. Technologische vooruitgang.
Gevolgen technologische vooruitgang:
− Pc’s zijn sterker geworden
o We kunnen complexere berekeningen uitvoeren.
− Netwerken die gigantische connectiviteit tot stand brengen zowel voor mensen en databanken.
− Betere algoritmes die ons in staat stellen om alles beter te analyseren.
Dit alles zorgt voor een bredere zakelijke toepassing van datawetenschappelijke principes en
dataminingtechnieken.
Wat bedoelen we met data opportuniteiten? Big Data 1.0 en Big Data 2.0.
Big Data 1.0: hier bevinden we ons vandaag.
Big Data 2.0: toekomstig doel.
Om een onderscheid te maken tussen Big Data 1.0 en Big Data 2.0, kijken we naar een ander begrip.
We zouden dit kunnen vergelijken met Web 1.0 t.o.v. Web 2.0.
3
, Web 1.0 Web 2.0
= basistechnologie die nodig is om internet uit te = end-user content
bouwen. Men wil online aanwezigheid creëren en = eindgebruikers kunnen info toevoegen aan
elektronische handel opbouwen. website. Maakt gebruik van het interactieve
karakter van het web, alsook focus op sociaal
Net presence = bedrijven willen actief zijn op netwerk.
internet.
Bv. social media…
Stap 1: website om producten te tonen.
Stap 2: e-commerce om producten te verkopen.
Vergelijken met Big Data 1.0. Vergelijken met Big Data 2.0.
Big Data 1.0 Big Data 2.0
= grote hoeveelheden data verwerken en hiermee = nadenken in welke mate end-user content zou
efficiëntie verbeteren. kunnen bijdragen aan de manier waarop
bedrijfsvoering wordt gedaan.
= op een flexibele manier grote hoeveelheden
data verwerken.
We kunnen Big Data verwerken, maar wat kan dit
doen voor onze bedrijfsvoering?
COMPLIANCE TO REGULATIONS – NALEVING VAN DE VOORSCHRIFTEN
Bedrijven kunnen bewijzen dat aan bepaalde regelgeving voldoen.
Belangrijke regelgevingen:
− Basel II = banken moeten kunnen bewijzen dat ze voldoen aan de richtlijnen.
o Risicomodellen uitbouwen voor krediet- en marktaandeel en voor operationele manier
waarop de bank werkt.
o Analyses van beschikbare data kunnen hierbij helpen.
o Risicomodellen: kredietrisico, marktrisico en operationeel risico.
− Solvency II = Verzekeringsmaatschappijen moeten kunnen bewijzen dat ze in staat zijn om de
policies die ze dekken effectief te kunnen uitbetalen.
o Als klant bepaalde policy opvraagt, moet je deze kunnen uitbetalen.
o Analyses van beschikbare data kunnen hierbij helpen.
4