§ 6.3 Databases gebruiken voor verbeter van de bedrijfsprestatie en de
besluitvorming
Bedrijven gebruiken databases voor het bijhouden van basistransacties. Dit zijn bijv. betalingen en
bestellingen. De informatie uit de databases kunnen ze ook gebruiken voor een efficiëntere
bedrijfsvoering en betere beslissingen.
6.3.1 De uitdaging van Big Data
Big data zijn datasets die zo groot zijn dat ze niet in een DBMS kunnen worden verzameld. Big data
bemachtigen, opslaan en analyseren kan heel duur zijn. Je moet precies weten wat je vraag is die
met Big data beantwoord moet worden en wat de beperkingen zijn.
Sensoren zijn apparaten die gegevens uit de omgeving verzamelen, die door een
computersysteem gebruikt kunnen worden.
6.3.2 Infrastructuur voor Business Intelligence
Big data wordt steeds belangrijker. BI heeft diverse tools om nuttige informatie uit de Big
datagegevens te halen.
• Datawarehouses
• Data marts
• In-memory computing
• Analytische tools
Enkele zijn ook beschikbaar in de cloud.
6.3.3 Datawarehouse en Datamarts
Datawarehouses:
Een tool voor het analyseren en van gegevens. Om deze gegevens vervolgens te rapporteren. De
database slaat gegevens op die nuttig zijn voor de managers in de organisatie. Deze gegevens zijn
afkomstig van de transactiesystemen.
Data marts:
Kleinere gedecentraliseerde warehouses. Als een subset, voor een afdeling of specifieke functie.
Hadoop:
Een opensource softwareframework waarmee je enorme hoeveelheid gegevens (Big data)
verspreid maar parallel kunt verwerken op goedkope computers. Deze deelt Big dataproblemen in
sub problemen en verspreid deze tot wel duizenden computernodes en combineert de uitkomsten
in ene kleinere database die makkelijk te analyseren is. Dit kunnen zoekopdrachten op Google zijn
of het goedkoopte vliegticket op internet zoeken.
Hadoop distributed file system (HDFS) slaat de gegevens op en Mapreduce zorgt voor een snelle
parallelle gegevensverwerking.
1