1. Inleiding
1.1. Data <-> informatie
Data zijn gegeven feiten. DB gebruikt enkel data
informatie is betekenis van data, wordt toegevoegd door gebruiker
databasie = collectie van persistente data
semantische database = data met betekenis in base.
DBMS = databasemanagementsysteem
1.2. Geschiedenis
Meer en meer structuur nodig
Jacquard-weefgetouw -> ponskaarten -> magnetische gegevensdragers -> optische
gegevensdragers -> flashgeheugen -> cloudcomputing
1.3. DBMS
Vroeger geïsoleerde bestanden, elk software moest weten waar bestanden waren en structuur.
betekenis van gegevens in toepassing en niet in bestanden zelf ->
- Gegevens worden gescheiden opgeslagen
- Duplicatie & redundantie
- Applicaties afhankelijk bestandstructuur
- Gegevens niet goed geïntegreerd
- Niet toegankelijk buiten applicatie
Geïntegreerde database zet data samen DBMS neemt beheer over.
DBMS taken:
- Regelt fysieke opslag
- integriteit
- performantie
- beschermen
- metadata (opgeslagen in data-dictionary):
o soort data
o relaties tussen data
o waarden/datatypes
o gebruikers
o eigenaar data
o rechten van gebruikers
o nog veel meer
Voordelen:
- data in 1 plaats -> relaties makkelijker opslaan
- geen duplicatie/redundantie
- betekenis in database (metadata)
- neemt controle over alles over
- gestructureerde en afgeschermde toegang gegevens
, RDBMS: database logische verzameling tabellen met relaties
Werken met SQL = structured query language;
Functies DB:
- Data modeler: analyseren en bepalen welke data en de structuur
- Database administrator: implemantatie en onderhoud
o Plannen opslagruimte, modificeren db-structuur,kwaliteit,back up en restore.
1.4. Toenemend belang data
Wet van Moore: aantal transistoren per 2 jaar verdubbelen
Internet en smartphone meer data -> disrupties
Disrupties: door nieuwe data worden vroegere modellen te niet gedaan.
1.5. Datawarehouses (DWH)
Database vormt centrale opslagplaats voor verder te analyseren data.
ideaal gegevens raadplegen en analyseren maar niet voor wijzigingen.
ETL = extract, transform & load:
- data samenbrengen
- transformeren en combinaties maken
- wegschrijven naar warehouse
voordelen DWH:
- 1 single version of truth
- OS niet belast bij uitvoering
- Historie
- Opslagstructuur gemodelleerd in functie performantie
Datawarehouse developer
1.6. Business Intelligence
Gegevens omzetten in informatie
Raw data -> DWH -> beslissingen
Balanced scorecard met KPI
Key Performance indicator (KPI): maatstaf voor hoe goed onderneming presteert op bepaald
terrein.
OLAP cube (online analytical processing):3d visualisatie gegevens
BI analyst: creert rapporten en analyses (brug tussen business en IT)
data steward: zorgt voor kwaliteit en consistente data
1.7. AI – machine learning
Predictive analytics vs Business Intelligence
Datamining: gericht zoeken naar verbanden in verzamelingen
1. Data uit verleden met uitkomst
2. Opsplitsen in trainingsets en testsets