Hoofdstuk 1
Data vs informatie
*Data = gegevens, gegeven feiten bv getallen, symbolen, woorden, foto’s,
…
Bv: 45, Piet, 26 09 2019
*Informatie = Gegevens in een context
Bv: Leeftijd werknemer is 45, Naam werknemer is Piet, Startdatum is
26/09/2019
Wat is een Database
Collectie van persistente data = beschikbaar op permanent geheugen
Wat is een databasemanagementsysteem (DBMS)
Computersysteem dat beheer doet van database
Gegevensdragers
steen – hout – perkament – papier – ponskaarten - magneetbanden –
magneetschijven – optische schijven – flash – the cloud
The cloud
*Cloud storage (bv OneDrive, *Datacenters (bv Microsoft), *Cloud
computing (= via het internet beschikbaar stellen van software of
hardware)
Losse bestanden --> database management systeem
*Geïsoleerde bestanden, nadelen: *gegevens gescheiden opgeslagen,
*duplicering-redundantie, *applicatie afhankelijk van bestandsstructuur,
*slechte integratie van gegevens, *formele opslagvorm: weinig
toegankelijk voor gebruikers
*Geïntegreerde databases: *data samen in 1 database, *DBMS neemt
beheer over (geen applicatieprogramma’s meer)
Rol van DBMS
*regelt fysieke opslag, *controleert juistheid en volledigheid van de
gegevens (=integriteit), *zorgt voor performante zoekmogelijkheden,
*beschermt tegen ongeautoriseerde toegang, *bewaart meta-data in
data dictionary
Meta-data
=gegevens over structuur van gegevens, bevat: *soort data, *relaties
tussen data, *datatype, *gebruikers, *eigenaar van data, *rechten van
gebruikers,…
Relationele DBMS
,*Database= tabellen & relaties, *SQL= standaard datadefinitie- &
datamanipulatietaal
Bv: MySQL, PostgreSQL, Oracle, IBM DB2, Microsoft SQL Server
Voorbeelden van NoSQL database: GemStone, neo4j, mongoDB
, Geschiedenis van data (Toenemend belang van gegevens en informatie)
*Vroeger: Mainframe = gegevens binnen 1 bedrijf
*Jaren ’80: PC breekt door gegevens verspreid
*Jaren ’90: Internet gegevens wereldwijd
*21ste eeuw: Smartphone altijd gegevens raadplegen, zelf gegevens
verspreiden (sociale media)
*Twee fundamentele elementen: *computers zijn steeds krachtiger,
*we zijn permanent geconnecteerd
*1965, Gordon Moore: “Het aantal transistoren in een geïntegreerde
schakeling zal om de twee jaar verdubbelen
*1975: cray-1 = snelste supercomputer, 5 miljard dollar
*2013: iPhone 4 = zelfde snelheid, capaciteit,… 400 dollar
Steeds meer data --> disruptie
= economische en maatschappelijke modellen worden op hun kop gezet
Bv: *telefoonkotjes london omgezet in wifi hotspots, *kaarten google
maps, *boekhouden online programma, *cassetten spotify, *film
huren netflix, *Kleine winkels meer online kopen
Data verzamelen en verwerken
1)Datawarehouse
RDMBS transactionele database
*dagelijkse transacties, *veel wijzigingen, *nadruk op actuele gegevens,
*weinig historische data
Datawarehouse rapportering en analyse
*Weinig wijzigingen, *Veel raadplegen
ETL = Extract, Transform, Load
*Extract = data ui diverse databronnen samenbrengen
*Transform = omzetten met nadruk op opzoekingen en historische data
(combinaties maken)
*Load = wegschrijven in datawarehouse
Voordelen
*”Single version of the truth”, *Geen belasting van operationele systemen,
*History wordt bijgehouden, *Opslagstructuur gemodelleerd in functie van
performantie
2)Business Intelligence
= op basis van verzamelde data (klanten, concurrentie, markt,
trends,…) beslissingsondersteunende informatie leveren
KPI = Key Performance Indicator
=Maatstaf voor hoe goed onderneming presteert op bepaald terrein
Bv: *maandelijkse groei van bedrijfstak, *return-on-investment (ROI),
*klantengroei
Balanced scorecard (topmanagement): KPI’s visualiseren
OLAP: Online Analytical Processing
Data vs informatie
*Data = gegevens, gegeven feiten bv getallen, symbolen, woorden, foto’s,
…
Bv: 45, Piet, 26 09 2019
*Informatie = Gegevens in een context
Bv: Leeftijd werknemer is 45, Naam werknemer is Piet, Startdatum is
26/09/2019
Wat is een Database
Collectie van persistente data = beschikbaar op permanent geheugen
Wat is een databasemanagementsysteem (DBMS)
Computersysteem dat beheer doet van database
Gegevensdragers
steen – hout – perkament – papier – ponskaarten - magneetbanden –
magneetschijven – optische schijven – flash – the cloud
The cloud
*Cloud storage (bv OneDrive, *Datacenters (bv Microsoft), *Cloud
computing (= via het internet beschikbaar stellen van software of
hardware)
Losse bestanden --> database management systeem
*Geïsoleerde bestanden, nadelen: *gegevens gescheiden opgeslagen,
*duplicering-redundantie, *applicatie afhankelijk van bestandsstructuur,
*slechte integratie van gegevens, *formele opslagvorm: weinig
toegankelijk voor gebruikers
*Geïntegreerde databases: *data samen in 1 database, *DBMS neemt
beheer over (geen applicatieprogramma’s meer)
Rol van DBMS
*regelt fysieke opslag, *controleert juistheid en volledigheid van de
gegevens (=integriteit), *zorgt voor performante zoekmogelijkheden,
*beschermt tegen ongeautoriseerde toegang, *bewaart meta-data in
data dictionary
Meta-data
=gegevens over structuur van gegevens, bevat: *soort data, *relaties
tussen data, *datatype, *gebruikers, *eigenaar van data, *rechten van
gebruikers,…
Relationele DBMS
,*Database= tabellen & relaties, *SQL= standaard datadefinitie- &
datamanipulatietaal
Bv: MySQL, PostgreSQL, Oracle, IBM DB2, Microsoft SQL Server
Voorbeelden van NoSQL database: GemStone, neo4j, mongoDB
, Geschiedenis van data (Toenemend belang van gegevens en informatie)
*Vroeger: Mainframe = gegevens binnen 1 bedrijf
*Jaren ’80: PC breekt door gegevens verspreid
*Jaren ’90: Internet gegevens wereldwijd
*21ste eeuw: Smartphone altijd gegevens raadplegen, zelf gegevens
verspreiden (sociale media)
*Twee fundamentele elementen: *computers zijn steeds krachtiger,
*we zijn permanent geconnecteerd
*1965, Gordon Moore: “Het aantal transistoren in een geïntegreerde
schakeling zal om de twee jaar verdubbelen
*1975: cray-1 = snelste supercomputer, 5 miljard dollar
*2013: iPhone 4 = zelfde snelheid, capaciteit,… 400 dollar
Steeds meer data --> disruptie
= economische en maatschappelijke modellen worden op hun kop gezet
Bv: *telefoonkotjes london omgezet in wifi hotspots, *kaarten google
maps, *boekhouden online programma, *cassetten spotify, *film
huren netflix, *Kleine winkels meer online kopen
Data verzamelen en verwerken
1)Datawarehouse
RDMBS transactionele database
*dagelijkse transacties, *veel wijzigingen, *nadruk op actuele gegevens,
*weinig historische data
Datawarehouse rapportering en analyse
*Weinig wijzigingen, *Veel raadplegen
ETL = Extract, Transform, Load
*Extract = data ui diverse databronnen samenbrengen
*Transform = omzetten met nadruk op opzoekingen en historische data
(combinaties maken)
*Load = wegschrijven in datawarehouse
Voordelen
*”Single version of the truth”, *Geen belasting van operationele systemen,
*History wordt bijgehouden, *Opslagstructuur gemodelleerd in functie van
performantie
2)Business Intelligence
= op basis van verzamelde data (klanten, concurrentie, markt,
trends,…) beslissingsondersteunende informatie leveren
KPI = Key Performance Indicator
=Maatstaf voor hoe goed onderneming presteert op bepaald terrein
Bv: *maandelijkse groei van bedrijfstak, *return-on-investment (ROI),
*klantengroei
Balanced scorecard (topmanagement): KPI’s visualiseren
OLAP: Online Analytical Processing