1.1 Big Data
Big data→ Enorm veel gegevens die zo groot zijn dat je ze niet op een gewone manier
kan bijhouden of analyseren.
Wat betekent Big data voor organisaties?
→ Betekent niet alleen een uitdaging als het gaat om opslag en verweking, maar wordt
ook gezien als een kans om inzichten te verkrijgen die uiteindelijk kunne leiden tot
betere besluitvorming, efficiënter opereren en een sterker concurrentievoordeel.
5V’s model (Volume, Velocity, Variety, Veracity, Value) → Dit is een manier om
duidelijk te maken wat Big Data nou eigenlijk inhoudt en waarom het zo belangrijk is
voor organisaties. De 5v’s geven een beeld van wat Big Data zo uitdagend en waardevol
maakt.
5V’s:
1.Volume- Hoeveelheid, De enorme hoeveelheid data die tegenwoordig
wordt verzameld (terabytes, petabytes, zettabytes). Het gaat niet alleen om
opslag, maar ook om hoe organisaties al die data effectief kunnen
gebruiken. Bijv. Spotify, verzamelt miljarden luisteracties per dag (nummers
die afgespeeld, geskipt of geliket worden).
2. Velocity- Snelheid, De snelheid waarmee data wordt aangemaakt, verwerkt en vaak
real-time moet worden geanalyseerd. Gaat niet alleen over de snelheid waarmee data
ontstaat en verwerkt moet worden, maar ook over de intensiteit en continuïteit van de
datastroom. Organisaties moeten dus systemen hebben die constant kunnen
bijhouden (streaming data) in plaats van af en toe een “foto” van de werkelijkheid te
nemen (batch processing). Bijv. NS Ontvangt real-time data van sensoren en seinen,
waardoor treinen sneller bijgestuurd kunnen worden bij storingen of vertragingen.
3. Variety- Diversiteit, De vele verschillende soorten data: gestructureerd (tabellen),
maar ook ongestructureerd (foto’s, video’s, sociale media, sensordata). Bijv. Politie →
combineert camerabeelden, meldingen via 112 en gps-data van surveillanceauto’s.
4. Veracity- Betrouwbaarheid, De kwaliteit en juistheid van data. Onvolledige of
foutieve data kan leiden tot verkeerde beslissingen. Bijv. Voedselindustrie: als
allergenen verkeerd geregistreerd zijn in productdata, kan dat ernstige
gezondheidsrisico’s veroorzaken bij consumenten.
5. Value- Waarde, De echte waarde die organisaties uit data halen. Data heeft pas nut
als het leidt tot betere beslissingen, innovaties of klantvoordeel. Bijv.: Zalando: zet
1
, aankoop- en retourdata in voor maatadvies, zodat klanten minder terugsturen → lagere
kosten en hogere klanttevredenheid.
3 Typen Big Data:
1. Structured, data dat een vooraf gedefinieerd gegevensmodel volgen en georganiseerd
zijn in een gestructureerd format. Dit maakt het makkelijk leesbaar voor machines.
Kenmerkend: is dat ze meestal in tabellen met rijen en kolommen zijn.
Voorbeeld: een relationele database met klantinformatie, duidelijke gegevensvelden
voor namen adressen en nummers
2. Unstructured, Data dat geen vooraf gedefinieerde structuur of formaat hebben. Dit
type is moeilijk te analyseren met traditionele methoden. Kenmerkend: Tekstbestand,
afbeeldingen, audio- video bestanden.
Voorbeeld: Berichten op sociale media, klantrecensies of multimedia-inhoud op het
internet.
3. Semi-structured, dit valt tussen gestructureerde en ongestructureerde data. Het
heeft enige structuur maar voldoet toch niet aan een strikt schema.
Voorbeeld: E-mails bevatten gestructureerde elementen zoals afzender, ontvanger,
onderwerp en datum, maar de inhoud van de e-mailtekst zelf kan variabel en
ongestructureerd zijn. Deze semi- gestructureerde gegevens worden vaak gebruikt in
zakelijke communicatie en kunnen geanalyseerd worden voor verschillende doeleinden,
zoals het identificeren van trends in klantinteracties.
2