Wat houdt Big Data in?
Big Data verwijst naar onze mogelijkheden om gebruik te maken van de steeds toenemende hoeveelheid
data en deze te analyseren. Er is geen vaste definitie van het begrip ‘Big Data’, maar je kunt het eigenlijk
zien als een grote hoeveelheid aan digitale datasets welke te groot zijn om in een reguliere database op
te kunnen slaan en te onderhouden.
Om een duidelijker beeld te vormen van Big Data, ga ik nu een aantal factoren van Big Data toelichten
met behulp van de 5 v’s.
Volume
Het eerste kenmerk van Big Data is Volume. Dit kenmerk is het meest voor de hand liggend en hier
denken mensen vaak als eerste aan als het gaat om big data. Het volume gaat vooral om de relatie
tussen omvang en verwerkingscapaciteit. Het aantal gegevens dat bedrijven opslaat in big data sets blijft
toenemen en daarom wordt de ICT-capaciteit voor opslag en verwerking van deze gegevens ook steeds
groter.
Variety
Dit omschrijft de grote verscheidenheid aan gegevens die opgeslagen worden en nog moeten worden
verwerkt en geanalyseerd. Nieuwe soorten gegevens van bijvoorbeeld sociale netwerken en mobiele
apparatuur komen erbij, naast de al bestaande soorten gestructureerde informatie. Er is een groot
verschil tussen gestructureerde en ongestructureerde informatie. Er is sprake van gestructureerde
informatie als gegevens geordend en eenvoudig traceerbaar opgeslagen zijn in een database, denk
hierbij aan een Excel-bestand met alle informatie over klanten van een bedrijf. Ongestructureerde
informatie zijn bijvoorbeeld spraakopnames en hiermee zit de data dus als het ware nog ‘verstopt’ in een
bestand. Het verwerken van ongestructureerde informatie en het maken van analyses met die
informatie is dan ook veel complexer dan met gestructureerde informatie.
Velocity
Dit is een maatstaf voor de tijdelijke waarde van gegevens, big data verandert namelijk snel. Velocity
gaat over de voorwaarde dat je binnen enkele minuten of zelfs seconden data moet verwerken, zodat je
tot resultaten kan komen waarnaar je op zoek bent. Zo kan bijvoorbeeld real time beschikbare markt- en
klantinformatie gegenereerd worden.
Value
De vierde v geeft aan welke waarde je uit welke gegevens kunt halen en hoe je met big data betere
resultaten krijgt uit de opgeslagen gegevens. Toegang tot grote datasets is belangrijk en het is een goede
ontwikkeling voor analyses die bedrijven kunnen maken, maar het bedrijf heeft er uiteindelijk alleen echt
baat bij als er waarde uit gehaald wordt. Een goed voorbeeld hiervan is dat supermarkten of
kledingwinkels het aankoopgedrag van klanten opslaan in datasets, zodat er speciale aanbiedingen
gedaan kunnen worden per klant. Daardoor zullen klanten sneller nog een keer iets kopen bij hetzelfde
bedrijf en dan heeft het bedrijf dus baat bij het gebruik van de grote datasets.