METHODE VOOR CRIMINOLOGISCHE
ONDERZOEK
Inleiding
Gebaseerd op het verzamelwerk: Hardyns, W., & Snaphaan, T. (Eds.). (2020). Big data en innovatieve methoden
voor criminologisch onderzoek. Boom.
Disclaimer: Niet alle details uit de hoofdstukken komen aan bod in deze presentatie (enkel wat essentieel is om te
onthouden). Tip: lees de hoofdstukken om de essentie makkelijker te begrijpen
Sommige hoofdstukken worden in totaliteit niet behandeld: H5 en H6
Hoofdstuk 1: Nieuwe technologieën als motor voor innovaties in
criminologisch onderzoek
1. Inleiding
In dit boek is het de bedoeling om de studente, academici, geïnteresseerde, ... te introduceren met het gebruik van
big data & innovatieve methoden voor criminologisch onderzoek. Het is belangrijk om het methodologisch
instrumentarium van een criminoloog niet te beperken tot enkel de gekende soorten kwantitatieve & kwalitatieve
methode.
Belangrijke uitspraak in dit kader was van Abraham Harlow: “If the only tool you have is a hammer, you tend to see
every problem as a nail”. Wanneer je dus niet op de hoogte bent van de bestaande methode of enkel een deel
daarvan kan je nooit een beredeneerd keuze maken voor de meest passende methode. Het is belangrijk om te weten
welke methoden allemaal bestaan voor later onderzoek, ander heb je een zekere vorm van bias in je keuzes.
Bushway en Weisburd merken op dat de sociale wetenschappen geconfronteerd worden met een voortdurende
uitdaging om methoden te importeren, introspecteren en innoveren opdat we in staat zijn om onderzoeksvragen te
beantwoorden.
(1) Importeren = Noodzaak om methoden te ontlenen uit andere disciplines aangezien criminologie van
nature een interdisciplinaire wetenschap is zonder eigen methode. In de criminologie gebruikt men inzichten
& methoden uit verschillende disciplines.
(2) Introspectie = zelfreflectie over de gebruikte methode
(3) Innovatie = Nieuwe methoden ontwikkelen, want methodologische innovaties leiden tot nieuwe
inzichten. We moeten inspelen op de “big data”, want de opkomst van big data breidt de set van beschikbare
databronnen uit
Dit boek behandelt 2 belangrijke academische ontwikkelingen in de criminologie, namelijk
(1) Gebruik van big-data-analysemethoden: Dit betekent dat criminologen steeds vaker grote hoeveelheden
gegevens analyseren met behulp van technologie, zoals algoritmes en geavanceerde software.
Grootste uitdaging hierbij is dat bij deze nieuwe/innovatieve methoden andere competenties &
vaardigheden vragen (algoritmes denken, werken met technologie,…)
(2) Uitdaging om disciplines bijeen te brengen: om al deze verschillende vakgebieden op een goede manier samen
te brengen, zodat ze elkaar versterken in het onderzoek.
De criminoloog van morgen is maar zo sterk als het instrumentarium waarover hij/zij beschikt
1
, o Want: criminologen moeten over andere competenties en vaardigheden beschikken omwille van de
verscheidenheid aan innovatie methoden
Methodologisch onderwijs als basis ontbreken handboek vergemakkelijkt de inbedding niet
2. De 4de industriële revolutie en nieuwe technologieën
De evoluties op vlak van dataverzameling en -analyse hangen samen met de technologische vooruitgang. Vandaag de
dag bevinden we ons in de zogenaamde 4de industriële revolutie, die een DATA-explosie met zich meebrengt
(opkomst van big data)
De vorige 3 revoluties waren voornamelijk gekenmerkt door een vooruitgang in technologie
1ste industriële revolutie: Ijzer & textiel industrie ontwikkelt, & de opkomst van stoommachine
2de industriële revolutie: Ontwikkeling van staal, olie, elektriciteit. heeft gezorgd voor volgende technologie:
telefoon, gloeilamp, verbrandingsmotor
3de industriële revolutie: ook wel “digitale revolutie” genoemd, wordt gekenmerkt door ontwikkeling van PC,
internet, …
4de industriële revolutie: Hierbij wordt vooral verder gebouwd op de “digitale revolutie”, om manieren te
vinden om technologie te verfijnen, & implementeren/gebruiken (Artificiële intelligentie, 3D printen,
Robotica,…), miljarden mensen maken gebruik van technologieën uit de digitale revolutie & de 4de revolutie
wat een enorm instroom is aan data, hierdoor spreken we van een data-explosie!!!! We spreken niet langer
van “data”, maar “big data”!
3. Data
Onder invloed van nieuwe technologieën wordt veel meer data gegeneerd, belangrijk wel is het feit dat DATA
eigenlijk de bouwsteen is van kennis & informatie… Je kan “Data” zien als een bron van informatie die je gaat
gebruiken in uw onderzoek meestal
De kennispiramide
De DIKW-piramide is een model dat laat zien hoe gegevens (data) worden omgezet in bruikbare kennis en wijsheid.
Dit is een eenvoudig model om een complexer onderwerp te begrijpen, dus handig voor data-analysen, omdat de
DIKW Pyramid gebruikt wordt om een bepaald begrip te helpen verklaren. Terwijl we door de evolutie gaan van het
werken met data om het om te zetten in informatie, kennis en uiteindelijk wijsheid… op deze manier ontwikkelen we
een beter begrip van de structurele en functionele relaties tussen data en wijsheid. De piramide bestaat uit vier
lagen:
(1) Data = data een vereenvoudigde weergave van de werkelijkheid is.
Data is zeer overvloedig, maar het is ook relatief betekenisloos
o Data bestaat simpelweg uit ruwe waarden of metingen
Wanneer we data verzamelen, nemen we niet alles mee wat er in de echte wereld gebeurt. We kiezen alleen
specifieke aspecten die we belangrijk vinden om vast te leggen. Dit proces noemen we abstractie en
reductie:
2
, o Abstractie: We richten ons alleen op wat relevant is en laten de rest weg.
o Reductie: We vertalen iets complex (de echte wereld) naar iets eenvoudigs en meetbaars (data).
(2) Information = De ruwe data moet geordend & georganiseerd worden, waardoor je betekenis kan geven aan de
verzamelde data (verbanden leggen)
Informatie bestaat uit data met de toevoeging van context
o Context is aanvullende data die betekenis geeft aan de oorspronkelijke dataset
Dit kan informatie zijn zoals wie, wat, wanneer en waar
Merk op dat data en informatie vaak objectief zijn in aard
(3) Knowledge = Door informatie te analyseren & interpreteren komen we tot kennis
Kennis is informatie met de toevoeging van ervaring
o Ervaring kan uit de tweede hand worden verzameld door boeken te bestuderen
o Ervaring wordt ook uit de eerste hand verzameld door levens- en werkervaringen
Met kennis nemen we een subjectieve expertise op, aangezien verschillende mensen verschillende
ervaringen zullen hebben om hun begrip van informatie vorm te geven
(4) Wijsheid of toegepaste kennis = wanneer we kennis effectief gaan gebruiken of toepassen
Wijsheid is kennis plus de toevoeging van actie, want het bepaalt wat we wel of niet doen
Wijsheid is ook subjectief, omdat het afhangt van onze interpretatie van voorkennis
o Wanneer we een stap terug doen en de hele piramide opnieuw evalueren, dan zien we een andere
trend die de niveaus scheidt
Gegevens, informatie en kennis zijn vastgelegd in het verleden (terugkijken naar verleden)
Wijsheid anderzijds wordt gebruikt om vooruit te kijken (vooruitkijken naar toekomst)
o Naarmate je hoger op in de piramide komt, zal je ook merken dat elk niveau meer waarde heeft dan
het niveau ervoor… het omgekeerde daarvan is dat naarmate je lager in de piramide komt, de
betekenis ervan afneemt
o Bv. informatie is waardevoller dan data, omdat data minder betekenis hebben dan informatie en
context onderscheidt informatie van data soorten
Soorten data
(1) Kwalitatieve & kwantitatieve data
Kwalitatieve data = ALLE niet-numerieke data (tekst, foto, video’s, geluid,…)
Kwantitatieve data = Numerieke data (cijfers 4 meetniveau ’s)
o Nominale variabelen (categorisch) = Hierbij heb je categorieën, maar kun je er GEEN volgorde in
vinden
Vb. haarkleur: blond, bruin, ros, …
o Ordinale variabelen (categorisch) = Dit zijn ook categorieën maar je ka hier WEL een volgorde in
vinden: (bv opleidingsniveau: laag-midden-hoog)
o Intervalvariabelen (metrisch) = Dit zijn variabelen/kenmerken (getallen, want metrisch niveau)
waarbij NUL/0 niet echt nul is, men kan onder nul gaan
Vb. Temperatuur (- 7°) , geboortejaar (500 V.C), …
o Ratiovariabelen (metrisch): Variabele (metrisch niveau/getal) waarbij er een ABSOLUUT nulpunt is,
Vb. leeftijd, gewicht, afstand,…
(2) Primaire, secundaire & tertiaire data
Primaire data = data wordt gebruikt in een onderzoek, dat ook verzameld is door de onderzoeker zelf
3
, Secundaire data = data dat wordt gebruikt door een onderzoeker, maar is verzameld door een andere
onderzoeker in een andere studie
Tertiaire data = soort van samenvatting/verwering van primaire & secundaire data
(3) Made & found data (hoofdstuk 4):
Je kan naar data kijken op vlak v/d aard v/d creatie. Data kunnen worden gemaakt en gevonden
o (!) Onderscheid me primaire & secundaire data: Bij primaire & secundaire data wordt er gekeken
vanuit het perspectief van de onderzoek die de data op dat moment gebruikt, terwijl bij made &
found data wordt er gekeken vanwaar dat de data initieel komt!
(4) Index-, attribuut- & metadata
Indexdata = Dit zijn gegevens die gebruikt worden om iets of iemand uniek te identificeren en aan andere
gegevens te koppelen, het zijn unieke identificatoren
o Vb. Studentennummer, is voor iedereen iets anders & kan worden gebruikt om iets of iemand te
identificeren
Attribuutdata (attribuut = kenmerk): Dit zijn gegevens die iets beschrijven, maar die niet uniek zijn of niet
gebruikt worden om te koppelen
o Vb. Het geslacht van een student (man/vrouw)
Metadata: Metadata betekent "data over data" en helpt om gegevens beter te begrijpen en te organiseren.
Er zijn drie soorten:
o Beschrijvende metadata: Gebruikt om data te verkennen en informatie op te zoeken of om
informatie makkelijk te vinden
Voorbeeld: Een burgerservicenummer (BSN) of rijksregisternummer.
o Structurele metadata: Legt vast hoe de data intern in elkaar zit en welke regels gelden.
Voorbeeld: Leeftijd moet een heel getal zijn tussen 0 en 120.
o Administratieve metadata: Geeft informatie over het databestand zelf.
Voorbeeld: Het bestand is een Excel-bestand (.xls) van 250 MB groot.
(5) Gestructureerde, semigestructureerde & ongestructureerde data
Gestructureerd; Dit zijn gegevens die netjes in een vast formaat staan, zoals rijen en kolommen. Ze zijn
makkelijk te analyseren.
o Voorbeeld: Een Excel-bestand met een tabel waarin namen, leeftijden en adressen staan.
Semigestructureerd: Dit zijn gegevens met een beetje structuur, maar ze hebben geen vast formaat zoals een
tabel. Daardoor zijn ze lastiger te analyseren.
o Voorbeeld: E-mails (met een onderwerp, afzender en tekst) of webpagina's met XML-tags.
Ongestructureerd: Gegevens zonder enige structuur of vast formaat, wat het analyseren moeilijk maakt.
o Voorbeeld: Foto’s, video's of teksten zoals open antwoorden in een enquête.
(6) Primitieve & niet-primitieve data
Primitieve data: Dit zijn de simpelste soorten gegevens die een computer direct kan gebruiken. Denk aan de
bouwstenen van data.
o Voorbeelden:
Hele getallen (bijv. 5, 10)
Kommagetallen (bijv. 3.14)
Letters of symbolen (bijv. "A" of "!")
Waar/niet-waar waarden (bijv. True of False)
Niet-primitieve data: Dit zijn meer complexe gegevens die je zelf kunt maken door primitieve data te
combineren.
4