1.1 Waar zijn we mee bezig?
Binnen de criminologie houden we ons bezig met empirisch onderzoek. Dit vak houden we
ons bezig met het onderdeel ‘gegevens verzamelen en analyses doen’.
Stellen van een
vraag
Resultaten
verklaren en Opstellen
conclusie trekken hypothese
Gegevens Bepalen hoe je gaat
verzamelen en onderzoeken of dat
analyses doen klopt
Data
- Er zijn twee mogelijkheden om data te analyseren:
• Beschrijvende (descriptieve) statistiek: overzichtelijk weergeven van
gegevens
• Inductieve (beslissende) statistiek: conclusies trekken uit gegevens
- Data bestaat uit elementen (personen, landen) en variabelen (kenmerken waarin
binnen de populatie verschil is)
- Er zijn 4 soorten variabelen:
• Kwalitatief:
• Nominaal = geen volgorde tussen de waarden. Bij maar twee categorieën
wordt dit ook wel dichotoom genoemd. bv. sekse
• Ordinaal = natuurlijk ordening, bv. tevredenheid, schoolcijfer
• Kwantitatief:
3) Interval = continu, geen nulpunt en mogelijk ook negatief, bv. temperatuur
4) Ratio = discreet, natuurlijke nulpunt aanwezig, bv. aantal daders, %
- Missing waardes zijn elementen waarvan we geen data hebben, maar wel coderen!
- Binnen dit vak wordt gebruik gemaakt van SPSS (data matrix). In de rijen staan de
elementen en in kolommen de variabelen.
1.2 Variabelen in beeld
Experimenteel onderzoek
- Hierbij wordt gekeken naar twee of meer groepen die verschillend worden behandeld.
De uitkomsten van beide groepen worden vergeleken om hieruit conclusies te trekken.
- In deze vorm van onderzoek wordt gebruikt gemaakt van afhankelijke en onafhankelijke
variabelen:
• Afhankelijke variabele is de variabele waarover je een voorspelling doet of de
uitkomst van je meting. Deze ga je daadwerkelijk meten.
1
, • Onafhankelijke variabele is de variabele waarvan je gaat meten of deze een
verandering veroorzaakt bij de afhankelijke variabele.
Exploratieve data-analyse
- Hierin worden grafieken en numerieke samenvattingen gebruikt om de variabelen te
beschrijven in een gegevensverzameling en de relaties tussen de variabelen.
- Het is hierbij belangrijk om de juiste grafiek te kiezen!
Kwalitatief
- Taartdiagram: vergelijking van een categorie met het geheel
- Staafdiagram: verhouding tussen verschillende categorieën
Kwantitatief
- Histogram: aaneengesloten staafdiagram.
- Stamdiagram: bestaat uit stam en blad. In de stam staan de tientallen. Cijfers in het blad
staan op numerieke volgorde.
2
,Cumulatieve frequentiepolygoon
Hierin kunnen de percentages van de populatie of steekproef worden bekeken.
Tijdsgrafiek
Deze zijn voor het weergeven van trends of veranderingen over een bepaalde tijd.
1.3 Verdelingen – centrum en spreiding
Verdelingen beschrijven
Je kan de vorm van een verdeling beschrijven op een aantal manieren:
Normaal (symmetrisch), rechtsscheef of linksscheef
Uni-, bi- of multimodaal (aantal pieken)
Uitschieters zijn waarnemingen die buiten het globale patroon vallen.
Rechts/linksscheef: de kant waar de verdeling een langere/zwaardere staart heeft.
3
, Centrummaten
Modus (score met de hoogste frequentie)
Mediaan (middelste score). Deze is ongevoelig voor uitschieters of scheve
verdelingen (resistent)
Gemiddelde. Wel gevoelig voor uitschieters of scheve verdelingen (niet resistent)
Mediaan en percentielen
- Mediaan (50e percentiel, Q2)
- 25e kwartiel (Q1, middelste eerste helft)
- 75e kwartiel (Q3, middelste tweede helft)
Hierbij zijn er vaak klassen (intervallen) gemaakt voor alle scores. Neem bijvoorbeeld een
score van 18 jaar die in het interval 16-19 jaar valt.
ll (lower limit) = exacte ondergrens van het interval (15,5 bij score 18 in interval 16-19)
n = totaal aantal scores
p = proportie van het gewenste percentiel (bv. 0,25 bij Q1)
cf = cumulatieve frequentie van het aantal mensen dat onder het interval van de score zit
(dus <16 bij een score van 18 die in het interval 16-19 valt)
fi = frequentie van het aantal scores binnen het interval (aantal scores binnen 16-19)
w = width = breedte van het interval (1 bij 18-jarigen, 4 bij 16-19 jaar)
Bij de berekening van percentielen ronden we altijd naar beneden af.
Boxplot
Hiermee kan je de vijg-getallen-samenvatting in beeld brengen (min, Q1, mediaan, Q3, max)
en wordt de spreiding van een variabele in beeld gebracht.
Interkwartielafstand
- IKA = Q3 – Q1
- Dit is een criterium om bepalen of iets een uitschieter is:
4