Module III – kwantitatief criminologisch
onderzoek
Beschrijvende versus inductieve statistiek
Beschrijvende statistiek:
We exploreren de data van onze steekproef. We kijken of we de geplande
hypothesen in onze steekproef herkennen door de data te tabelleren en
visualiseren.
Met andere woorden: vinden we een effect/verschil/verband in de
steekproef en hoe groot is dit effect/verschil/verband?
Binnen de steekproef.
- Boxplot, histogram, gemiddelden
o Verschil in getallen en grafieken
o Ongeveer en geen grote verschillen binnen de steekproeven
- Beschrijvend gaan onderzoeken
Inductieve statistiek:
Gaat een stap verder, niet binnen de steekproef, we kijken naar de
populatie.
Kunnen we de hypothesen generaliseren naar de volledige populatie? Met
andere woorden: is er een effect/verschil/verband in de populatie en hoe
groot is dit effect/verschil/verband?
- Veralgemenen naar de hele populatie
- Is het verschil significant voor de populatie (t-test)
- Wat kunnen we concluderen voor de volledige populatie?
Good research practices
Onderzoekspraktijk en zaken waar je rekening mee moet houden.
- Dataset welke analysetechniek is hier de beste om de
onderzoeksvraag te beantwoorden met deze data
Gepland versus post-hoc testen: we need a plan
- Good research practices
- Formuleer je hypothesen voor je je data bekeken hebt
o Vraag wat je gaat onderzoeken
- Geplande test versus post-hoc test
- Wat is dan de bedoeling van beschrijvende statistiek?
, o Gebruiken om verschillende assumpties van het model te
kunnen testen
- Sommige analysetechnieken houden rekening met post-hoc testen
Post-hoc test:
- Als je nog niet goed weet wat je wil onderzoeken en bevragen
- Je ziet in de beschrijvende statistieken een verschil in de steekproef,
daarop dan inductieve statistiek op loslaten
- Probleem: …
Voorwaarden checken van analysetechniek
- Groot gebrek bij vorig voorbeeld: Voorwaarden van onafankelijke
T-test niet gecontroleerd!
- Alle inductieve, parametrische methodes zijn afhankelijk van een
aantal voorwaarden omtrent verdelingsvorm, afwezigheid van
outliers, grootte van steekproeven,...
- Voor we inductieve methodes uitvoeren, moeten we alle
voorwaarden afgaan waar we aan dienen te voldoen.
- Als niet aan de voorwaarden voldaan is, mag je de resultaten niet
naar de volledige populatie generaliseren!
- Mogelijke oplossingen bij schendingen van assumpties:
o Een andere analyse-techniek gebruiken die minder afhankelijk
is van voorwaarden bvb. Niet-parametrische testen
o Transformaties van variabelen (bv een continue variabele
categoriseren)
- Voorwaarden checken essentieel Niet alle sociale onderzoekers
zijn hier rigoreus genoeg in, waardoor de kwaliteit van veel
kwan4ta4ef onderzoek in twijfel kan getrokken worden
Parametrische versus niet-parametrische testen
- Parametrische testen (bv. T-test, regressie, ANOVA) zijn vaak
onderworpen aan strenge voorwaarden, zoals afwezigheid van
outliers, homoscedasticiteit, verdelingsassumpties, minimale
groottes van steekproeven. Ze zijn ook vaak pas mogelijk vanaf een
ratio-meetniveau.
- Waarom? Deze analyse-technieken zijn numeriek – De resultaten zijn
vaak sterk afhankelijk van de aan- of afwezigheid van een paar
outliers.
Niet-parametrische testen
Probleem: Veel sociale data voldoet niet aan de assumpties waaraan
deze parametrische testen moeten voldoen.
, Oplossing: Niet-parametrische testen zijn veel minder afhankelijk van de
grote waaier aan voorwaarden.
- Waarom? Veel niet-parametrische testen werken met rangnummers,
waardoor bijvoorbeeld outliers geen grote invloed meer uitoefenen
op de analyse. Meer informatie over wat rangnummers zijn vind je
hier.
- Voordeel: Conclusies van hypothese-toetsen zijn valide en
generaliseerbaar zolang we methodes die voldoen aan de
voorwaarden van de methode die we uitvoeren.
- Nadeel: Doordat we bij niet-parametrische testen overschakelen
naar rangnummers zijn de effectgroottes niet altijd gemakkelijk
interpreteerbaar.
o Inhoudelijke interpretatie is moeilijker
o Moeilijker om verschil tussen de groepen interpreteren
Wanneer welke techniek?
Wanneer welke analyse techniek is afhankelijk van:
- Meetniveaus afhankelijke en onafhankele variabele(n)
- Type onderzoeksvraag
- Voorwaarden waaraan voldaan moet worden
Keuze statistische test:
- Er bestaan honderden soorten statistische analyses
onderzoek
Beschrijvende versus inductieve statistiek
Beschrijvende statistiek:
We exploreren de data van onze steekproef. We kijken of we de geplande
hypothesen in onze steekproef herkennen door de data te tabelleren en
visualiseren.
Met andere woorden: vinden we een effect/verschil/verband in de
steekproef en hoe groot is dit effect/verschil/verband?
Binnen de steekproef.
- Boxplot, histogram, gemiddelden
o Verschil in getallen en grafieken
o Ongeveer en geen grote verschillen binnen de steekproeven
- Beschrijvend gaan onderzoeken
Inductieve statistiek:
Gaat een stap verder, niet binnen de steekproef, we kijken naar de
populatie.
Kunnen we de hypothesen generaliseren naar de volledige populatie? Met
andere woorden: is er een effect/verschil/verband in de populatie en hoe
groot is dit effect/verschil/verband?
- Veralgemenen naar de hele populatie
- Is het verschil significant voor de populatie (t-test)
- Wat kunnen we concluderen voor de volledige populatie?
Good research practices
Onderzoekspraktijk en zaken waar je rekening mee moet houden.
- Dataset welke analysetechniek is hier de beste om de
onderzoeksvraag te beantwoorden met deze data
Gepland versus post-hoc testen: we need a plan
- Good research practices
- Formuleer je hypothesen voor je je data bekeken hebt
o Vraag wat je gaat onderzoeken
- Geplande test versus post-hoc test
- Wat is dan de bedoeling van beschrijvende statistiek?
, o Gebruiken om verschillende assumpties van het model te
kunnen testen
- Sommige analysetechnieken houden rekening met post-hoc testen
Post-hoc test:
- Als je nog niet goed weet wat je wil onderzoeken en bevragen
- Je ziet in de beschrijvende statistieken een verschil in de steekproef,
daarop dan inductieve statistiek op loslaten
- Probleem: …
Voorwaarden checken van analysetechniek
- Groot gebrek bij vorig voorbeeld: Voorwaarden van onafankelijke
T-test niet gecontroleerd!
- Alle inductieve, parametrische methodes zijn afhankelijk van een
aantal voorwaarden omtrent verdelingsvorm, afwezigheid van
outliers, grootte van steekproeven,...
- Voor we inductieve methodes uitvoeren, moeten we alle
voorwaarden afgaan waar we aan dienen te voldoen.
- Als niet aan de voorwaarden voldaan is, mag je de resultaten niet
naar de volledige populatie generaliseren!
- Mogelijke oplossingen bij schendingen van assumpties:
o Een andere analyse-techniek gebruiken die minder afhankelijk
is van voorwaarden bvb. Niet-parametrische testen
o Transformaties van variabelen (bv een continue variabele
categoriseren)
- Voorwaarden checken essentieel Niet alle sociale onderzoekers
zijn hier rigoreus genoeg in, waardoor de kwaliteit van veel
kwan4ta4ef onderzoek in twijfel kan getrokken worden
Parametrische versus niet-parametrische testen
- Parametrische testen (bv. T-test, regressie, ANOVA) zijn vaak
onderworpen aan strenge voorwaarden, zoals afwezigheid van
outliers, homoscedasticiteit, verdelingsassumpties, minimale
groottes van steekproeven. Ze zijn ook vaak pas mogelijk vanaf een
ratio-meetniveau.
- Waarom? Deze analyse-technieken zijn numeriek – De resultaten zijn
vaak sterk afhankelijk van de aan- of afwezigheid van een paar
outliers.
Niet-parametrische testen
Probleem: Veel sociale data voldoet niet aan de assumpties waaraan
deze parametrische testen moeten voldoen.
, Oplossing: Niet-parametrische testen zijn veel minder afhankelijk van de
grote waaier aan voorwaarden.
- Waarom? Veel niet-parametrische testen werken met rangnummers,
waardoor bijvoorbeeld outliers geen grote invloed meer uitoefenen
op de analyse. Meer informatie over wat rangnummers zijn vind je
hier.
- Voordeel: Conclusies van hypothese-toetsen zijn valide en
generaliseerbaar zolang we methodes die voldoen aan de
voorwaarden van de methode die we uitvoeren.
- Nadeel: Doordat we bij niet-parametrische testen overschakelen
naar rangnummers zijn de effectgroottes niet altijd gemakkelijk
interpreteerbaar.
o Inhoudelijke interpretatie is moeilijker
o Moeilijker om verschil tussen de groepen interpreteren
Wanneer welke techniek?
Wanneer welke analyse techniek is afhankelijk van:
- Meetniveaus afhankelijke en onafhankele variabele(n)
- Type onderzoeksvraag
- Voorwaarden waaraan voldaan moet worden
Keuze statistische test:
- Er bestaan honderden soorten statistische analyses