100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
Samenvatting

Samenvatting Methodologie deel 3: kwantitatief deel (Stefaan Pleysier) (GESLAAGD eerste zit)

Beoordeling
-
Verkocht
-
Pagina's
46
Geüpload op
31-05-2025
Geschreven in
2024/2025

Deze samenvatting bevat alle nodige kennis voor het examen. Er staan heel veel voorbeelden in zodat alles makkelijk te begrijpen is. Veel staat in volzinnen geschreven, dit vind ik veel beter om het kwantitatieve deel te begrijpen. Als je deze samenvatting helemaal kent zal je zeker slagen op het examen!! SUCCES

Meer zien Lees minder















Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Documentinformatie

Geüpload op
31 mei 2025
Aantal pagina's
46
Geschreven in
2024/2025
Type
Samenvatting

Voorbeeld van de inhoud

Methodologie 3: kwantitatief
Deel 1: introductie




De constructie van variabelen

• Vóór dataverzameling (methodologie deel 2)
o ~ van concepten naar (enquête)vragen en items gaan: operationaliseren

• Na dataverzameling
o ~ van antwoorden op een vraag naar variabelen (in ons databestand)
▪ Soms: variabelen = antwoorden (codes) op enquêtevragen
▪ Soms: variabelen via hercoderen van enquêtevragen (je wilt de leeftijd weten, maar je gaat
vragen naar het geboortejaar)
▪ Soms: enquêtevragen samennemen tot schalen om abstracte concepten (vb. Anomie,
onveiligheid …) te meten = schaalconstructie
• Van literatuur, concepten die samenhangen naar concrete vragen die we voorleggen aan respondenten →
enquêtes afgenomen, data verzamelt → op zoek naar antwoorden op onze onderzoeksvragen,
kwantitatieve gegevens naar variabelen omzetten die antwoord moeten bieden
• Kan eenvoudig (vb. Leeftijd, 1 vraag genoeg, makkelijke variabele waarmee je aan de slag kan vb.
Geboortejaar) maar kan ook complex (hoe gaan we abstractere vagere vertalen in concrete vragen, nu hoe
kunnen we van de antwoorden naar zinvolle variabelen gaan waarmee we aan de slag kunnen)
• Enquête vragen samen nemen tot schalen (vb. Anomie onvh, hoe samen nemen en verwerken in het
kader van de analyse)

Het coderen aan de hand van schalen
• Van vragenlijst via codeboek naar databestand
o Bijkomende illustraties:
▪ Veiligheidsmonitor: vragenlijst met module buurtproblemen, mijdgedrag, risico-inschatting,
politie functioneren……
▪ SCV survey: overzicht vragen en codeboek
▪ ESS: ‘main questionnaire’ en ‘data protocol’
▪ JOP-monitor: technisch verslag

,Het coderen aan de hand van schalen
• Van vragenlijst via codeboek naar databestand
o Illustratie: mijdgedrag in de VM (v57 t.e.m. V60) → V: variabelen (kolommen)
• Vraag bevat meer informatie om die antwoorden weg te schrijven in het databestand
• Er staat een nummer bij de vraag: zal in databestand terugkomen om te weten bij welke vraag je zit
• Ook bij antwoorden zal een nummer staan (bv. 3 → verwijst naar soms)




• Mijdingsgedrag wordt bevraagd in verschillende vragen vb. In verschillende situaties (thuis, op school, enz.)
Operationaliseert het concept op een complexere manier en wordt mijdgedrag in de vragenlijst a.d.h.v. 4
verschillende vragen in de vragenlijst geplaatst




• 8: wordt mee opgenomen maar wordt niet altijd voorgelezen
• Meestal worden de eerste 5 voorgelezen
• We geven de optie dus is het belangrijk dat we het in het codeboek opnemen nl 8 vb.
• Ingevuld databestand SPSS bestand hoe het eruit ziet:




Stap 1: bevragen
Stap 2: data – entry in SPSS
o Belang van CATI, CASI, etc. …
o Cf. Websurveys via Limesurvey, Qualtrics …
o Hoe data verzameld?
o → online: dan komen de antwoorden meteen in je databestand, daar vervalt de data entry
vaak, gaat veel sneller (wel eerst grondig bekijken voordat je jou analyse kunt doen, opkuisen
‘data cleaning’)
o → papier is anders: dan moet je zelf alles nog invullen, duurt veel trager, papieren in scholen
(vragenlijsten) die moesten in het databestand gezet worden, dus lange data-entry, zelf nog
ingeven, alleen maar codes ingeven in het SPSS invullen.

, Stap 3: data cleaning en analyse
o Respondent (rij) kan alleen maar mogelijke antwoorden geven (vb. Bolletje aanduiden), wanneer je
klassikaal data aflegt, kan er onduidelijkheden opkomen waar je ook oplossing zal voor moeten
vinden tijdens het coderen
o Op papier kan het zijn dat respondenten 2 bolletjes aanduidt, onduidelijk ingekleurde bollen
o Op missing plaatsen of iets anders?
o => Data cleaning (moet uitgebreider gebeuren als je met papieren vragenlijsten de enquêtes hebt
afgenomen)

• Coderen: bijkomende punten en samenvattende regels
o Overzichtelijke vragenlijst (genummerd)
▪ Om eventuele fouten te herstellen
o Duidelijk en consequent codeboek (‘veldcoderen’ uitsluiten)
▪ Veld: op moment zelf een beslissing nemen die een fout maakt (vb. stel er is iemand die
weet niet antwoord en je hebt er geen afspraken over gemaakt in je codeboek = wat ga je er
dan mee doen? → Oplossing verzinnen, maar beter om vooraf af te spreken om die vb code
7 te geven. Als 7 al een reëel antwoord is dan 77)
▪ Belangrijk om voor iedereen dezelfde afspraken te maken en te volgen
Zie hier ‘MIDDELEN PENSIOENEN WAARBORGEN
VOORKEUR: is een label dat voor verduidelijking
kan zorgen.




o Afspraken voor ‘weet niet’ (7, 77…), ‘geen antwoord’ (8, 88…), ‘niet van toepassing’ (9, 99…): zie bv.
Codeboek SCV survey
o Afspraken voor filtervragen (JA slaag de volgende 3 vragen over, … wat als het fout gaat, telkens op
de zelfde manier doen, afspraken maken hierrond)
o Afspraken voor onduidelijke antwoorden (2 bolletjes inkleuren vb) → hoe rechtzetten als je eerst
het foute bolletje had ingekleurd, maar toch een ander antwoord wilt geven, hier afspraken rond
maken (zoals op het examen).
o Afspraken verwerking meerdere antwoordmogelijkheden (meestal wel of niet voorzien, ook aan
respondent aangeven, indien meerdere antwoorden wanneer maar 1 gevraagd wordt = aanpak
vooraf afspreken
o Data-entry
▪ SPSS format opmaken (sluit fouten in het coderen uit): 55 ipv. 5 ingeven, dan zal er een fout
melding komen omdat de antwoordmogelijkheden enkel 1-5 was.
▪ Input met twee: iemand leest voor en iemand vult in (is goed, positief)
▪ Voordeel van websurvey (bv. Qualtrics) of CASI/CATI/…
o Data-cleaning (ook nog steeds bij online)
▪ Check: frequentietabellen
▪ Check filtervragen
▪ Maakt kans op fouten kleiner maar tijdrovend
▪ Cleaning: wat je nadien doet, of je onmiddellijk een bestand hebt, ga je meteen met analyse
starten? Maar soms wordt het ook gedaan dat je eerst het databestand eens grondig bekijkt
• Vb. Frequentievariabelen op te vragen om te kijken of er geen fouten zichtbaar zijn
• Vb. 55 ipv 5 door te snel in te geven
• Een 1 ipv 2 = deze fout haal je er niet makkelijk uit dus vaak handig om dit met 2 te
doen

,Stap 4: inleiding Multivariate analyse
• Rol van statistiek?
o Beschrijvende statistiek: frequenties, tabellen, grafieken …
o Inferentiële statistiek
▪ Modelleren van onzekerheid
▪ ‘Hoe waarschijnlijk is een resultaat onder een bepaalde veronderstelling van de
werkelijkheid
• Een voorbeeld…
o Onderzoeksvraag: Verschilt het onveiligheidsgevoel tussen mannen en vrouwen?
o Conceptualisering, operationalisering, steekproeftrekking, dataverzameling…
o Analyse: onveiligheidsgevoel vrouwen > onveiligheidsgevoel mannen (steekproef!)
o ‘hoe groot is de kans dat vrouwen zich onveiliger voelen dan mannen (steekproef), wanneer we
veronderstellen dat geslacht en onveiligheidsgevoelens niet samenhangen (nulhypothese)’
▪ H0: onveiligheidsgevoel vrouwen = onveiligheidsgevoel mannen
▪ Ha: onveiligheidsgevoel vrouwen ≠ onveiligheidsgevoel mannen
▪ Nulhypothese: er is geen samenhang, geen verschil, geen correlatie tussen 2 variabelen
▪ In steekproef zien we dat er wel een verschil is, hoe groter het verschil hoe meer druk op de
0 hypothese
▪ T waarde wordt groter als het verschil dat we vinden in de steekproef tussen mannen en
vrouwen groter wordt i.v.m. de nulhypothese
▪ Op bepaald moment is het zo groot verschil dat het niet plausibel is dus gaan we de 0
hypothese verwerpen
▪ Gebeurt sneller bij grotere steekproef omdat die dichter aanleunt bij de populatie
▪ P waarde: probabiliteit, kans (percentage) = bij conventie: de kans dat die T waarde
aantreffen onder onze 0 hypothese, kleiner wordt dan 5%
• (Grenswaarde), dan verwerpen we de 0 hypothese (omdat de kans dat we dat gaan
aantreffen in onze steekproef zo klein is dat we het niet meer waarschijnlijkheid
achten) en gaan we verder met de alternatieve hypothese

• Analyse in het criminologische domein
o Bedreigingen voor validiteit en betrouwbaarheid
o Probleem bij steekproeftrekking, contactname en uitvoering onderzoek
▪ ~ verborgen populaties, geen steekproefkader
▪ ~ non respons, bedreigende vragen, sociale wenselijkheid
▪ Omdat we vaker geconfronteerd worden met bedreigingen = verborgen populaties (vb.
rondtrekkende inbreekbendes = er is geen steekproefkader hiervan), vaker non respons
▪ Hebben ze toevallig niet geantwoord, zijn ze dader/slachtoffer waardoor ze het niet willen
vertellen? Rekening mee houden
o Probleem van de verdeling van de data
▪ ~ normale vs. scheve verdelingen




- Vragen hoe vaak ze zelf criminaliteit hebben gepleegd = vaak links die eruitzien
- Veel mensen die het nooit gedaan hebben en zakt naar hoeveelheid
- Het is zeker niet een mooie normale verdeling

, - Op zoek gaan naar geavanceerde technieken = hier negatief bi mediale verdeling
- = Proxy variabelen die wel min of meer normaal verdeeld zijn
- Links delinquentie en rechts de tolerantie tav delinquentie (hoe erg vind je dat dit gebeurt) =
delinquentietolerantie is een proxy van delinquentie (als ze tolerant zijn tav delinquentie gaan ze
makkelijker zelf criminaliteit plegen) maar het is een ander antwoord, ook al hangen ze samen op
zoek gaan naar creatieve oplossingen

5. Introductie
• Univariate, bivariate en multivariate technieken
• Univariaat
o ~ één variabele (betrekken)
o ~ eenvoudige descriptieve maten
o ~ maten voor centrale tendentie, spreiding, gemiddelde, …
• Bivariaat (zoals voorbeeld hierboven)
o ~ twee variabelen
o ~ verband, verschil, samenhang, correlatie
o ~ bv. verband tussen geslacht en onveiligheidsgevoelens
• Multivariaat
o ~ 3 of meer variabelen (door meerdere variabelen verklaard → kans op recidive, door meerdere
factoren verklaard, niet door 1 factor)
o ~ geïntegreerde analyse
o ~ tal van mogelijkheden/beperkingen…
• Keuze van de analysetechniek
o Hangt af van wat we willen doen
o Keuze tussen eenvoudige samenhang tussen 2 variabelen en vb een
analyse die causaliteit veronderstelt waar er gesproken wordt van
een afhankelijke (voorspelt of verklaart) en een onafhankelijke
variabele
o Voorspelling vs. Samenhang
▪ ~ symmetrisch: samenhang, verband, correlatie…
▪ Een of meerdere variabelen die samenhangen met elkaar (Pearsons correlatie; cijfers die
uitdrukking heeft over de samenhang, maar zegt niets over het feit dat de ene var de
andere verklaart dit is asymmetrisch)
▪ ~ asymmetrisch: afhankelijk/onafhankelijke variabelen, invloed, effect, predictie…
(causaliteit (?))
▪ Asymmetrisch: onafhankelijke en afhankelijke variabele definiëren en ook andere
analysetechnieken inzetten die wat meer causaliteit veronderstellen. Opletten en zeker
bij crossectionale data met het doen van uitspraken (H4 metho 2)

• Meetniveau van de variabelen
o ~ nominaal, ordinaal, metrisch
o ~ meten = toekennen van getallen aan waarnemingen
o Moet goed kunnen inschatten, wanneer je het niet weet: kan toepassen op juiste variabele, want
we hebben andere technieken nodig bij het meten ervan

• Meetniveau van de variabelen
o Nominaal (geslacht)
▪ Indeling in klassen, categorieën
▪ Getallen zonder functie
▪ Label
o Ordinaal (stellingen, de linkerd antwoord schaal) → van helemaal eens tot helemaal oneens
▪ Ordening, rangorde
▪ Getallen weerspiegelen rangorde

, ▪ Arbitrair (1,2,3,4 en 5)
o Interval (vb. temperatuur)
▪ Verhoudingen van verschillen tussen metingen zijn zinvol
▪ Geen vast nulpunt
o Ratio (vb. prijs)
▪ Verhouding van metingen liggen vast
▪ Vast nulpunt
o Absoluut (delinquentie)
▪ Informatie is ‘absoluut’
▪ Bv. Frequentietellingen
▪ Absoluut: vaak frequentietabellen
o Dichotome variabelen
▪ Twee categorieën
▪ Bv. Ja/nee, aanwezig/afwezig
▪ Binaire of dummy codering (1 of 0)
▪ ‘speciaal geval’
▪ Dichotome: nominale vb. geslacht (1 en 2) maar kan ook dichotoom om ze binair te coderen
als 0-1, aanwezigheid of afwezigheid van bepaalde kenmerk is nominaal maar kunnen er
toch analysetechnieken op toepassen
• Vb. Vrouwen 0 en mannen 1 en daarna een gemiddelde berekenen op nominale
variabelen (uitzonderlijk) hier mogelijk omdat het dichotome een percentage geeft
vb. 0,60 = 60% zijn mannen
▪ Belangrijk in kader van regressietheorie, hier mogen we normaal geen nominale variabelen
in de analyse betrekken maar het is een uitzondering (binair gecodeerde dichotome
variabele)

• Meetniveau van de variabelen (!)
o Belang voor de analyse!
▪ Keuze van de analysetechniek
▪ Hoe hoger het meetniveau hoe meer informatie in de variabele aanwezig is, hoe statistischer
ze kunnen worden toegepast
▪ Hoe hoger het meetniveau, hoe meer informatie besloten in de metingen
▪ Interval, ratio en absolute metingen: metrische variabelen
• (parametrische analyses; volgen een bepaalde verdeling)
▪ Nominaal en ordinaal: categorische variabelen
• (niet parametrische analyses, niet volgens een bepaalde verdeling)

• Afhankelijke en onafhankelijke variabelen (geslacht en agressief gedrag vb.)
o Vb. geslacht (onafhankelijke) en onveiligheidsgevoelens (afhankelijke)?
▪ U onveiligheidsgevoel kan nooit u geslacht bepalen, maar wel omgekeerd
o Leeftijd?
o Perceptie van de buurt?
o …
• Intermediaire variabelen: die zowel afhankelijk als onafhankelijk zijn bij multivariaat (want daar heb je 3 of
meer variabelen)

, Deel 2: Beschrijvende en inferentiële statistiek


A. DATA CLEANING
A. Fouten in het bestand
i. In oorspronkelijke vragenlijst
ii. Bij ingeven
iii. (voordeel van CAS/T/P/I of web-based afname)
iv. Tijdens proces van data cleaning kunnen nog fouten tijdens het ingeven opgelost worden
v. Probleem is minder groot doordat we met computerondersteunde dataverzameling werken
<-> data entry (op papier ofzo)
B. Controleren op onmogelijke (combinatie van) antwoorden
i. Vb. Frequentietabellen op te vragen van alle variabelen en kijken of er geen rare
antwoorden zijn
ii. Vb. Kruistabellen: kunnen op het spoor zetten van onmogelijke combinaties van antwoorden
vb. Iemand geeft aan tegelijkertijd thuis te wonen en via andere var merk je op dat hij niet
langer thuis woont
iii. Of vb. Persoon is 16 jaar en in latere variabele geeft hij aan al een rijbewijs te hebben
iv. Detectie van outliers (cf. Figuur 5.2) → kan groot effect hebben op data-analyses
1. Univariate outlier (extreme waarde op 1 variabele)
2. Bivariate outlier (outlier op de combinatie van de 2 variabele, dus univariaat is geen
probleem, maar vanaf we de combinatie van de 2 zien is het wel een probleem)
3. Outliers: waarden die afwijken van de normale waarden dat respondenten hebben
gegeven op die vragen, waarde die in principe onmogelijk is
i Frequentietabellen voor alle variabelen opvragen
ii Kruistabellen ~ crosstabs
1. Scatterplot of puntenwolk (soms opvragen, bij metrisch): visueel zie je de extreme
waarden, moet u alarmeren in uw analyse
i Onmogelijke combinaties (cf. zwangere opa’s)
ii Outliers: verwijderen of meenemen?
1. Beste suggestie: analyse 2x te draaien 1keer met en 1keer zonder outlier en de
resultaten bekijken

, - Je ziet x en y as en daarop staan de scores van respondenten op variabele x en variabele y
- Wanneer je in het eerste geval kijkt naar figuur A dan is er een outlier, maar in principe is dat geen univariate
want als je kijkt naar x is dat een lage waarde maar niet lager dan andere waarden die geregistreerd zijn
- Kijk je naar y dan is de outlier ook niet een univariate: het is een hoge score, maar niet opvallend hoger dan
de andere hoge waarden op y
- In combi van x en y (bivariaat) is er sprake van een outlier, een extreme waarde (rechtsboven) = zowel uni als
bivariaat: als op variabele x en op variabele y is er duidelijk sprake van een extreme waarde
- Kan effect hebben op uw analyses, niet in alle gevallen
- Leverage: hefboom, hefboomeffect: in figuur A klopt dat, je ziet dat het patroon
V.d. Antwoorden niet verstoord wordt door de outlier: doordat men een regressielijn doortrekt en die w niet
beïnvloedt (correlatieanalyse, het is bivariaat), hier maakt het niet veel uit wat je met die bivariate outlier
doet, neem je ze mee of niet of het heeft geen groot effect op analyses. Ook bij B ook geen hefboomeffect
omdat die extreme outlier in het verlengde ligt van de relatie die er bestaat tussen die 2 variabelen
- B: ligt in het verlengde van de voorspelling, wel gevaarlijk als je het gemiddelde gaat berekenen!!!
- Onderaan wel het geval, sprake van een univariate outlier, niet op Y maar op X, in de twee gevallen is er wel
een effect vb. In C: correlatie tussen puntenwolk (volle lijn) als outlier in analyse w opgenomen wordt die lijn
verstoord en zal ze er anders uitzien (stippellijn) . Hangt af van puntenwolk, als de steekproef hoger zou zijn,
zal het hefboomeffect kleiner zijn. Dus de hefboom wordt scheef getrokken.
- D: je kan concluderen tot een tegenovergestelde correlatie, een negatieve samenhang tussen x en y; op het
moment dat je de outlier meeneemt in de analyse, kantelt die lijn en is er plots een positieve correlatie, wat
vreemd is want alle andere zijn negatief

B. MISSING VALUES (DIEGENE DIE DE VRAGENLIJST HEBBEN INGEVULD , MAAR NIET OP ALLES HEBBEN GEANTWOORD )
a. Ontbreken van antwoorden
• In vragenlijst enkele bedreigende vragen opgenomen = dan ligt daar missing values soms
hoger, niet werkelijke antwoorden kan ook (vaker nee antwoorden vb., onderrapportage
enz), gevoeligere vragen ook meer missing values
• Functioneren van politie heeft effect op terugdringen van criminaliteit = kennisvraag = vaker
weet niet antwoorden
• Uw statistische power zal kan besluiten wanneer je op zoek gaat naar variabele, kans is
kleiner als een groot aantal deel van de steekproef wegvallen omdat ze niet antwoorden op
de vraag
b. Twee strategieën bij ontbrekende waarden
(1) ‘niets doen’
• Listwise deletion (gaan ervanuit dat steekproef voldoende groot is om die uitvallers op te
vangen), dus wordt dit meteen toegepast (bv. de 15 die niet hebben geantwoord worden
niet meegerekend bij de analyse)
• Vertekening in de data (niet altijd, maar zeker wel bij → zie 3)
• Zeker bij multivariate analyse: kleinere N, verlies van power
1. In bivariate en multivariate analyses: zijn het soms dezelfde soms andere
respondenten die missing values hebben, vallen weg. Vb 10% non respons op
variabele A en 10% non response op variabele B, en je wilt die twee in verband
brengen met elkaar dan zal de non response groter zijn dan die 10% (10 als exact
dezelfde mensen op vraag A en B niet hebben geantwoord, maar als dat niet zo is,
dan zal het groter zijn dan 10%)
2. Kan voor vertekening zorgen: gaat ervanuit dat mensen voor een bepaalde reden
niet geantwoord hebben, ze is niet toevallig waardoor vertekening mogelijk is = raakt
aan validiteit
(2) Imputatie
• ‘invullen’ van de ontbrekende waarden (opzoek gaan naar een
dubbelganger, iemand die op basis van alle andere vragen op elkaar lijkt, dat
antwoord dan gebruiken waar hij niet heeft geantwoord)
• Verschillende imputatietechnieken

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
Crimistudent2004 Katholieke Universiteit Leuven
Bekijk profiel
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
29
Lid sinds
2 jaar
Aantal volgers
4
Documenten
9
Laatst verkocht
1 dag geleden

0,0

0 beoordelingen

5
0
4
0
3
0
2
0
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via Bancontact, iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo eenvoudig kan het zijn.”

Alisha Student

Veelgestelde vragen