Hoorcollege 1:
univariate technieken = beschrijvende statistiek obv een variabele (hoeveel delicten,
gemiddelden, variantie, standaarddeviatie)
bivariate technieken = kijken naar verbanden (kruistabellen, correlaties, enkelvoudige regressie,
verband tussen aantal delicten en verslaving)
multivariate technieken = regressies (verband tussen verslaving, stoornis, sekse, leeftijd en
opleiding aan de ene kant en aantal delicten aan de andere kant), overlevingsduuranalyse
(voorspellen van de duur tot recidive uit aantal behandelkenmerken, werk, relatie etc.),
PCA/exploratieve technieken (profiel van verschillende typen daders van zedendelicten, in
termen van modus operandi of in termen van combinatie van persoonlijkheids- en
achtergrondkenmerken)
- vaak gebruikt als er geen theorie paraat is, exploratieve wijze, je weet niet precies waar
de verbanden liggen
meetniveaus: bepalend voor de te gebruiken toets en niveau van informatie besloten in de
variabele
categorische variabelen kunnen niet als afhankelijke variabele gebruikt worden voor
regressieanalyse
- MAAR logistische regressie kan wel gebruikt worden bij dichotome variabelen
onafhankelijke variabele → X = variabele die je gebruikt om de afhankelijke te voorspellen
(beïnvloeden)
afhankelijke variabele → Y = variabele waar je iets over wil weten (hoe verandert de variabele
onder invloed van de onafhankelijke variabelen)
controlevariabelen = variabelen die constant moeten blijven, omdat ze selectie kunnen
veroorzaken (bijv. tijd in detentie, hoeveel tijd iemand gehad heeft om delicten te plegen)
,model bouwen om samenhang/invloed te toetsen → idee dat we vooraf hebben over wat welke
richting op beïnvloedt, bouw je obv bijv een theorie, of nadat je samenhang hebt gemeten met
analyse
→ geen causaliteit!!!
- bivariate model:
- multivariaat model:
Model fit = hoe goed beschrijft het model de werkelijkheid (data)?
→ diverse fitmaten, bijv. R2 ‘% verklaarde variantie (hoeveel procent van de verklaring die je
zou verwachten om de uitkomst te krijgen klopt, bijv 60% van mijn model verklaart de werkelijke
uitkomst)
simpel model heeft de voorkeur (= parsimonie), wat zo efficiënt mogelijk is
→ zo min mogelijk variabelen
→ zo groot mogelijke fit → voorspelling
→ altijd balans tussen model fit en model complexiteit
fitmaten revisted = sommige fitmaten straffen voor complexiteit
→ zeggen iets over hoe complex je fit is
basisstatistieken
- univariate techniek: beschrijvende statistiek
→ kenmerken van 1 variabele beschrijven
maten voor centrale tedentie:
- modus - meest voorkomend - vanaf nominaal
- mediaan - 50% van de observaties - vanaf ordinaal
- gemiddelde - som gedeeld door aantal - vanaf interval
maten voor spreiding
- range - min en max bereik - vanaf interval
, - variantie - s2 gem som van afwijkingen2 - vanaf interval
- standaarddeviatie - hoeveel wijkt men af van M (totale gemiddelde) - vanaf
interval
inferentiële statistiek = steekproef en populatie (gaat over herleidbaarheid)
- steekproeftrekking: steekproef uit zekere populatie, bij voorkeur representatief want die
kun je generaliseren
→ door bijv. random sampling
Lakmoesproef = heeft ieder lid van de populatie een gelijke kans om in de steekproef terecht te
komen?
Mx (steekproefgemiddelde) zuivere schatter van Ux (populatiegemiddelde), mits steekproef
random uit populatie getrokken
bij h1 is een bepaalde variabele bijv wel van invloed op de afhankelijke variabele, dus een
significante variabele (dus is wel iets aan de hand!)
alpha = meestal .05 (5% kans dat de uitkomst significant is, terwijl dit niet het geval is, dus fout)
Betrouwbaarheidsintervallen: marge om een puntschatting heen, geeft weer hoe zeker je bent
van je schatting
- hoe wijder het CI, des te slechter het resultaat
- hoe groter N, des te smaller het CI (CI95, CI99)
- zijn belangrijk in het aangeven of iets wel of niet significant is
- als het betrouwbaarheidsinterval heel groot is, is dat niet goed!
a en B zijn verschillend soort fouten:
- a: brandmeter gaat af terwijl er geen brand is (er is niets aan de hand, maar toets geeft
aan van wel)
- B: brandmelder gaat niet af terwijl er brand is (er is wel iets aan de hand, maar toets
geeft aan dat er niets aan de hand is)