Oplossing Examens Januari 2016
Basisbegrippen Statistiek voor Criminologen
Examen I
(1) (9 pt) De onderstaande databank geeft gegevens weer over noordelijke
en zuidelijke staten in de VS voor wat betreft de violent crime rate (per
100.000 inwoners) (VCR), de incarceration rate (per 100.000 inwoners) (IR),
en het gebruik van de doodstraf in de gegeven staat (1 betekent het bestaan
van de doodstraf, 0 geen doodstraf).
Noord/Zuid VCR IR Doodstraf
Z 871.1 431 1
Z 1119.7 368 0
N 621.2 397 0
N 2832.8 1549 0
Z 733.2 387 1
N 508.5 250 0
Z 984.6 499 0
N 1000.1 383 0
N 1122.1 354 1
Z 622.8 506 0
Z 944.5 489 1
Z 746.2 250 1
N 534.5 196 0
Onderzoek de volgende 3 onderzoeksvragen. Geef telkens aan
• Met welke beschrijvende statistische techniek je de beslissing kan on-
dersteunen
• Hoe je de nulhypothese en alternatief formuleert
• Hoe je de P-waarde berekent en hoe je de beslissing neemt op basis van
de P-waarde (je mag telkens significantieniveau 5% gebruiken)
(i) Is er een significant verschil tussen gemiddelde VCR tussen noordelijke en
zuidelijke staten?
1
,Hier is het de bedoeling om de gemiddelde VCR van de twee groepen staten
te vergelijken. We beschouwen hier een eenzijdige testprocedure.
H0 : µN = µZ versus H1 : µN 6= µZ
Als beschrijvende statistische grafiek kan best een plot gemaakt worden met
twee boxplots (één voor N en één voor Z) naast elkaar op dezelfde schaal.
Hier wordt als teststatistiek gebruikt
X̄N − X̄Z
T = q .
Sp n1N + n1Z
Je zal hier dus verwerpen als T sterk verschillend van 0 is.
Hier is nN = 6, nZ = 7. We vinden x̄Z = 860.3, x̄N = 1103.2, sZ =
171.0, sN = 884.6 en dan s2p = (5s2N +6s2Z )/11 = (609.6)2 . Hier is de uitkomst
van T gelijk aan 0.72.
De P-waarde wordt nu gegeven door het dubbele (tweezijdig alternatief !) van
de kans dat onder de t11 verdeling een waarde gevonden wordt groter dan
0.72:
2P (t11 > 0.72)
wat dicht bij 0.50 ligt, en dus kunnen we de nulhypothese H0 niet verwerpen.
(ii) Is er een significant verband tussen de geografische ligging van de staat
(N of Z) en het gebruik van de doodstraf?
Hier wordt best een kruistabel opgesteld:
Doodstraf = Ja Doodstraf =Nee
N 1 5 6
Z 4 3 7
5 8 13
Er zijn nu twee mogelijke manieren om deze vraag te beantwoorden:
i. Via de χ2 -test. Dan worden de aantallen in de bovenstaande tabel vergeleken
met de verwachte waarden onder de nulhypothese dat er geen verband is
tussen het vragen van een lookbroodje en het soort pizzakorst:
Doodstraf = Ja Doodstraf = Nee
N (6 × 5)/13 = 2.31 (6 × 8)/13 = 3.69 6
Z (7 × 5)/13 = 2.69 (7 × 8)/13 = 4.31 7
5 8 13
2
, De χ2 statistiek is dan
(1 − 2.31)2 /2.31 + (5 − 3.69)2 /3.69 + (4 − 2.69)2 /2.69 + (3 − 4.31)2 /4.31 = 2.25
De P-waarde is hier gelijk aan de kans om een waarde te bekomen groter dan
2.25 onder de χ21 verdeling:
P (χ21 > 2.25) > 0.10,
aangezien P (χ21 > 2.704) = 0.10. Er is dus geen significantie en we kunnen
de nulhypothese niet verwerpen. Merk op: de χ2 test is steeds éénzijdig!
Een tweede methode vinden we door de schattingen van de proporties of het
voorkomen van de doodstraf te vergelijken tussen noord en zuid:
1 4
p̂N = en p̂Z = .
6 7
Merk de aantallen op waarop deze proporties gebaseerd zijn: nN = 6, nZ = 7!
De hypotheses zijn hier dan
H0 : pN = pZ versus pN 6= pZ .
Als teststatistiek wordt gebruikt
P̂N − P̂Z
Z=q ,
Pˆ0 (1 − P̂0 )( n1N + 1
nZ
)
waarbij hier p̂0 = 5/13 = 0.39. We bekomen nu
p
z = (1/6 − 4/7)/ 0.39 × 0.61(1/6 + 1/7) = −1.49.
De P-waarde is nu
2P (Z < −1.49) = 2P (Z > 1.49) = 2(1−P (Z ≤ 1.49)) = 2×(1−0.932) = 0.136
zodat we tot dezelfde conclusie komen als bij de eerste oplossingsmethode.
3
Basisbegrippen Statistiek voor Criminologen
Examen I
(1) (9 pt) De onderstaande databank geeft gegevens weer over noordelijke
en zuidelijke staten in de VS voor wat betreft de violent crime rate (per
100.000 inwoners) (VCR), de incarceration rate (per 100.000 inwoners) (IR),
en het gebruik van de doodstraf in de gegeven staat (1 betekent het bestaan
van de doodstraf, 0 geen doodstraf).
Noord/Zuid VCR IR Doodstraf
Z 871.1 431 1
Z 1119.7 368 0
N 621.2 397 0
N 2832.8 1549 0
Z 733.2 387 1
N 508.5 250 0
Z 984.6 499 0
N 1000.1 383 0
N 1122.1 354 1
Z 622.8 506 0
Z 944.5 489 1
Z 746.2 250 1
N 534.5 196 0
Onderzoek de volgende 3 onderzoeksvragen. Geef telkens aan
• Met welke beschrijvende statistische techniek je de beslissing kan on-
dersteunen
• Hoe je de nulhypothese en alternatief formuleert
• Hoe je de P-waarde berekent en hoe je de beslissing neemt op basis van
de P-waarde (je mag telkens significantieniveau 5% gebruiken)
(i) Is er een significant verschil tussen gemiddelde VCR tussen noordelijke en
zuidelijke staten?
1
,Hier is het de bedoeling om de gemiddelde VCR van de twee groepen staten
te vergelijken. We beschouwen hier een eenzijdige testprocedure.
H0 : µN = µZ versus H1 : µN 6= µZ
Als beschrijvende statistische grafiek kan best een plot gemaakt worden met
twee boxplots (één voor N en één voor Z) naast elkaar op dezelfde schaal.
Hier wordt als teststatistiek gebruikt
X̄N − X̄Z
T = q .
Sp n1N + n1Z
Je zal hier dus verwerpen als T sterk verschillend van 0 is.
Hier is nN = 6, nZ = 7. We vinden x̄Z = 860.3, x̄N = 1103.2, sZ =
171.0, sN = 884.6 en dan s2p = (5s2N +6s2Z )/11 = (609.6)2 . Hier is de uitkomst
van T gelijk aan 0.72.
De P-waarde wordt nu gegeven door het dubbele (tweezijdig alternatief !) van
de kans dat onder de t11 verdeling een waarde gevonden wordt groter dan
0.72:
2P (t11 > 0.72)
wat dicht bij 0.50 ligt, en dus kunnen we de nulhypothese H0 niet verwerpen.
(ii) Is er een significant verband tussen de geografische ligging van de staat
(N of Z) en het gebruik van de doodstraf?
Hier wordt best een kruistabel opgesteld:
Doodstraf = Ja Doodstraf =Nee
N 1 5 6
Z 4 3 7
5 8 13
Er zijn nu twee mogelijke manieren om deze vraag te beantwoorden:
i. Via de χ2 -test. Dan worden de aantallen in de bovenstaande tabel vergeleken
met de verwachte waarden onder de nulhypothese dat er geen verband is
tussen het vragen van een lookbroodje en het soort pizzakorst:
Doodstraf = Ja Doodstraf = Nee
N (6 × 5)/13 = 2.31 (6 × 8)/13 = 3.69 6
Z (7 × 5)/13 = 2.69 (7 × 8)/13 = 4.31 7
5 8 13
2
, De χ2 statistiek is dan
(1 − 2.31)2 /2.31 + (5 − 3.69)2 /3.69 + (4 − 2.69)2 /2.69 + (3 − 4.31)2 /4.31 = 2.25
De P-waarde is hier gelijk aan de kans om een waarde te bekomen groter dan
2.25 onder de χ21 verdeling:
P (χ21 > 2.25) > 0.10,
aangezien P (χ21 > 2.704) = 0.10. Er is dus geen significantie en we kunnen
de nulhypothese niet verwerpen. Merk op: de χ2 test is steeds éénzijdig!
Een tweede methode vinden we door de schattingen van de proporties of het
voorkomen van de doodstraf te vergelijken tussen noord en zuid:
1 4
p̂N = en p̂Z = .
6 7
Merk de aantallen op waarop deze proporties gebaseerd zijn: nN = 6, nZ = 7!
De hypotheses zijn hier dan
H0 : pN = pZ versus pN 6= pZ .
Als teststatistiek wordt gebruikt
P̂N − P̂Z
Z=q ,
Pˆ0 (1 − P̂0 )( n1N + 1
nZ
)
waarbij hier p̂0 = 5/13 = 0.39. We bekomen nu
p
z = (1/6 − 4/7)/ 0.39 × 0.61(1/6 + 1/7) = −1.49.
De P-waarde is nu
2P (Z < −1.49) = 2P (Z > 1.49) = 2(1−P (Z ≤ 1.49)) = 2×(1−0.932) = 0.136
zodat we tot dezelfde conclusie komen als bij de eerste oplossingsmethode.
3