STATISTIEK II
Prof. Tom De Winter
VERKORTE BACHELOR CRIMINOLOGISCHE WETENSCHAPPEN VUB
,Inhoud
H1: Inleiding........................................................................................................... 3
1.1 Herhaling basisconcepten............................................................................. 3
H2 : kansrekenen................................................................................................... 5
2.1 Basisconcepten van kansrekenen.................................................................5
2.2 Rekenregels voor kansen.............................................................................. 9
2.3 Voorwaardelijke kansen.............................................................................. 10
H3: Kansverdelingen............................................................................................ 12
3.1 Inleiding....................................................................................................... 12
3.2 discrete kansverdelingen............................................................................ 15
3.3 Bionomaalverdeling..................................................................................... 15
3.4 Continue kansverdelingen...........................................................................18
3.5 Normaalverdeling........................................................................................ 19
H4: Steekproevenverdelingen & centrale limietstelling........................................22
3.3 Steekproevenverdeling proportie................................................................24
3.4 De steekproevenverdeling voor een gemiddelde........................................27
H5: Hypothesetoetsen.......................................................................................... 28
5.1 Inleiding....................................................................................................... 28
5.2 Hypothesetoetsen: opbouw en logica.........................................................28
5.3 Hypothesetoets voor een proportie.............................................................31
5.4 Hypothesetoets voor een gemiddelde.........................................................34
5.5 Type I en II fouten EXAMENVRAAG!!...........................................................36
H6: betrouwbaarheidsintervallen.........................................................................38
6.1 inleiding....................................................................................................... 38
6.2 punt- en intervalschatting...........................................................................39
6.3 Betrouwbaarheidsinterval voor proportie....................................................42
6.4 betrouwheidsinterval voor gemiddelde.......................................................45
6.5 AANVULLINGEN INFERENTIËLE TECHNIEKEN...............................................46
H7: analyse en inferentie van proporties..............................................................49
7.1 Inleiding....................................................................................................... 49
7.2 Twee groepen vergelijken op basis van proporties.....................................49
7.3 Chi-kwadraattoets voor onafhankelijkheid..................................................53
H8: Analyse en inferentie van gemiddelden.........................................................58
8.1 Inleiding....................................................................................................... 58
1
, 8.2 Twee gemiddelden vergelijken: Welch’s t-test (ongelijke varianties)..........58
8.3 hypothesetoets: 5 stappen..........................................................................60
H9: Enkelvoudige lineaire regressieanalyse.........................................................62
9.1 Inleiding....................................................................................................... 62
9.2 Het lineair regressiemodel..........................................................................62
9.3 Goodness of fit: R2....................................................................................... 64
9.4 Centreren van de onafhankelijke variabele.................................................68
9.5 Dummyregressie......................................................................................... 68
H10: meervoudige regressie-analyse...................................................................69
10.1 Inleiding.................................................................................................... 69
10.2 Inferentie voor regressiemodel.................................................................69
10.3 Inferentie voor regressiecoëfficiënten.......................................................73
10.4 Waarom multivariate regressie?...............................................................75
10.5 Het multivariate regressiemodel...............................................................78
H11: meervoudige lineaire regressieanalyse deel 2.............................................80
11.1 inleiding..................................................................................................... 80
11.2 Gestandardiseerde regressiecoëfficiënten................................................80
11.3 Assumpties voor lineaire regressie............................................................81
11.4 Outliers & influential cases........................................................................84
EXAMEN................................................................................................................ 85
2
,H1: INLEIDING
1.1 HERHALING BASISCONCEPTEN
1.1 Statistiek en statistische gegevens
Weerbaar zijn in een samenleving gedreven door cijfers (‘data-driven’)
Realiteit is complex en onzeker à realiteit kwantificeren
Empirie om beweringen te staven
Beweringen op zich zijn niet voldoende, nood aan empirie
‘fact check’
Niet zomaar data verzamelen, maar volgens regels van de kunst
Inleiding onderzoeksmethoden, etc.
Niet zomaar data analyseren, maar a.d.h.v. juiste techniek en met ruimte
voor onzekerheid
Statistiek II, etc.
1.2 Steekproefgrootte en onderzoekspopulatie
Populatie = Wie onderzoek ik?
VB: Alle personen met de Belgische nationaliteit op 1 januari 2025 à
percentage actief op de arbeidsmarkt
VB: Alle klanten van Colruyt in september 2025 à gemiddeld
aankoopbedrag per
VB: Alle gebruikers van Netflix in 2025 à gemiddeld aantal minuten
kijken per week
VB: Alle personen die in de loop van het jaar 2025 gedetineerd waren
in België à percentage recidivisten
VB: Alle studenten hoger onderwijs in Vlaanderen in 2025 à percentage
studenten criminologie
Steekproef = subset/selectie uit de volledige groep van
onderzoekseenheden in de populatie
Een steekproef moet dezelfde karakteristieken hebben als van de
populatie die het vertegenwoordigt (representativiteit)
Belangrijk: voor vele statistische technieken moet dit een eenvoudige
aselecte toevalssteekproef (EAS) zijn (SRS - ‘simple random sample’) à
elke onderzoekseenheid in de populatie heeft een gelijke kans op
selectie verschillend van nul
Kengetallen die we meten in de steekproef à (steekproef)statistieken
Problemen:
Sampling error à toevalsfouten, onnauwkeurigheid à betrouwbaarheid
Verschil tussen steekproefschatting en populatiewaarde
(‘onnauwkeurigheid’) te wijten aan toeval in de toevalssteekproef
Komt aan bod vanaf les 4!
Non-sampling error => Systematische fouten, vertekening =>
geldigheid
Selection bias (manier van selecteren van respondenten geeft
vertekend beeld) à vb. survivor bias
3
, Non-response bias (zij die deelname weigeren verschillen mogelijk
systematisch van de respondenten)
Item non-response bias (sommige vragen in de bevraging worden niet
beantwoord)
1.3 Beschrijvende en inductieve statistiek
Beschrijvende statistiek
= deductieve statistiek
Beschrijvende statistiek = de wereld in cijfers beschrijven, cijfers die
hoeveelheden precies weergeven
Een samenvatting in kengetallen
Basis: frequentievragen
Gebruik van grafische technieken
Indicatieve statistiek
= Inferentiële statistiek
Middel om met een beperkt aantal gegevens uitspraken te doen over een
breder geheel, over een volledige populatie
Voorspellingen op basis van steekproeven (25% zekerheid maar ook 75%
onzekerheid)
Veralgemeenbaarheid van steekproefresultaten
Extrapopulatie: uitspraken over de volledige bevolking op basis van een
toevalssteekproef uit die bevolking
VB: veiligheidsmonitor, verkiezingsonderzoek, gezondheidsenquêtes
Verklarende statistiek
Echte statistische analyse
Gericht op de verklaringen van verschillen en samenhang
VB: Wat is de relatie tussen opleidingsniveau & inkomen?
Wat is de relatie tussen opleiding en gezondheid?
Wat is de samenhang tussen leeftijd en consumptie van digitale
media?
Je gaat op zoek naar verklaringen achter bepaalde fenomenen
Regressietechnieken
VB: bivariate regressie, multivariate regressie, logistische regressie,
survival analyse
4
,H2 : KANSREKENEN
Kansrekenen is de basis van de inferentiële statistiek
Inferentiële statistiek gaat over het trekken van toevalssteekproeven
VB: lotto pikt volledig ad random iemand uit de meespelende
2.1 BASISCONCEPTEN VAN KANSREKENEN
1. Kansexperiment
= Experiment waarvan de uitkomst door toeval wordt bepaald
Mogelijke uitkomst zijn wel gekend, experiment kan herhaald worden,
herhaalde experimenten zijn onafhankelijk
2. Uitkomstenruimte (universum; 🇬🇧 sample space; Ω)
= volledige verzameling van alle mogelijke uitkomsten
VB: Wanneer je een dobbelsteen eenmaal opgooit, is de
uitkomstenruimte {1,2,3,4,5,6}
Wanneer je eenmaal een muntstuk opgooit, is de uitkomstenruimte
(K=kop, M=munt) {K,M}
Twee muntstukken opgooien geeft {KK,KM,MK,MM}
VB: Som van ogen van 2 dobbelstenen: {2,3,4,5,6,7,8,9,10,11,12}
3. Uitkomstenruimte (universum; 🇬🇧 sample space; Ω)
Uitkomstenruimte voor meerdere observatiesvisualiseren via
boomdiagram
VB: prestaties van studenten op een examen(C=correct, I=incorrect)
Bekijken van alle mogelijke combinaties/uitkomsten ahv boomdiagram
Kansen visualiseren
Uit boomdiagram kunnen we afleiden dat studentenprestaties op een
examen bestaande uit drie vragen 8 mogelijke uitkomsten hebben.
4. Gebeurtenis (🇬🇧 event)
“Subset van uitkomstenruimte” of “Deelverzameling van uitkomsten”
Groep van uitkomsten
Meestel aangeduid met een hoofdletter
VB: Gebeurtenis A = “een zes gooien” = {6}
VB: Gebeurtenis B = “een even aantal ogen gooien” = {2,4,6}
Gebeurtenis A = alle studenten die drie vragen incorrect beantwoord
hebben = {III}
Gebeurtenis B = alle studenten die minstens 1 vraag correct
beantwoord hebben = {CCC, CCI, CIC, CII, ICC, ICI, IIC}
5. Het concept kans
= maat voor de waarschijnlijkheid van een bepaalde uitkomst of
gebeurtenis in een kansexperiment
VB: Het gooien met een dobbelsteen
P(6) = 1/6 = 16,666667% = 0,166667
Kans à een proportie è waarde tussen 0 en 1 (Î [ 0,1])
5
, De waarschijnlijikheid dat je die uitkomst bekomt
VB: wat is de kans dat je een 6 gooit? 1/6
Kans kan je uitdrukken als een breuk, proportie (getal tussen 0 en 1) of
percentage
We gaan dit vaak schrijven als een proportie, getal tussen 0 en 1
Hoe gaan we een kans bepalen? Hoe weten we wat de kans is op een
bepaalde uitkomst?
3 BENADERINGEN VAN KANS
1. Theoretische kans
Op voorhand theoretisch te bepalen, berekenen
VB: Eerlijke dobbelsteen (1/6)
Kans om de lotto te winnen (1/alle combinaties van de lotto)
regel van Laplace in een uniforme kansverdeling
= alle uitkomsten hebben eenzelfde kans
VB: Gooien van een dobbelsteen:
De gebeurtenis A “meer dan 4 gooien met een dobbelsteen” à
deelverzameling {5, 6} uit de uitkomstenruimte {1,2,3,4,5,6}
Gebeurtenis A heeft 2 mogelijke uitkomsten, totaal aantal uitkomsten in
uitkomstenruimte= 6 è P(meer dan 4 gooien) = 2/6
Probleem: soms onmogelijk om theoretische kans te bepalen:
In sommige situaties kan je de theoretische kans niet bepalen
VB: punaise, kans op hospitalisatie bij Covid, slaagkans op het examen
Statistiek II
2. Empirische kans
De kans op een bepaalde uitkomst/gebeurtenis is de limiet van de
relatieve frequenties
wanneer het aantal experimenten/observaties oneindig groot wordt
VB: punaise, kans op hospitalisatie bij Covid
VB: Bij het gooien met dobbelsteen is de kans dat de dobbelsteen de
waarde “6” aanneemt 1 op 6. M.a.w. op lange termijn is het aandeel
van zessen 1 op 6. In grafiek (zie volgende 2 slides): +- 1670 keer een
6 op 10.000 observaties à +- 1670/10.000 = +-1/6
Kans kwantificeert toeval (randomness) op lange termijn (dus groot
aantal observaties/experimenten)
Aangezien oneindigheid nooit geobserveerd kan worden, zijn deze
kansen altijd benaderingen van theoretische hun limietwaarden
Wet van de grote aantallen (🇬🇧 law of large numbers)
Jakob Bernoulli (1654-1705)
6
, Aandeel van voorkomen bepaalde uitkomst/gebeurtenis in totaal aantal
experimenten/observaties lijkt op lange termijn naar een bepaalde
waarde te convergeren.
Assumptie van onafhankelijkheid
Vb. 20 keer “6” na elkaar gooien. Wat is de kans op 6 bij 21ste trial?
=> 1/6
3. Subjectieve kans
Soms is het onmogelijk om zeer veel observaties uit te voeren, je kan deze
kans moeilijk gaan uittesten
VB: Wat is de kans op een dodelijke meteorietinslag? Je kan moeilijk
duizenden meteorieten laten inslagen
Kans op bepaalde uitkomst is dan gebaseerd eigen inschatting, zeer
subjectief
Onwiskundige en onwetenschappelijk
Deze manier van redeneren is de basis van de Bayesiaanse statistiek
(Thomas Bayes, 1701-1761)
= tak van de statistiek die in zekere zin verwant is aan de subjectieve
benadering van kans.
Men start van een a priori ingeschatte kans, die vervolgens verfijnd
wordt op basis van nieuwe informatie
6. Doorsnede van gebeurtenissen
Doorsnede (🇬🇧 intersection) van gebeurtenissen A en B impliceert dat
beide gebeurtenissen tegelijk voorkomen
VB: kaartspel
Gebeurtenis A = kans dat de kaart een aas is
Gebeurtenis B = kans dat de kaart een harten is
P(A) = 4/52 = 1/13
P(B) = 13/52 = 1/4
P(A U B) = 1/52
7. Disjuncte gebeurtenissen
Het omgekeerde van doorsnede van gebeurtenissen
Gebeurtenissen die niet overlappen, niet tegelijk voorkomen, de
doorsnede is leeg
= disjoint events
Gebeurtenissen die geen enkele uitkomst gemeenschappelijk hebben
Sluiten elkaar uit, komen niet tegelijk voor
𝐴 ∩ 𝐵 = ∅ en dus dat 𝑃 𝐴 ∩ 𝐵 = 0
Met ∅ het symbool voor een lege verzameling en ∩ het symbool voor
een doorsnede
Gebeurtenis A en complement Ac per definitie disjunct
VB: kaartspel
Gebeurtenis A = kaart is een aas
Gebeurtenis B = kaart is een koning
P(A) =4/52
7
Prof. Tom De Winter
VERKORTE BACHELOR CRIMINOLOGISCHE WETENSCHAPPEN VUB
,Inhoud
H1: Inleiding........................................................................................................... 3
1.1 Herhaling basisconcepten............................................................................. 3
H2 : kansrekenen................................................................................................... 5
2.1 Basisconcepten van kansrekenen.................................................................5
2.2 Rekenregels voor kansen.............................................................................. 9
2.3 Voorwaardelijke kansen.............................................................................. 10
H3: Kansverdelingen............................................................................................ 12
3.1 Inleiding....................................................................................................... 12
3.2 discrete kansverdelingen............................................................................ 15
3.3 Bionomaalverdeling..................................................................................... 15
3.4 Continue kansverdelingen...........................................................................18
3.5 Normaalverdeling........................................................................................ 19
H4: Steekproevenverdelingen & centrale limietstelling........................................22
3.3 Steekproevenverdeling proportie................................................................24
3.4 De steekproevenverdeling voor een gemiddelde........................................27
H5: Hypothesetoetsen.......................................................................................... 28
5.1 Inleiding....................................................................................................... 28
5.2 Hypothesetoetsen: opbouw en logica.........................................................28
5.3 Hypothesetoets voor een proportie.............................................................31
5.4 Hypothesetoets voor een gemiddelde.........................................................34
5.5 Type I en II fouten EXAMENVRAAG!!...........................................................36
H6: betrouwbaarheidsintervallen.........................................................................38
6.1 inleiding....................................................................................................... 38
6.2 punt- en intervalschatting...........................................................................39
6.3 Betrouwbaarheidsinterval voor proportie....................................................42
6.4 betrouwheidsinterval voor gemiddelde.......................................................45
6.5 AANVULLINGEN INFERENTIËLE TECHNIEKEN...............................................46
H7: analyse en inferentie van proporties..............................................................49
7.1 Inleiding....................................................................................................... 49
7.2 Twee groepen vergelijken op basis van proporties.....................................49
7.3 Chi-kwadraattoets voor onafhankelijkheid..................................................53
H8: Analyse en inferentie van gemiddelden.........................................................58
8.1 Inleiding....................................................................................................... 58
1
, 8.2 Twee gemiddelden vergelijken: Welch’s t-test (ongelijke varianties)..........58
8.3 hypothesetoets: 5 stappen..........................................................................60
H9: Enkelvoudige lineaire regressieanalyse.........................................................62
9.1 Inleiding....................................................................................................... 62
9.2 Het lineair regressiemodel..........................................................................62
9.3 Goodness of fit: R2....................................................................................... 64
9.4 Centreren van de onafhankelijke variabele.................................................68
9.5 Dummyregressie......................................................................................... 68
H10: meervoudige regressie-analyse...................................................................69
10.1 Inleiding.................................................................................................... 69
10.2 Inferentie voor regressiemodel.................................................................69
10.3 Inferentie voor regressiecoëfficiënten.......................................................73
10.4 Waarom multivariate regressie?...............................................................75
10.5 Het multivariate regressiemodel...............................................................78
H11: meervoudige lineaire regressieanalyse deel 2.............................................80
11.1 inleiding..................................................................................................... 80
11.2 Gestandardiseerde regressiecoëfficiënten................................................80
11.3 Assumpties voor lineaire regressie............................................................81
11.4 Outliers & influential cases........................................................................84
EXAMEN................................................................................................................ 85
2
,H1: INLEIDING
1.1 HERHALING BASISCONCEPTEN
1.1 Statistiek en statistische gegevens
Weerbaar zijn in een samenleving gedreven door cijfers (‘data-driven’)
Realiteit is complex en onzeker à realiteit kwantificeren
Empirie om beweringen te staven
Beweringen op zich zijn niet voldoende, nood aan empirie
‘fact check’
Niet zomaar data verzamelen, maar volgens regels van de kunst
Inleiding onderzoeksmethoden, etc.
Niet zomaar data analyseren, maar a.d.h.v. juiste techniek en met ruimte
voor onzekerheid
Statistiek II, etc.
1.2 Steekproefgrootte en onderzoekspopulatie
Populatie = Wie onderzoek ik?
VB: Alle personen met de Belgische nationaliteit op 1 januari 2025 à
percentage actief op de arbeidsmarkt
VB: Alle klanten van Colruyt in september 2025 à gemiddeld
aankoopbedrag per
VB: Alle gebruikers van Netflix in 2025 à gemiddeld aantal minuten
kijken per week
VB: Alle personen die in de loop van het jaar 2025 gedetineerd waren
in België à percentage recidivisten
VB: Alle studenten hoger onderwijs in Vlaanderen in 2025 à percentage
studenten criminologie
Steekproef = subset/selectie uit de volledige groep van
onderzoekseenheden in de populatie
Een steekproef moet dezelfde karakteristieken hebben als van de
populatie die het vertegenwoordigt (representativiteit)
Belangrijk: voor vele statistische technieken moet dit een eenvoudige
aselecte toevalssteekproef (EAS) zijn (SRS - ‘simple random sample’) à
elke onderzoekseenheid in de populatie heeft een gelijke kans op
selectie verschillend van nul
Kengetallen die we meten in de steekproef à (steekproef)statistieken
Problemen:
Sampling error à toevalsfouten, onnauwkeurigheid à betrouwbaarheid
Verschil tussen steekproefschatting en populatiewaarde
(‘onnauwkeurigheid’) te wijten aan toeval in de toevalssteekproef
Komt aan bod vanaf les 4!
Non-sampling error => Systematische fouten, vertekening =>
geldigheid
Selection bias (manier van selecteren van respondenten geeft
vertekend beeld) à vb. survivor bias
3
, Non-response bias (zij die deelname weigeren verschillen mogelijk
systematisch van de respondenten)
Item non-response bias (sommige vragen in de bevraging worden niet
beantwoord)
1.3 Beschrijvende en inductieve statistiek
Beschrijvende statistiek
= deductieve statistiek
Beschrijvende statistiek = de wereld in cijfers beschrijven, cijfers die
hoeveelheden precies weergeven
Een samenvatting in kengetallen
Basis: frequentievragen
Gebruik van grafische technieken
Indicatieve statistiek
= Inferentiële statistiek
Middel om met een beperkt aantal gegevens uitspraken te doen over een
breder geheel, over een volledige populatie
Voorspellingen op basis van steekproeven (25% zekerheid maar ook 75%
onzekerheid)
Veralgemeenbaarheid van steekproefresultaten
Extrapopulatie: uitspraken over de volledige bevolking op basis van een
toevalssteekproef uit die bevolking
VB: veiligheidsmonitor, verkiezingsonderzoek, gezondheidsenquêtes
Verklarende statistiek
Echte statistische analyse
Gericht op de verklaringen van verschillen en samenhang
VB: Wat is de relatie tussen opleidingsniveau & inkomen?
Wat is de relatie tussen opleiding en gezondheid?
Wat is de samenhang tussen leeftijd en consumptie van digitale
media?
Je gaat op zoek naar verklaringen achter bepaalde fenomenen
Regressietechnieken
VB: bivariate regressie, multivariate regressie, logistische regressie,
survival analyse
4
,H2 : KANSREKENEN
Kansrekenen is de basis van de inferentiële statistiek
Inferentiële statistiek gaat over het trekken van toevalssteekproeven
VB: lotto pikt volledig ad random iemand uit de meespelende
2.1 BASISCONCEPTEN VAN KANSREKENEN
1. Kansexperiment
= Experiment waarvan de uitkomst door toeval wordt bepaald
Mogelijke uitkomst zijn wel gekend, experiment kan herhaald worden,
herhaalde experimenten zijn onafhankelijk
2. Uitkomstenruimte (universum; 🇬🇧 sample space; Ω)
= volledige verzameling van alle mogelijke uitkomsten
VB: Wanneer je een dobbelsteen eenmaal opgooit, is de
uitkomstenruimte {1,2,3,4,5,6}
Wanneer je eenmaal een muntstuk opgooit, is de uitkomstenruimte
(K=kop, M=munt) {K,M}
Twee muntstukken opgooien geeft {KK,KM,MK,MM}
VB: Som van ogen van 2 dobbelstenen: {2,3,4,5,6,7,8,9,10,11,12}
3. Uitkomstenruimte (universum; 🇬🇧 sample space; Ω)
Uitkomstenruimte voor meerdere observatiesvisualiseren via
boomdiagram
VB: prestaties van studenten op een examen(C=correct, I=incorrect)
Bekijken van alle mogelijke combinaties/uitkomsten ahv boomdiagram
Kansen visualiseren
Uit boomdiagram kunnen we afleiden dat studentenprestaties op een
examen bestaande uit drie vragen 8 mogelijke uitkomsten hebben.
4. Gebeurtenis (🇬🇧 event)
“Subset van uitkomstenruimte” of “Deelverzameling van uitkomsten”
Groep van uitkomsten
Meestel aangeduid met een hoofdletter
VB: Gebeurtenis A = “een zes gooien” = {6}
VB: Gebeurtenis B = “een even aantal ogen gooien” = {2,4,6}
Gebeurtenis A = alle studenten die drie vragen incorrect beantwoord
hebben = {III}
Gebeurtenis B = alle studenten die minstens 1 vraag correct
beantwoord hebben = {CCC, CCI, CIC, CII, ICC, ICI, IIC}
5. Het concept kans
= maat voor de waarschijnlijkheid van een bepaalde uitkomst of
gebeurtenis in een kansexperiment
VB: Het gooien met een dobbelsteen
P(6) = 1/6 = 16,666667% = 0,166667
Kans à een proportie è waarde tussen 0 en 1 (Î [ 0,1])
5
, De waarschijnlijikheid dat je die uitkomst bekomt
VB: wat is de kans dat je een 6 gooit? 1/6
Kans kan je uitdrukken als een breuk, proportie (getal tussen 0 en 1) of
percentage
We gaan dit vaak schrijven als een proportie, getal tussen 0 en 1
Hoe gaan we een kans bepalen? Hoe weten we wat de kans is op een
bepaalde uitkomst?
3 BENADERINGEN VAN KANS
1. Theoretische kans
Op voorhand theoretisch te bepalen, berekenen
VB: Eerlijke dobbelsteen (1/6)
Kans om de lotto te winnen (1/alle combinaties van de lotto)
regel van Laplace in een uniforme kansverdeling
= alle uitkomsten hebben eenzelfde kans
VB: Gooien van een dobbelsteen:
De gebeurtenis A “meer dan 4 gooien met een dobbelsteen” à
deelverzameling {5, 6} uit de uitkomstenruimte {1,2,3,4,5,6}
Gebeurtenis A heeft 2 mogelijke uitkomsten, totaal aantal uitkomsten in
uitkomstenruimte= 6 è P(meer dan 4 gooien) = 2/6
Probleem: soms onmogelijk om theoretische kans te bepalen:
In sommige situaties kan je de theoretische kans niet bepalen
VB: punaise, kans op hospitalisatie bij Covid, slaagkans op het examen
Statistiek II
2. Empirische kans
De kans op een bepaalde uitkomst/gebeurtenis is de limiet van de
relatieve frequenties
wanneer het aantal experimenten/observaties oneindig groot wordt
VB: punaise, kans op hospitalisatie bij Covid
VB: Bij het gooien met dobbelsteen is de kans dat de dobbelsteen de
waarde “6” aanneemt 1 op 6. M.a.w. op lange termijn is het aandeel
van zessen 1 op 6. In grafiek (zie volgende 2 slides): +- 1670 keer een
6 op 10.000 observaties à +- 1670/10.000 = +-1/6
Kans kwantificeert toeval (randomness) op lange termijn (dus groot
aantal observaties/experimenten)
Aangezien oneindigheid nooit geobserveerd kan worden, zijn deze
kansen altijd benaderingen van theoretische hun limietwaarden
Wet van de grote aantallen (🇬🇧 law of large numbers)
Jakob Bernoulli (1654-1705)
6
, Aandeel van voorkomen bepaalde uitkomst/gebeurtenis in totaal aantal
experimenten/observaties lijkt op lange termijn naar een bepaalde
waarde te convergeren.
Assumptie van onafhankelijkheid
Vb. 20 keer “6” na elkaar gooien. Wat is de kans op 6 bij 21ste trial?
=> 1/6
3. Subjectieve kans
Soms is het onmogelijk om zeer veel observaties uit te voeren, je kan deze
kans moeilijk gaan uittesten
VB: Wat is de kans op een dodelijke meteorietinslag? Je kan moeilijk
duizenden meteorieten laten inslagen
Kans op bepaalde uitkomst is dan gebaseerd eigen inschatting, zeer
subjectief
Onwiskundige en onwetenschappelijk
Deze manier van redeneren is de basis van de Bayesiaanse statistiek
(Thomas Bayes, 1701-1761)
= tak van de statistiek die in zekere zin verwant is aan de subjectieve
benadering van kans.
Men start van een a priori ingeschatte kans, die vervolgens verfijnd
wordt op basis van nieuwe informatie
6. Doorsnede van gebeurtenissen
Doorsnede (🇬🇧 intersection) van gebeurtenissen A en B impliceert dat
beide gebeurtenissen tegelijk voorkomen
VB: kaartspel
Gebeurtenis A = kans dat de kaart een aas is
Gebeurtenis B = kans dat de kaart een harten is
P(A) = 4/52 = 1/13
P(B) = 13/52 = 1/4
P(A U B) = 1/52
7. Disjuncte gebeurtenissen
Het omgekeerde van doorsnede van gebeurtenissen
Gebeurtenissen die niet overlappen, niet tegelijk voorkomen, de
doorsnede is leeg
= disjoint events
Gebeurtenissen die geen enkele uitkomst gemeenschappelijk hebben
Sluiten elkaar uit, komen niet tegelijk voor
𝐴 ∩ 𝐵 = ∅ en dus dat 𝑃 𝐴 ∩ 𝐵 = 0
Met ∅ het symbool voor een lege verzameling en ∩ het symbool voor
een doorsnede
Gebeurtenis A en complement Ac per definitie disjunct
VB: kaartspel
Gebeurtenis A = kaart is een aas
Gebeurtenis B = kaart is een koning
P(A) =4/52
7