STATISTIEK II VOOR DE SOCIALE WETENSCHAPPEN
Tom de Winter – 2324
HOC 1: HERHALING STATISTIEK I
HOC 2: KANSREKENEN
1. Basisconcepten van kansrekenen
Kans (P) = een propor+e, neemt de waarde aan tussen 0 en 1
➙ vb: gooien met een dobbelsteen; kans op 6? = 1/6 = 16,6667% = 0, 166667
Kans is een toevalsvariabele (stochas+sche variabele) waarbij de mogelijke waarden gekend zijn,
maar we de exacte waarde voor elke observa+e niet op voorhand weten → onzekerheid
- Op korte termijn (met weinig observa+es) zeer onvoorspelbaar
- Als aantal observa+es s+jgt komt de geobserveerde uitkomsten dichter bij de reële kans
= cumula+eve propor+e
Wet van grote getallen (Law of Large numbers) – Jakob Bernoulli
= aandeel van bepaalde uitkomst in totaal aantal uitkomsten lijkt op lange termijn naar een bepaalde
waarde te convergeren (rela=eve frequen=e van dobbersteen nadert naar 1/6)
è Assump&e van ona-ankelijkheid: kans op een 6 bij 21e trial? = 1/6 want dobbelsteen heeG
geen geheugen, puur toeval (loIo voospellen onmogelijk)
1) THEORETISCHE KANS
= op voorhand te bepalen (vb eerlijke dobbelsteen)
Probleem: soms onmogelijk op voorhand te bepalen (kans op hospitalisa+e bij covid)
2) EMPIRISCHE KANS
= de kans op een bepaalde uitkomst is de limiet van de rela+eve frequen+es (wanneer het aantal
observa+es oneindig wordt). De kans op een bepaalde uitkomst is het aandeel van die uitkomst in
het totaal aantal uitkomsten op lange termijn.
Probleem: aangezien oneindigheid nooit geobserveerd kan worden, zijn deze kansen al+jd
benaderingen van hun limietwaarden
3) SUBJECTIEVE KANS
Soms is het onmogelijk om zeer veel trials uit te voeren (kans op een dodelijke meteorie+nslag)
è Kans op bepaalde uitkomst is gebaseerd a priori informa+e – met info dat men al heeX
è Bayesian sta8s8cs: sta+s+ek die vertrekt vanuit subjec+eve probabiliteit (Thomas Bayes)
Uitkomstenruimte (sample set; Ω)
= verzameling van alle mogelijke uitkomsten (dobbelsteen; Ω = {1, 2, 3, 4, 5, 6}, muntstuk; Ω = {K, M})
Uitkomstenruimte voor meerdere observa+es visualiseren in
boomdiagram (vb presta+es van studenten op een examen;
C=correct, I=incorrect)
è Elke lijn van de eerste set van 2 takken tot de derde set
van 8 takken bepaald een uitkomst in de uitkomstenruimte
è Uit boomdiagram kunnen we afleiden dat
studentenpresta+es op een examen bestaande uit 3
vragen 8 mogelijke uitkomsten hebben
,Gebeurtenis (event)
“Subset van uitkomstenruimte” of “deelverzameling van uitkomsten”
• Vb gebeurtenis A = “een zes gooien” = {6}
• Vb gebeurtenis B = “een even aantal ogen gooien” = {2, 4, 6}
Gebeurtenis A = alle studenten die 3 vragen incorrect beantwoord hebben
= {III}
Gebeurtenis B = alle studenten die minstens 1 vraag correct beantwoorden
= {CCC, CCI, CIC, CII, ICC, ICI, IIC}
Kans op een gebeurtenis
De kans op een gebeurtenis A wordt verkregen door de kansen van elk individuele uitkomst binnen
de gebeurtenis op te tellen, wanneer alle mogelijke uitkomsten dezelfde kans hebben geeX dit:
= regel van Laplace
Vb: de gebeurtenis A “een 4 gooien met een dobbelsteen” voorgesteld door de volgende
deelverzameling {4} uit de uitkomstenruimte {1, 2, 3, 4, 5, 6}
Gebeurtenis A heeX 1 mogelijke uitkomsten, totaal aantal uitkomsten in uitkomstenruimte = 6
è P(een 4 gooien) = 1/6
Doorsnede (intersec8on)
= de doorsnede van gebeurtenissen A en B impliceert dat beide gebeurtenissen tegelijk voorkomen
→A⋂B vb: kaart is een aas EN een harten
→ P(A ⋂ B) = P(B ⋂ A)
Disjuncte gebeurtenissen (disjoint events)
= gebeurtenissen die geen enkele uitkomst gemeenschappelijk hebben, komen niet tegelijk voor
→ A ⋂ B = ∅ en dus dat P(A ⋂ B) = 0 vb: kaart is een aas, kaart is een koning
→ gebeurtenis A en complement A^c per defini+e disjunct
Unie
= kans dat gebeurtenis A, gebeurtenis B, of beide tegelijk voorkomen
→ P(A ∪ B) vb: kaart is een aas OF een harten OF beide
→ P(A ∪ B) = P(B ∪ A)
2. Rekenregels voor kansen
a) COMPLEMENTREGEL
Complement van de gebeurtenis A = alle uitkomsten in de uitkomstenruimte die niet tot A behoren
,b) SOMREGEL
= kans op unie van gebeurtenis A en B
!! bij disjuncte gebeurtenissen is P(A ⋂ B) = 0 dus :
c) PRODUCTREGEL
Kans dat gebeurtenis A én gebeurtenis B voorkomen, OP VOORWAARDE DAT deze ONAFHANKELIJK
zijn (=uitkomst van eerste opbserva+e is onakankelijk van de uitkomst van de 2e observa+e) is gelijk
aan het product van de kans op A en de kans op B
P(A ⋂ B) = P(A) . P(B) → indien A en B ona*ankelijk zijn
Vb: kans dat 1e en 2e kind beide meisjes zijn – uitkomstenruimte: {MM, MJ, JM, JJ}
Twee gebeurtenissen:
- A = {1e kind is een meisje}
- B = {2e kind is een meisje}
, 3. Voorwaardelijke kansen
OnaCankelijke gebeurtenissen
= gebeurtenissen waarbij de kans op de ene gebeurtenis geen invloed heeX op de kans op de andere
gebeurtenis (vb kans op een meisje bij geboorte) *schema hierboven
ACankelijke gebeurtenissen
= gebeurtenissen waarbij de kans op de ene gebeurtenis wél invloed heeX op de kans op de andere
gebeurtenis (vb reclame voor nieuwe fasnood burger laat verkoop s+jgen)
VOORWAARDELIJKE KANSEN
- Indien A en B akankelijk zijn
- Indien A en B wél onakankelijk zijn
De voorwaardelijke kans op een gebeurtenis
A, gegeven B, is →
(Afgeleid uit de productregel voor akankelijke
kansen) Merk op: P(A |B) ≠ P(B | A) (rijpercentages versus kolompercentages in de kruistabel)
Regel van Bayes
We weten dat:
Dit resulteerd in de regel van Bayes: de ‘omkeerformule’
Bij kruistabel kan je gwn aflezen
ipv formule te gebruiken
Tom de Winter – 2324
HOC 1: HERHALING STATISTIEK I
HOC 2: KANSREKENEN
1. Basisconcepten van kansrekenen
Kans (P) = een propor+e, neemt de waarde aan tussen 0 en 1
➙ vb: gooien met een dobbelsteen; kans op 6? = 1/6 = 16,6667% = 0, 166667
Kans is een toevalsvariabele (stochas+sche variabele) waarbij de mogelijke waarden gekend zijn,
maar we de exacte waarde voor elke observa+e niet op voorhand weten → onzekerheid
- Op korte termijn (met weinig observa+es) zeer onvoorspelbaar
- Als aantal observa+es s+jgt komt de geobserveerde uitkomsten dichter bij de reële kans
= cumula+eve propor+e
Wet van grote getallen (Law of Large numbers) – Jakob Bernoulli
= aandeel van bepaalde uitkomst in totaal aantal uitkomsten lijkt op lange termijn naar een bepaalde
waarde te convergeren (rela=eve frequen=e van dobbersteen nadert naar 1/6)
è Assump&e van ona-ankelijkheid: kans op een 6 bij 21e trial? = 1/6 want dobbelsteen heeG
geen geheugen, puur toeval (loIo voospellen onmogelijk)
1) THEORETISCHE KANS
= op voorhand te bepalen (vb eerlijke dobbelsteen)
Probleem: soms onmogelijk op voorhand te bepalen (kans op hospitalisa+e bij covid)
2) EMPIRISCHE KANS
= de kans op een bepaalde uitkomst is de limiet van de rela+eve frequen+es (wanneer het aantal
observa+es oneindig wordt). De kans op een bepaalde uitkomst is het aandeel van die uitkomst in
het totaal aantal uitkomsten op lange termijn.
Probleem: aangezien oneindigheid nooit geobserveerd kan worden, zijn deze kansen al+jd
benaderingen van hun limietwaarden
3) SUBJECTIEVE KANS
Soms is het onmogelijk om zeer veel trials uit te voeren (kans op een dodelijke meteorie+nslag)
è Kans op bepaalde uitkomst is gebaseerd a priori informa+e – met info dat men al heeX
è Bayesian sta8s8cs: sta+s+ek die vertrekt vanuit subjec+eve probabiliteit (Thomas Bayes)
Uitkomstenruimte (sample set; Ω)
= verzameling van alle mogelijke uitkomsten (dobbelsteen; Ω = {1, 2, 3, 4, 5, 6}, muntstuk; Ω = {K, M})
Uitkomstenruimte voor meerdere observa+es visualiseren in
boomdiagram (vb presta+es van studenten op een examen;
C=correct, I=incorrect)
è Elke lijn van de eerste set van 2 takken tot de derde set
van 8 takken bepaald een uitkomst in de uitkomstenruimte
è Uit boomdiagram kunnen we afleiden dat
studentenpresta+es op een examen bestaande uit 3
vragen 8 mogelijke uitkomsten hebben
,Gebeurtenis (event)
“Subset van uitkomstenruimte” of “deelverzameling van uitkomsten”
• Vb gebeurtenis A = “een zes gooien” = {6}
• Vb gebeurtenis B = “een even aantal ogen gooien” = {2, 4, 6}
Gebeurtenis A = alle studenten die 3 vragen incorrect beantwoord hebben
= {III}
Gebeurtenis B = alle studenten die minstens 1 vraag correct beantwoorden
= {CCC, CCI, CIC, CII, ICC, ICI, IIC}
Kans op een gebeurtenis
De kans op een gebeurtenis A wordt verkregen door de kansen van elk individuele uitkomst binnen
de gebeurtenis op te tellen, wanneer alle mogelijke uitkomsten dezelfde kans hebben geeX dit:
= regel van Laplace
Vb: de gebeurtenis A “een 4 gooien met een dobbelsteen” voorgesteld door de volgende
deelverzameling {4} uit de uitkomstenruimte {1, 2, 3, 4, 5, 6}
Gebeurtenis A heeX 1 mogelijke uitkomsten, totaal aantal uitkomsten in uitkomstenruimte = 6
è P(een 4 gooien) = 1/6
Doorsnede (intersec8on)
= de doorsnede van gebeurtenissen A en B impliceert dat beide gebeurtenissen tegelijk voorkomen
→A⋂B vb: kaart is een aas EN een harten
→ P(A ⋂ B) = P(B ⋂ A)
Disjuncte gebeurtenissen (disjoint events)
= gebeurtenissen die geen enkele uitkomst gemeenschappelijk hebben, komen niet tegelijk voor
→ A ⋂ B = ∅ en dus dat P(A ⋂ B) = 0 vb: kaart is een aas, kaart is een koning
→ gebeurtenis A en complement A^c per defini+e disjunct
Unie
= kans dat gebeurtenis A, gebeurtenis B, of beide tegelijk voorkomen
→ P(A ∪ B) vb: kaart is een aas OF een harten OF beide
→ P(A ∪ B) = P(B ∪ A)
2. Rekenregels voor kansen
a) COMPLEMENTREGEL
Complement van de gebeurtenis A = alle uitkomsten in de uitkomstenruimte die niet tot A behoren
,b) SOMREGEL
= kans op unie van gebeurtenis A en B
!! bij disjuncte gebeurtenissen is P(A ⋂ B) = 0 dus :
c) PRODUCTREGEL
Kans dat gebeurtenis A én gebeurtenis B voorkomen, OP VOORWAARDE DAT deze ONAFHANKELIJK
zijn (=uitkomst van eerste opbserva+e is onakankelijk van de uitkomst van de 2e observa+e) is gelijk
aan het product van de kans op A en de kans op B
P(A ⋂ B) = P(A) . P(B) → indien A en B ona*ankelijk zijn
Vb: kans dat 1e en 2e kind beide meisjes zijn – uitkomstenruimte: {MM, MJ, JM, JJ}
Twee gebeurtenissen:
- A = {1e kind is een meisje}
- B = {2e kind is een meisje}
, 3. Voorwaardelijke kansen
OnaCankelijke gebeurtenissen
= gebeurtenissen waarbij de kans op de ene gebeurtenis geen invloed heeX op de kans op de andere
gebeurtenis (vb kans op een meisje bij geboorte) *schema hierboven
ACankelijke gebeurtenissen
= gebeurtenissen waarbij de kans op de ene gebeurtenis wél invloed heeX op de kans op de andere
gebeurtenis (vb reclame voor nieuwe fasnood burger laat verkoop s+jgen)
VOORWAARDELIJKE KANSEN
- Indien A en B akankelijk zijn
- Indien A en B wél onakankelijk zijn
De voorwaardelijke kans op een gebeurtenis
A, gegeven B, is →
(Afgeleid uit de productregel voor akankelijke
kansen) Merk op: P(A |B) ≠ P(B | A) (rijpercentages versus kolompercentages in de kruistabel)
Regel van Bayes
We weten dat:
Dit resulteerd in de regel van Bayes: de ‘omkeerformule’
Bij kruistabel kan je gwn aflezen
ipv formule te gebruiken