Gegeven door Bernard De Baets
Herhaling middelbaar
En (⋀) betekent * of (⋁) betekent +
▪ P(A of B) = P(A u B) = P(A) + P(B) – P(A en B) = unie A u B {x| x ∈ 𝐴 ⋁ x ∈ 𝐵}
▪ P(niet A) = P(𝐴̅) = 1 – P(A) = complementregel
▪ P(A en B) = P(A n B) = P(A)*(P(B|A) = doorsnede A n B = P(B)*P(B|A) {x| x ∈ 𝐴 ⋀ x ∈ 𝐵}
Onafhankelijkheid als A de kans op B niet beïnvloed en omgekeerd
P(A) = P(A|B) en P(B) = P(B|A)
Afhankelijk als die gelijkheid niet geldt
Kansverdeling van een stochast X met waardenverzameling alle waarden die x binnen X kan aannemen
▪ X = som van 2 dobbelstenen
▪ Waardenverzameling = 2 – 12
▪ Kansverdeling geeft voor elke waarde x in de waardenverzameling de corresponderende kans P(X = x)
▪ Discreet: de waardenverzameling neemt aantal losstaande waarden aan
▪ Continu: de waarden in de verzameling kunnen alle waarden in een interval aannemen
Verwachtingswaarde E(X) = de waarde die je verwacht, voor elke x (bv 3) x*P(X=x) optellen = de verwachtingswaarde, 7 in het vb
Variantie Var(X) = de te verwachten kwadratische afwijking van de verwachtingswaarde met standaardafwijking = 𝝈(𝑿) = √𝒗𝒂𝒓(𝑿)
Soorten verdelingen met allemaal hun eigen formule voor P(X=x), E en Var
Discreet:
Uniforme verdeling alle waarden in de verzameling hebben dezelfde kans (1/n) bv 1 dobbelsteen werpen
Bernoulli slechts twee waarden succes (p) /mislukking (q = 1 – p) (succes soms wat raar bv bij dood = succes)
Binomiale verdeling bij n onafhankelijke herhalingen (terugleggen) van een experiment
Continu:
Normaalverdeling
Hoofdstuk 1: Klassieke Probabiliteitsleer
Een aftelbare verzameling = bevat oneindig veel elementen
| = waarvoor geldt bv S = {x| x ∈ ℝ}
S ⊆ T betekend dat S een deelverzameling van T is, als beide een deelverzameling van elkaar zijn is S = T
,Ω = het universum dat alles bevat
Disjunctie = als twee verzamelingen hun doorsnede leeg is
Gevolg: 2 disjunctie gebeurtenissen kunnen niet samen optreden (bv met dobbelsteen 1 of 4 smijten)
Bij disjunctie gebeurtenissen geldt dat P(A U B) = P(A) + P(B)
bv een patiënt die corona heeft en een behandeling heeft gekregen kan samen optreden
▪ Want niet-disjuncte verzamelingen hebben wel elementen gemeenschappelijk
De doorsnede van Sc n T = de doorsnede van niet-S en T
Een partitie van A = collectie niet-lege deelverzamelingen van A die disjunctie zijn (geen overlap) en hun unie = A
Probabilistische modellen
We gebruiken dit om een onzekere situatie te beschrijven dat voldoet aan volgende zaken
▪ Resultatenruimte 𝛀 = alle mogelijke uitkomsten van een experiment
o Oneindig aantal mogelijke uitkomsten = aftelbaar indien oneindig en niet aftelbaar → overaftelbaar
o Niet oneindig aantal uitkomsten = onaftelbaar
▪ Probabiliteitsmaat P = kent aan elke gebeurtenis A binnen Ω met A ⊆ Ω de probabiliteit toe: P(A) = de kans
o P(A) ≥ 0
o Voor elke twee disjuncte gebeurtenissen geldt P(A U B) = P(A) + P(B)
o Als Ω een oneindig aantal elementen bevat geldt voor elke collectie disjunctie gebeurtenissen:
o De probaliteit van de totale resultatenruimte = 1, P(Ω) = 1 met P(∅) = 0
Discreet probabilistisch model
De resultatenruimte Ω is eindig en wordt volledig door de probabiliteiten van de gebeurtenissen die één element bevatten bepaald
Zo is de probabiliteit voor gebeurtenis A = de som van de probabiliteiten van de elementen van A
Bv A = een even getal met dobbelsteen werpen, dan is P(A) = p(A = 2) + p(A = 4) + p(A = 6) = ½
dit is al een speciaal geval namelijk discrete uniforme probabiliteitsmaat aangezien elk element in A dezelfde kans heeft
Belangrijk binnen de resultatenruimte is dat de gebeurtenissen disjunct zijn (wil niet zeggen onafhankelijk!)
Voorbeelden van resultatenruimtes
▪ 10 keer met muntstuk smijten, elke keer 1 euro bij kop → {0, …, 10} met elk een gebeurtenis
▪ Met muntstuk spelen → {K,M} met gebeurtenissen {K,M}, {K}, {M}, ∅
▪ Nu met 2 keer muntstuk werpen → Ω is dan {KK, KM, MM, MK}
o Met dit de gebeurtenissen {KK}, {KM}, {MM} of {MK}
o = alle mogelijke deelverzamelingen van Ω
,Vaak zijn er teveel deelverzamelingen om ze allemaal gebeurtenissen te noemen, enkele eigenschappen
Als A een gebeurtenis is, is ook AC (= Ω\A) een gebeurtenis
De lege verzameling is ook een gebeurtenis
Bewerkingen met verzamelingen
Wetten van de Morgan
Verder op probabiliteitsmaten
Gezien dat er discrete (uniforme) probabiliteitsmaat is maar in vele gevallen geldt dit niet en de probabiliteit niet bepaald door de
gebeurtenissen met 1 element erin = continue modellen
Bv man en vrouw gaan op date en komen 0 tot 60min te laat, als iemand aankomt wacht de persoon 15min en vertrekt
Herschalen naar 0 – 1 te laat en wachten ¼, kunt dit in een grafiek voorstellen, een vierkant met zijde 1 = resultatenruimte met alle
mogelijke koppels (x,y) van hoeveel later ze aankomen, en dan kan je de gebeurtenis “ze ontmoeten elkaar” grafisch voorstellen als alle
koppels (x,y) waarvoor geldt dat |x – y| ≤ ¼ , dat de probabiliteit dat ze elkaar ontmoeten voorstelt
= algebraïsche notie resultatenruimte → grafisch voorgesteld
We werken hier in het continue geval waarbij de = in ≤ niet uitmaakt discrete geval
Eigenschappen van probabiliteitsmaten (+ zie ook pagina terug)
1) Als A ⊆ B met A en B gebeurtenissen, dan geldt dat P(A) ≤ P(B)
a. B is de unie van 2 disjunctie gebeurtenissen A en (Ac n B)
2) P(Ac) = 1 – P(A)
, 3) P(A) = P(A n B) + P(A n Bc) (de + wil hier niet of/doorsnede zeggen want staat niet binnen P( ))
Dit mag bij additiviteit aangezien A n B en A n Bc disjunct zijn
Bij disjunctie gebeurtenissen geldt dat P(A U B) = P(A) + P(B)
4) P(A U B) = P(A) + P(B) – P(A n B) (ook in vb hierboven te zien, als je P(A) en P(B) pakt, pak je 2 keer hun doorsnede dus 1 keer aftrekken)
A U B wordt hier als de unie van 2 disjunctie gebeurtenissen geschreven zodat je opnieuw dit bij additiviteit mag toepassen
5)
Conditionele probabiliteitsmaten (kansen)
We kennen al een deel van de info en op basis hiervan gaan we de probabiliteit opstellen
Zo weten we dat de uitkomst van het experiment binnen een gebeurtenis B behoort en proberen we de probabiliteit van gebeurtenis A
binnen B op te stellen = de conditionele kans P(A|B)
Wat de is de kans op gebeurtenis A gegeven B
Bv A = je smijt een 6 met de dobbelsteen en B = je smijt een even getal
P(A|B) is dan 1/3 terwijl P(A) = 1/6
We pakken dus de doorsnede van A en B
Deze conditionele kans kunnen we in een formule smijten
Het stelt de proportie van de probabiliteit van B voor die ingenomen wordt door A n B
P15 om aan te tonen dat de drie axioma’s voor probabiliteitsmaat voldaan zijn
▪ Alle eigenschappen voor een probabiliteitsmaat gelden dis ook voor conditionele kansen
o Zoals P(A u B) = P(A) + P(B) – P(A n B)
o Voor P(A u B|C) = P(A|C) + P(B|C) – P(A n B|C)
,!!Als je dus een gebeurtenis A conditioneert op een gebeurtenis B bv moet je dit overal toepassen!!
P(A) = P(A|C)P(C) + P(A|Cc)*P(Cc)
Conditioneren op B
P(A|B) = P(A|C n B)P(C|B) + P(A|Cc n B)*P(Cc|B)
Als er dus al op C of Cc geconditioneerd was, wordt de nieuwe conditioneren de doorsnede van de twee, hieronder aangetoond
Opeenvolgend conditioneren met #gebeurtenissen komt dus overeen met
eenmalig conditioneren met de doorsnede van deze gebeurtenissen
Zie voorbeeld 1.7 + 1.8 voor duidelijke illustratie conditionele kans
Elke knoop in een boodiagram kan als een gebeurtenis voorgesteld worden
zo is gebeurtenis B hierboven = {(C,A), (C, F), (Cc, A), (Cc, F)} = alle mogelijke uitkomsten
De vermenigvuldigingsregel! Zeker voorbeelden bekijken in cursus
Conditionele kansen wordt een veel makkelijk concept in je hoofd als je het gewoon op een boomdiagram voorsteld, en dan de takken die
vertrekken uit een knoop herschrijft als een conditionele kans, de kans op een blad is dan de kans op de knoop*tak
Deze trend kunnen we ook algemeen zo noteren, waarbij elke knoop de doorsnede is van zijn voorafgaande knopen en zichzelf
voor i = 3 geldt dan
,Totale probabiliteitsformule
De probabiliteit van B = de som van de probabiliteit van de doorsnedes van B met de partities
De gebeurtenis B kan dus opgedeeld worden een disjunctie unie van haar doorsnedes Ai n B:
De condtitionele kans van B gegeven C kan op volgende manier berekend worden
Elke som (elke i) is het product van de doorsnede van een Ai’met C = geel
maal de doorsnede van B met het voorgaande = groen
Voor i = 1 heeft C er een doorsnede mee maar is de doorsnede daarvan met B = 0
De Ai’s zijn een partitie en kunnen dus niet samen voorvallen = disjunct
Samen vormen de Ai’s de resultatenruimte
Intuïtieve verklaring P(Ai n C) > 0 betekend dat C en Ai tegelijk kunnen gebeuren
Aangezien P(Ai’n C) > 0, weet je dat als C is gebeurd, dan moet ook één van de Ai’s zijn gebeurd, voor elke Ai dat samen met C gebeurt
kijken we naar de kans dat dit gebeurd P(Ai|C) en als we weten dat zowel Ai als C gebeurd zijn P > 0, kijken we naar de kans dat B ook nog
eens gebeurd (dus B n C n Ai)
Door deze twee waarschijnlijkheden te vermenigvuldigen en alles op te tellen voor elke i krijg je de totale waarschijnlijkheid
Voorbeeld:
▪ 3 machines M1, M2, M3 die allemaal eenzelfde product maken
▪ Ze kunnen allemaal een defect model maken B
▪ Er is een controle C van de producten
▪ We willen de kans dat een product defect is gegeven dat het gecontroleerd is P(B|C)
Zie Gemini voor verdere uitwerking: https://g.co/gemini/share/3eb19496fdcd
De totale probabiliteitsformule kan herhaaldelijk toegepast worden in sequentiële experimenten
bv elke dag sta je met een goed/slecht humeur op, als je met slecht opstaat is kans op volgende
dag slecht groter en lager voor goed humeur → kijken wat de kans is op dag 3 dat je met goed humeur opstaan
met die kansen gegeven
P(H3) = P(H2)*P(H3|H2) + P(S2)*P(H3|S2) = P(H2)*___ + P(S2)*___
Nu hetzelfde voor P(H2) en P(S2) doen en zo tot H1 gaan
en alles terug invullen om de totale probabiliteit te bereken
Voorbeeld 1.17 mooi voorbeeld
,Regel van Bayes
Deze formule stelt ons in staat P(A|B) te bepalen als P(B|A) gegeven is met behulp van de totale probabiliteitsformule
Je wil bijvoorbeeld weten wat de kans is opdat de zwarte schaduw (B) op een röntgenfoto afkomstig is van een kwaadaardige tumor (A1)
terwijl het ook van een goedaardige kan zijn (A2) of iets anders (A3) → wil P(A1|B) bepalen, kan met regel van Bayes, in de noemer komen
alle mogelijke kansen om een schaduw te verkrijgen door de A-gebeurtenissen, in de teller de kans op een kwaadaardige tumor P(A1) en
de kans op een schaduw gegeven dat het een kwaadaardige is P(B|A1) = dus de kans dat het gedetecteerd wordt
Onafhankelijke gebeurtenissen
Het kan zijn dat een gebeurtenis A onafhankelijk is van een gebeurtenis B zodat geldt
P(A|B) = P(A)*
Eigenschap: 2 gebeurtenissen A en B worden onafhankelijk genoemd als P(A n B) = P(A)*P(B)
▪ P(A n B) = P(A)*P(B|A) of P(B)*P(A|B) (definitie conditionele kans)
▪ Uit * geldt dan het bovenstaande
Onafhankelijkheid van 2 gebeurtenissen nagaan:
Kijken of je de formule uitkomt
Voorbeeld 1.22
Opgelet! Onafhankelijkheid kan je vaak intuïtief inschatten maar valt moeilijk te visualiseren in een resultatenruimte
!!disjuncte gebeurtenissen A en B met P(A) > 0 en P(B) > 0 zijn NOOIT ONAFHANKELIJK aangezien (A n B) = ∅ → P = 0
→ A en B zijn disjunct dus ze kunnen nooit tegelijk gebeuren
→ onafhankelijke gebeurtenis betekend dat de kans dat A en B tegelijk gebeuren P(A n B) = het product van hun individuele kansen
(het feit dat A gebeurd heeft geen invloed op dat B gebeurt)
→ aangezien ze disjunct zijn is (A n B) = ∅ en dus P(A n B) = 0 = P(A)*P(B)
→ dit wil zeggen dat P(A) = 0 V P(B) = 0, dus als de ene kans = 0 zal de andere ≠ 0 wat wil zeggen dat de ene de andere beïnvloed -> Afh
Als A en B onafhankelijk zijn en de gebeurtenis van de ene dus de andere niet beïnvloed impliceert dit ook de volgende onafhankelijkheid
▪ A en Bc
▪ Ac en B
▪ Ac en Bc
Dit is ook uitbreidbaar voor een collectie van 3 onafhankelijke gebeurtenis, waarin ze paarsgewijs en met 3 onafhankelijk zijn
▪ P(A n B) = P(A)*P(B)
▪ P(B n C) = P(B)*P(C)
▪ P(A n C) = P(A)*P(C)
▪ P(A n B n C) = P(A)*P(B)*P(C)
!!! Drie gebeurtenissen A, B en K kunnen paargewijs onafhankelijk zijn (dus elk tweetal is onafhankelijk),
maar toch niet alle drie samen onafhankelijk → dus altijd kijken of aan de laatste vergelijking voldaan is
,Intermezzo hoe interpreteer je P(A n B n C) met bv
▪ A = 1ste worp is kop
▪ B = 2de worp is kop
▪ K = het aantal koppen is even (de worpen hebben een #uitkomst voor conditionele vb)
Alle drie hun individuele kans = ½ , de doorsnede kans = A, B en K doen zich gelijk voor (kan enkel bij ‘KK’ uitkomst), dus kans op KK = ¼
Ziet dat P(A n B n C) ≠ P(A)*P(B)*P(K) → niet onafhankelijk maar wel paarsgewijs
→ doorsnede dus gewoon zien als die gebeurtenissen gaan gelijk door
Conditionele onafhankelijkheid
Hoe bepalen of A en B conditioneel onafhankelijk zijn?
Formule utiwerken en gelijkheid zoeken
Zie voorbeeld hierboven P(A|K) = ½ en P(B|K) = ½
Maar P(A n B |K) = 0 → gelijkheid klopt niet
Uit voorbeeld 1.28 (mooie oef) stelt men vast dat twee gebeurtenissen A en B gegeven C conditioneel onafhankelijk kunnen zijn, maar A en
B wel afhankelijk van elkaar zijn
Telmethoden
Telprincipe Het aantal mogelijke resultaten (blaadjes in boomdiagram) van een experiment met r stappen
(r opsplitsingen) = aantal takken bij elke stap vermenigvuldigen met elkaar = aantal resultaten
Bv 2 resto’s, 3 soorten pizza’s, 4 soorten afleveringen (2*3*4 = 24 keuzes)
“hoeveel deelverzamelingen heeft een verzameling met n elementen {s1, s2, …., sn}”
Voor elk element (stap) beslissen pak ik hem of niet = 2 keuzes
Dus 2*2*2*… = 2n
Permutaties Je hebt een verzameling Ω met n elementen 0! = 1
k elementen worden één voor één (geordend) zonder terugleggen getrokken
= k-permutatie Pn,k
Als k = n krijg je Pn,n = n!
“hoeveel woorden kan met met 4 #letters maken”
k elementen worden één voor één (geordend) met terugleggen getrokken
= gordende trekking met teruglegging
het aantal manieren om k elementen dan uit n te pakken is niet meer Pn,k maar nk
“wat is de kans dat je uit n ballen k #ballen trekt met k ≤ n (als k > n lukt dit al niet = 0)”
Kan met k-permutatie Pn,k het aantal gunstige combo’s bepalen om dit te doen, dit dan
delen door nk = totaal aantal manieren hoe je k ballen met terugleggen uit n pak
P = #gunstig/#totaal
, Combinaties Je hebt een verzameling Ω met n elementen waaruit k elementen zonder teruglegging getrokken
worden waarbij de volgorde niet van belang is = ongeordende trekking zonder terugleggen
= combinatie van k uit n elementen = (𝑛𝑘)
Dan telprincipes toepassen om het aantal combo’s van k uit n elementen te bepalen
= het aantal deelverzamelingen van een gegeven verzameling met n element, elk uit k element
daarom is som van alle elementen op een rij = 2n
(zie ook bij telprincipe)
Toepassing: binomiaalcoëfficiënten uit de binomiaal driehoek waarbij n = rij (0 = rij 1 en k de plaats)
(𝑛0) = (𝑛𝑛) = 1
(𝑛𝑘) = (𝑛−1 𝑛
)
“wat is het aantal combinaties van twee uit vier letters A, B, C, D pakken” -> n = 4, k = 2: (42) = 6
Herhalingscombinatie = de variant van combinatie maar met terugleggen
Aantal mogelijke uitkomsten is dan niet meer (𝑛𝑘) maar (𝑛+𝑘−1
𝑘
)
“Een resto heeft n menu’s en k klanten die een menu kiezen, hoeveel combo’s zijn er”
Partities Je hebt een verzameling Ω met n elementen dat je in meerdere groepen indeelt
= herhalings- (bij combinatie deel je het in 2 groepen op, een groep met k elementen en een met n-k elementen)
permutatie
Groep 1 → n1 elementen Groep 2 → n2 elementen … Groep r → nr elementen met n1 + … = nr = n
Voor groep 1 heb je (𝑛𝑛 ) manieren om die groep te vormen, voor groep 2 (𝑛−𝑛1 𝑛2
) manieren want er
1
zijn al n1 elementen uit n gepakt, dit kun je blijven doen en vereenvoudigen als
Manieren om n1,n2,n3,… uit n te pakken =
“Hoeveel #lettersequenties kan je vormen met de letters van TATTOO”
Moeten telkens 6 posities gevuld worden en hebt keuze uit 3 T’s, 2 O’s en 1 A (3 groepen)
Voorbeeld 1.39!!!
Bovenstaande zaken zoals mutaties en combinaties kan je gebruiken om het aantal gunstige waarden te bepalen dat je dan op het totaal
aantal uitkomsten (nk vaak bv 10 keer kop of munt werpen, 210 soorten resultaten met elk een kans van 1/210) kan zetten om de kans te
bepalen op een gunstige waarde
, H1) Bevindingen uit oefeningen en inzichten
▪ Opgelet verwijzingen naar voorbeelden of pagina’s uit de cursus zijn naar de versie op OneNote, niet op papier
▪ In het continue doet de = in ≤ er niet toe in het discrete geval wel
▪ + betekent of/doorsnede en “en” betekent en/unie IN een kans bv P(A n B) = kans op A of B, niet bij P(A) + P(B)
je kan niet de unie of doorsnede van 2 kansen pakken…
▪ Bij disjunctie gebeurtenissen geldt dat P(A U B) = P(A) + P(B)
▪ Bij disjuncte gebeurtenissen zijn altijd afhankelijk
▪ Disjunctie: AnB=∅ want ze delen geen elementen (doorsnede leeg) → P(A n B) = 0
AUB=Ω samen vormen ze de resultatenruimte
▪ Onafhankelijk A⊥B P(A n B) = P(A)*P(B)
H2) Bevindingen uit oefeningen en inzichten
Nominale toevalsveranderlijke
Kan hiermee de uitkomsten in bepaalde klasse/categorie indelen
Nominale schaal: de labels hebben geen betekenisvolle ordening
Bv Belg, Nederlander of Jonagold (wij moeten da rieken fzo, DIKKE TEEF), Pink Lady
Ordinale toevalsveranderlijke
Ordinale schaal: de labels hebben wel een betekenisvolle ordening
Het heeft wel geen vaste eenheid: het verschil tussen 1 ster en 2 sterren is niet noodzakelijk hetzelfde als verschil bij 2 en 3
Bv nutri-score, aantal sterren van hotel
Kwantitatieve = reële toevalsveranderlijke
Kan uitgedrukt worden in een aantal vaste meeteenheden
Bv temperatuur en luchtvochtigheid, lengte en gewicht van individu, maandloon van individu
Kan hierom alle rekenkundige bewerkingen zinvol uitvoeren maar wel onderscheidt maken tussen
▪ Intervalschaal
o Bevat geen natuurlijk nulpunt = geen natuurlijke ondergrens
o Daarom kan je verhoudingen niet zinvol berekenen
o Bv tijd aflezen op een klok of temperatuur in C° en F: het verschil tussen 10°C en 20°C = het verschil tussen 0°C en
10°C maar het is niet zo dat 20°C “2 keer zo warm” is als 10°C → geen zinvolle verhoudingen
▪ Ratioschaal
o Bevat wel een absoluut nulpunt
o Bv lengte van een touw: 2cm is 2 keer zo lang als 1 cm