100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.2 TrustPilot
logo-home
Summary

Samenvatting statistiek

Rating
-
Sold
-
Pages
72
Uploaded on
28-12-2021
Written in
2019/2020

Samenvatting statistiek

Institution
Course











Whoops! We can’t load your doc right now. Try again or contact support.

Written for

Institution
Study
Course

Document information

Uploaded on
December 28, 2021
Number of pages
72
Written in
2019/2020
Type
Summary

Subjects

Content preview

27/09/2019 STATISTIEK LES 2

HF2

2.1 Definities van waarschijnlijkheid

Voorkeur  H. Jeffreys begint eenvoudig  een waarschijnlijkheid is bij conventie een
getal die gelegen is tussen 0 en 1

In welke mate kan een gebeurtenis voorkomt = subjectief getal MAAR daarom niet
bruikbaar

Onderscheid tussen waarschijnlijkheid
1. Gewone waarschijnlijkheid: bv. je staat op zonder de radio, weerbericht, …  wat
moet ik aan doen? Gaat het regenen, zon, …? Intuïtief (subjectief) maak ik een
beoordeling en ik stel de kans op mooi weer is 60% = puur subjectieve
inschatting
2. Conditionele waarschijnlijkheid: op voorhand (in het verleden) naar het
weerbericht kijken en dan beslissen wat aan te doen = meestal betrouwbaar 
opnieuw inschatting maken welk weer het gaat zijn maar beïnvloed door
voorkennis = conditioneel

 De uitwerking niet kennen!!
Hoe rekenen met waarschijnlijkheden? Niet kennen wij gaan enkel zien hoe om er
mee om te gaan?

2.3 Stelling Bayes

Belangrijke stelling omdat confrontatie op een contra-intuïtieve manier
 P = waarschijnlijkheid
 A = gebeurtenis, toestand
 / = voorkennis die je hebt
 Bv. A hoge temperatuur en B de zon schijnt  als ik weet dat er een hoge
temperatuur is wat is dan de waarschijnlijkheid dat de zon schijnt?
 P(AB)/ P(B): conditionele AB waarschijnlijkheid kan je uitdrukken in niet
conditionele waarschijnlijkheid??
 P(BA)=P(BA):

Ipv met AB te werken kan je ook werken met hypothesen
 Ik wil weten of een wetenschappelijke hypothese waar is?
 Hoe? Bv. een bacterie wou een maagzweer kunnen veroorzaken  men gaat dan
op zoek naar gegevens

Voorbeeld:
Stel 2 zakken met zak 1 (hypothese 1) = 150 goud en 50 zilver en zak 2 (hypothese 2)
= 100 goud en 200 zilver

Iemand neemt een muntstuk uit een zak? Wat is de kans dat het muntstuk uit de eerste
zak komt?
 Kans uit 1ste zak is groter want meer goud in deze zak
 Als ik uit de eerste kans heb getrokken dan is de kans …
 Als je verhoudingen omdraait dan heb je de oplossing volgens de stelling 

Sensitiviteit en specificiteit = nauwkeurigheid van een voorspelling
Hoe goed of hoe slecht werkt iets?  Niet zomaar vertrouwen maar naar de algemene
kans krijgen

,Problems

2.1 pag 54

Task 1

Ga je de test kopen of niet om te weten of je de ziekte hebt of niet? Zie oplossing pag.
493
(P+) = de kans om positief te testen
+D = kans positief te testen gegeven de data (sensitiviteit)
P (D) = prevalentie ziekte voorkomen?

= kans is bedroevend laag dat je de ziekte gaat hebben omdat de prevalentie zo extreem
laag is

2.4

Als je niet goed weet welke vergelijkingen je moet gebruiken om tot een
waarschijnlijkheid te komen
Dan kun je simulaties maken  bv. gooien met dobbelstenen en zien hoe vaak komt het
voor
Als je niet alle mogelijkheden kunt uitputten 

Problems

Verklaring: kleiner ziekenhuis  minder geboorten  meer waarschijnlijkheid dat meer
dan 60% jongens zijn dan in een groter ziekenhuis

Zie handboek problems
Chapter 2  babies

Grafiek  meest linkse bolletje eerst dag dat gesimuleerd werd
Gemiddelde gaat configureren naar het juiste getal als je maar voldoende simulaties doet

Kleine ziekenhuis: 0%

Hoe meer simulaties hoe beter, niet alleen van belang hoeveel simulaties we doen MAAR

,Les 3 1/10/2019

3. Probability issues/ modules  we gaan model bouwen gebaseerd op
mathematische formules

Je zou de titel kunnen vervangen door …
Bv. autosalon  maand voor het autosalon verkoop je weinig, tijdens meer verkoop en
maanden erna minder

Wat met de som?
Weegt de meer verkoop met de investering?

Bestaande modellen gaan we gebruiken op het juiste tijdstip  verdelingen zien als het
hart van een statistisch model, neem dus de verdeling er uit en dan heb je geen model
meer

Wat was er eerst? Beschrijvende statistiek of waarschijnlijkheidsverdelingen?

3.1 Stastical measures

Modus = meest voorkomende waarde  het cijfer dat het vaakste voorkomt

Variantie = mate waarin de gegevens gespreid liggen maar dan wel rond het gemiddelde
 maanden waar je meer of minder verkoopt dan het gemiddelde? Dan heb je grote
variantie en als dit niet zo is kleine variantie

Skewness (scheefheid)  belangrijke kenmerken van wssheidsverdelingen
Als grafiek symmetrisch is: verticaal in 2 splitsen en links en recht is spiegelbeeld
Skweness = 0 dan symmetrisch

Kurtosis = mate waarin de verdeling een top heeft, piek heeft  beter interpreteren in de
termen van de staarten van de verdeling omdat het venijn in de staart zitten  hoe
groot zijn de staarten

 Meer voorlopig niet kennen

Gecenterde  zien we niet

3.2 Discrete distributions

Grenouille = model en stelt dat er maar 2 mogelijkheden zijn

Discreet want meer 2 mogelijke uitkomsten

Variabele verdeling: bv. de geboorte van de mens: man of vrouw
Er is een kans dat er een meisje wordt geboren of een jongen

Uitkomst van de variabele (X) kan gelijk zijn aan 1 = succes (geboorte meisje) 
hiervoor heb je een bepaalde wss dat dit gebeurt

1-b = faling (geboorte jongen)

2 uitkomsten = discrete verdeling

Hiervan kan je het gemiddelde, mediaan, … berekenen

Nut?

, Geen nut  gewoon de link leggen met het vorig hoofdstuk

3.2.2 biniomal verdeling: super belangrijk

5 uitroepteken = 5 x 4 x 3 x 2 x 1

Wat zegt de verdeling? Als je een bernouille experiment hebt en je herhaalt dit een
aantal keer op een onafhankelijke manier
Eerste keer succes wil niet zeggen dat je volgende keer ook een succes gaat hebben,
geen invloed op elkaar
Wat is de kans na de herhalingen dat het aantal successen x gelijk is aan het getal y?

Vorige les vb gezien over ziekenhuis: geboorten = grenouille want maar 2
veronderstellingen

Je kan kans op succes exact berekenen  mathematisch berekenen
= statistisch model om een uitspraak te doen

Je hoeft niet te stimuleren maar via deze theorie kan je het berekenen

3.2.2.7 voorbeeld

Ik heb keuze tussen 2 situaties: ik gebruik simulaties of het model  voorkeur model als
je weet dat het model geschikt/ gepast is  maak een veronderstelling en dan kan je
kiezen wat je kiest

Wat kan er mislopen bij de biniomaal verdeling van de baby’s met de assumptie dat dit
probleem kan worden opgelost? Geboortes moeten onafhankelijk zijn van elkaar anders
kan je dit stastisch model niet gebruiken

Hoe kan het in de praktijk mislopen? Bv. op het platteland waar veel vervuiling is en een
invloed hebben op de geboortes  geboortes zijn dan niet onafhankelijk van elkaar  je
mag ze niet loskopellen van elkaar en kan je dus deze methode niet gebruiken

Ander voorbeeld:

Bv. productiebedrijf aan de lopende band  stel producten succesvol geassembleerd
Stel klant die 1000 stuks nodig heeft en je weet dat de grondstoffen soms niet voldoen
en dan moet je dus meer produceren  je kan nu bereken hoeveel % kans misloopt? Op
voorwaarde dat de onafhankelijkheid bewaart blijft. De band loopt bv. niet meer verder is
niet onafhankelijk.

Continue verdelingen  op horizontale as continue verdeling

Uniforme verdelingen/ rechthoekige verdelingen???

3.3.1

Dichtheidsfunctie: oppervlakte onder de curve = 1  dan kan je
waarschijnlijkheidsuitspraken doen
Elk punt tussen a en b heeft dezelfde wss

Vb. Digitale pc werkt obv random getallen  hierop gebaseerd
Nuttig? Voor simulaties want zo hebben we een uniforme verdeling om van te vertrekken
 We genereren random getallen en met deze getallen ??????

= basismodel: alles heeft evenveel kans

Get to know the seller

Seller avatar
Reputation scores are based on the amount of documents a seller has sold for a fee and the reviews they have received for those documents. There are three levels: Bronze, Silver and Gold. The better the reputation, the more your can rely on the quality of the sellers work.
audecloetens Katholieke Universiteit Leuven
Follow You need to be logged in order to follow users or courses
Sold
18
Member since
5 year
Number of followers
16
Documents
51
Last sold
2 year ago

5.0

1 reviews

5
1
4
0
3
0
2
0
1
0

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions