100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
Samenvatting

Samenvatting statistiek

Beoordeling
-
Verkocht
-
Pagina's
72
Geüpload op
28-12-2021
Geschreven in
2019/2020

Samenvatting statistiek












Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Documentinformatie

Geüpload op
28 december 2021
Aantal pagina's
72
Geschreven in
2019/2020
Type
Samenvatting

Voorbeeld van de inhoud

27/09/2019 STATISTIEK LES 2

HF2

2.1 Definities van waarschijnlijkheid

Voorkeur  H. Jeffreys begint eenvoudig  een waarschijnlijkheid is bij conventie een
getal die gelegen is tussen 0 en 1

In welke mate kan een gebeurtenis voorkomt = subjectief getal MAAR daarom niet
bruikbaar

Onderscheid tussen waarschijnlijkheid
1. Gewone waarschijnlijkheid: bv. je staat op zonder de radio, weerbericht, …  wat
moet ik aan doen? Gaat het regenen, zon, …? Intuïtief (subjectief) maak ik een
beoordeling en ik stel de kans op mooi weer is 60% = puur subjectieve
inschatting
2. Conditionele waarschijnlijkheid: op voorhand (in het verleden) naar het
weerbericht kijken en dan beslissen wat aan te doen = meestal betrouwbaar 
opnieuw inschatting maken welk weer het gaat zijn maar beïnvloed door
voorkennis = conditioneel

 De uitwerking niet kennen!!
Hoe rekenen met waarschijnlijkheden? Niet kennen wij gaan enkel zien hoe om er
mee om te gaan?

2.3 Stelling Bayes

Belangrijke stelling omdat confrontatie op een contra-intuïtieve manier
 P = waarschijnlijkheid
 A = gebeurtenis, toestand
 / = voorkennis die je hebt
 Bv. A hoge temperatuur en B de zon schijnt  als ik weet dat er een hoge
temperatuur is wat is dan de waarschijnlijkheid dat de zon schijnt?
 P(AB)/ P(B): conditionele AB waarschijnlijkheid kan je uitdrukken in niet
conditionele waarschijnlijkheid??
 P(BA)=P(BA):

Ipv met AB te werken kan je ook werken met hypothesen
 Ik wil weten of een wetenschappelijke hypothese waar is?
 Hoe? Bv. een bacterie wou een maagzweer kunnen veroorzaken  men gaat dan
op zoek naar gegevens

Voorbeeld:
Stel 2 zakken met zak 1 (hypothese 1) = 150 goud en 50 zilver en zak 2 (hypothese 2)
= 100 goud en 200 zilver

Iemand neemt een muntstuk uit een zak? Wat is de kans dat het muntstuk uit de eerste
zak komt?
 Kans uit 1ste zak is groter want meer goud in deze zak
 Als ik uit de eerste kans heb getrokken dan is de kans …
 Als je verhoudingen omdraait dan heb je de oplossing volgens de stelling 

Sensitiviteit en specificiteit = nauwkeurigheid van een voorspelling
Hoe goed of hoe slecht werkt iets?  Niet zomaar vertrouwen maar naar de algemene
kans krijgen

,Problems

2.1 pag 54

Task 1

Ga je de test kopen of niet om te weten of je de ziekte hebt of niet? Zie oplossing pag.
493
(P+) = de kans om positief te testen
+D = kans positief te testen gegeven de data (sensitiviteit)
P (D) = prevalentie ziekte voorkomen?

= kans is bedroevend laag dat je de ziekte gaat hebben omdat de prevalentie zo extreem
laag is

2.4

Als je niet goed weet welke vergelijkingen je moet gebruiken om tot een
waarschijnlijkheid te komen
Dan kun je simulaties maken  bv. gooien met dobbelstenen en zien hoe vaak komt het
voor
Als je niet alle mogelijkheden kunt uitputten 

Problems

Verklaring: kleiner ziekenhuis  minder geboorten  meer waarschijnlijkheid dat meer
dan 60% jongens zijn dan in een groter ziekenhuis

Zie handboek problems
Chapter 2  babies

Grafiek  meest linkse bolletje eerst dag dat gesimuleerd werd
Gemiddelde gaat configureren naar het juiste getal als je maar voldoende simulaties doet

Kleine ziekenhuis: 0%

Hoe meer simulaties hoe beter, niet alleen van belang hoeveel simulaties we doen MAAR

,Les 3 1/10/2019

3. Probability issues/ modules  we gaan model bouwen gebaseerd op
mathematische formules

Je zou de titel kunnen vervangen door …
Bv. autosalon  maand voor het autosalon verkoop je weinig, tijdens meer verkoop en
maanden erna minder

Wat met de som?
Weegt de meer verkoop met de investering?

Bestaande modellen gaan we gebruiken op het juiste tijdstip  verdelingen zien als het
hart van een statistisch model, neem dus de verdeling er uit en dan heb je geen model
meer

Wat was er eerst? Beschrijvende statistiek of waarschijnlijkheidsverdelingen?

3.1 Stastical measures

Modus = meest voorkomende waarde  het cijfer dat het vaakste voorkomt

Variantie = mate waarin de gegevens gespreid liggen maar dan wel rond het gemiddelde
 maanden waar je meer of minder verkoopt dan het gemiddelde? Dan heb je grote
variantie en als dit niet zo is kleine variantie

Skewness (scheefheid)  belangrijke kenmerken van wssheidsverdelingen
Als grafiek symmetrisch is: verticaal in 2 splitsen en links en recht is spiegelbeeld
Skweness = 0 dan symmetrisch

Kurtosis = mate waarin de verdeling een top heeft, piek heeft  beter interpreteren in de
termen van de staarten van de verdeling omdat het venijn in de staart zitten  hoe
groot zijn de staarten

 Meer voorlopig niet kennen

Gecenterde  zien we niet

3.2 Discrete distributions

Grenouille = model en stelt dat er maar 2 mogelijkheden zijn

Discreet want meer 2 mogelijke uitkomsten

Variabele verdeling: bv. de geboorte van de mens: man of vrouw
Er is een kans dat er een meisje wordt geboren of een jongen

Uitkomst van de variabele (X) kan gelijk zijn aan 1 = succes (geboorte meisje) 
hiervoor heb je een bepaalde wss dat dit gebeurt

1-b = faling (geboorte jongen)

2 uitkomsten = discrete verdeling

Hiervan kan je het gemiddelde, mediaan, … berekenen

Nut?

, Geen nut  gewoon de link leggen met het vorig hoofdstuk

3.2.2 biniomal verdeling: super belangrijk

5 uitroepteken = 5 x 4 x 3 x 2 x 1

Wat zegt de verdeling? Als je een bernouille experiment hebt en je herhaalt dit een
aantal keer op een onafhankelijke manier
Eerste keer succes wil niet zeggen dat je volgende keer ook een succes gaat hebben,
geen invloed op elkaar
Wat is de kans na de herhalingen dat het aantal successen x gelijk is aan het getal y?

Vorige les vb gezien over ziekenhuis: geboorten = grenouille want maar 2
veronderstellingen

Je kan kans op succes exact berekenen  mathematisch berekenen
= statistisch model om een uitspraak te doen

Je hoeft niet te stimuleren maar via deze theorie kan je het berekenen

3.2.2.7 voorbeeld

Ik heb keuze tussen 2 situaties: ik gebruik simulaties of het model  voorkeur model als
je weet dat het model geschikt/ gepast is  maak een veronderstelling en dan kan je
kiezen wat je kiest

Wat kan er mislopen bij de biniomaal verdeling van de baby’s met de assumptie dat dit
probleem kan worden opgelost? Geboortes moeten onafhankelijk zijn van elkaar anders
kan je dit stastisch model niet gebruiken

Hoe kan het in de praktijk mislopen? Bv. op het platteland waar veel vervuiling is en een
invloed hebben op de geboortes  geboortes zijn dan niet onafhankelijk van elkaar  je
mag ze niet loskopellen van elkaar en kan je dus deze methode niet gebruiken

Ander voorbeeld:

Bv. productiebedrijf aan de lopende band  stel producten succesvol geassembleerd
Stel klant die 1000 stuks nodig heeft en je weet dat de grondstoffen soms niet voldoen
en dan moet je dus meer produceren  je kan nu bereken hoeveel % kans misloopt? Op
voorwaarde dat de onafhankelijkheid bewaart blijft. De band loopt bv. niet meer verder is
niet onafhankelijk.

Continue verdelingen  op horizontale as continue verdeling

Uniforme verdelingen/ rechthoekige verdelingen???

3.3.1

Dichtheidsfunctie: oppervlakte onder de curve = 1  dan kan je
waarschijnlijkheidsuitspraken doen
Elk punt tussen a en b heeft dezelfde wss

Vb. Digitale pc werkt obv random getallen  hierop gebaseerd
Nuttig? Voor simulaties want zo hebben we een uniforme verdeling om van te vertrekken
 We genereren random getallen en met deze getallen ??????

= basismodel: alles heeft evenveel kans

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
audecloetens Katholieke Universiteit Leuven
Bekijk profiel
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
18
Lid sinds
5 jaar
Aantal volgers
16
Documenten
51
Laatst verkocht
2 jaar geleden

5,0

1 beoordelingen

5
1
4
0
3
0
2
0
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via Bancontact, iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo eenvoudig kan het zijn.”

Alisha Student

Veelgestelde vragen