Kansrekenen en beschrijvende statistiek
Inleiding
Statistiek = informatie krijgen uit data of gegevens
Data is meestal aanwezig in steekproeftrekkingen
Een hypothesetoets is een methode in de statistiek om met behulp van data te beslissen
of een hypothese klopt of niet
- Nulhypothese H0 uitgangspunt, vaak "er is geen effect/verschil".
- Alternatieve hypothese H1: wat we willen aantonen (effect, verschil, relatie).
- Het verschil tussen beide krijg je door te bepalen hoe hard het afhangt van toeval
o Hiervoor gebruiken we het begrip kans
o Voorbeeld:
▪ De kans op kop is 0,5
▪ De kans op 18x kop achter elkaar is eerder toeval maar er is een
kans namelijk: 0,0004
o Een kans is dus wiskundige taal om toeval meet- en rekenbaar te maken
- Stel dat je een verdachte in de rechtbank hebt:
o Nulhypothese: de verdachte is onschuldig.
o Alternatieve hypothese: de verdachte is schuldig.
Je gaat niet meteen aannemen dat iemand schuldig is‚ eerst moet je bewijs
hebben dat sterk genoeg is om de nulhypothese te verwerpen.
Zo werkt het ook in statistiek:
o H 0= onschuld (geen effect)
o H1 = schuld (wel effect)
▪ De data = bewijs
- Statistiek wordt nagegaan door deductie dit is:
o Als 5>3 en 3>1 dan is 5>1
,
,Hoofdstuk 1 Kansrekenen
Belangrijke begrippen:
- Kanslimieten → data sets zijn soms zo groot dat we ze bijna kunnen zien als een
limiet voor oneindig veel gegevens
- Voorwaardelijke kans → hoe kansen veranderen als er gegevens bij komen
- Onafhankelijkheid → één verschijnsel wordt niet beïnvloed door een ander
fenomeen
In veel wetenschappen doe je een experiment en kan je de uitkomst al narekenen echter
het resultaat na een werp van een dobbelsteen kan je niet op voorhand weten:
∆𝑥
- Deterministische experimenten → Je kan de uitkomst al berekenen (v = ∆𝑡 )
- Stochastische experimenten → uitkomst niet gekend op voorhand (worp)
De verzameling van alle mogelijke uitkomsten → universum of
uitkomstenverzameling =
Elke deelverzameling A van = gebeurtenis
- Bv deelverzameling “hoger dan 4” A = {5,6}
Verzameling van alle mogelijke gebeurtenissen = 𝟐𝛀
- Bv = {1,2}
o { {1},{1,2}, {2} , {𝜙} } → = 22 = 4
o Want 𝝓 is altijd een element van het is de onmogelijke gebeurtenis
▪ Dit is de lege gebeurtenis dit is altijd een deelverzameling van
Ω is een zekere gebeurtenis omdat wat de uitkomst ook is ze zeker tot Ω behoort
, Benaderingen van het kansbegrip
→ kans wordt gebruikt om te rekenen met toeval, het is de waarschijnlijkheid dat iets
gebeurt.
Er zijn verschillende manieren om een kans te berekenen
1) Kans als relatieve frequentie
o Bij een oneindig aantal uitvoeringen wordt de kans bekend dus dan geldt:
▪ Nadeel is dat het niet oneindig kan worden uitgevoerd
▪ Hierbij is P(A) de kans op A met S het geslaagde en n uitgevoerd
𝑆(𝑛)
𝑃(𝐴) = lim
𝑛→∞ 𝑛
2) Definitie van Laplace → voorwaarde = alle gebeurtenissen even waarschijnlijk
(nadeel) (bv de kans op een 2 bij een dobbelsteen is evengroot als een 6)
o De kans op gebeurtenis A is:
#𝐴
𝑃(𝐴) =
#
Inleiding
Statistiek = informatie krijgen uit data of gegevens
Data is meestal aanwezig in steekproeftrekkingen
Een hypothesetoets is een methode in de statistiek om met behulp van data te beslissen
of een hypothese klopt of niet
- Nulhypothese H0 uitgangspunt, vaak "er is geen effect/verschil".
- Alternatieve hypothese H1: wat we willen aantonen (effect, verschil, relatie).
- Het verschil tussen beide krijg je door te bepalen hoe hard het afhangt van toeval
o Hiervoor gebruiken we het begrip kans
o Voorbeeld:
▪ De kans op kop is 0,5
▪ De kans op 18x kop achter elkaar is eerder toeval maar er is een
kans namelijk: 0,0004
o Een kans is dus wiskundige taal om toeval meet- en rekenbaar te maken
- Stel dat je een verdachte in de rechtbank hebt:
o Nulhypothese: de verdachte is onschuldig.
o Alternatieve hypothese: de verdachte is schuldig.
Je gaat niet meteen aannemen dat iemand schuldig is‚ eerst moet je bewijs
hebben dat sterk genoeg is om de nulhypothese te verwerpen.
Zo werkt het ook in statistiek:
o H 0= onschuld (geen effect)
o H1 = schuld (wel effect)
▪ De data = bewijs
- Statistiek wordt nagegaan door deductie dit is:
o Als 5>3 en 3>1 dan is 5>1
,
,Hoofdstuk 1 Kansrekenen
Belangrijke begrippen:
- Kanslimieten → data sets zijn soms zo groot dat we ze bijna kunnen zien als een
limiet voor oneindig veel gegevens
- Voorwaardelijke kans → hoe kansen veranderen als er gegevens bij komen
- Onafhankelijkheid → één verschijnsel wordt niet beïnvloed door een ander
fenomeen
In veel wetenschappen doe je een experiment en kan je de uitkomst al narekenen echter
het resultaat na een werp van een dobbelsteen kan je niet op voorhand weten:
∆𝑥
- Deterministische experimenten → Je kan de uitkomst al berekenen (v = ∆𝑡 )
- Stochastische experimenten → uitkomst niet gekend op voorhand (worp)
De verzameling van alle mogelijke uitkomsten → universum of
uitkomstenverzameling =
Elke deelverzameling A van = gebeurtenis
- Bv deelverzameling “hoger dan 4” A = {5,6}
Verzameling van alle mogelijke gebeurtenissen = 𝟐𝛀
- Bv = {1,2}
o { {1},{1,2}, {2} , {𝜙} } → = 22 = 4
o Want 𝝓 is altijd een element van het is de onmogelijke gebeurtenis
▪ Dit is de lege gebeurtenis dit is altijd een deelverzameling van
Ω is een zekere gebeurtenis omdat wat de uitkomst ook is ze zeker tot Ω behoort
, Benaderingen van het kansbegrip
→ kans wordt gebruikt om te rekenen met toeval, het is de waarschijnlijkheid dat iets
gebeurt.
Er zijn verschillende manieren om een kans te berekenen
1) Kans als relatieve frequentie
o Bij een oneindig aantal uitvoeringen wordt de kans bekend dus dan geldt:
▪ Nadeel is dat het niet oneindig kan worden uitgevoerd
▪ Hierbij is P(A) de kans op A met S het geslaagde en n uitgevoerd
𝑆(𝑛)
𝑃(𝐴) = lim
𝑛→∞ 𝑛
2) Definitie van Laplace → voorwaarde = alle gebeurtenissen even waarschijnlijk
(nadeel) (bv de kans op een 2 bij een dobbelsteen is evengroot als een 6)
o De kans op gebeurtenis A is:
#𝐴
𝑃(𝐴) =
#