lOMoARcPSD|3178494
Statistiek 2
Statistiek (Vrije Universiteit Brussel)
Scannen om te openen op Studocu
Studocu wordt niet gesponsord of ondersteund door een hogeschool of universiteit
Gedownload door Bebe GB ()
, lOMoARcPSD|3178494
Statistiek 2
Inhoud:
Inleiding: beschrijvende vs. Inferentiële statistiek, het concept kans
Kansrekenen, kansverdelingen en steekproeven-verdelingen
o Elementaire kansrekening
o Theoretische verdelingen
o Steekproevenverdelingen
o De centrale limietstelling
Inferentiële statistiek
o Betrouwbaarheidsintervallen
o Hypothesetoetsen op gemiddelden en percentages
o Vergelijking van 2 groepen
o Associatie tussen 2 categorische variabelen
o Bivariate lineaire regressie
o ANOVA
Inleiding
Beschrijvende vs. Inferentiële statistiek
Concept kans
Basisconcepten kansrekenen
Doelstellingen:
o Basisconcepten beschrijvende statistiek toelichten en kunnen berekenen
o Uitleggen wat beschrijvende en inferentiële statistiek zijn en vb kunnen geven
van beide soorten statistiek
o Relatie tussen toeval en kans uitgebreid kunnen bespreken
o Verschillende definities van kans kunnen geven
o Basisconcepten kansrekenen kunnen uitleggen en berekenen
Beschrijvende vs. Inferentiële statistiek
Beschrijvende of deductieve statistiek: beschrijven van de verzamelde gegevens
o Verzameling, organisatie en presentatie van de data
o Samenvatten van gegevens (a.d.h.v. statistieken, grafieken, tabellen,…)
teneinde globale patronen en kenmerken te ontdekken
o Vb: centrummaten en spreidingsmaten
steekproefstatistieken
inferentiële of inductieve statistiek: o.b.v. steekproef-gegevens conclusies trekken
m.b.t. de populatie
o de mate van betrouwbaarheid waarmee we van een steekproef naar een
bevolking kunnen generaliseren
o verklarende statistiek, maakt gebruik van kansrekening
o generalisatie van een steekproef Naar een populatie
parameters
steekproeven
een steekproef moet dezelfde karakteristieken hebben als van de populatie die het
vertegenwoordigd (representativiteit)
toevalssteekproef= iedereen evenveel kans om in de steekproef te zitten
Gedownload door Bebe GB ()
, lOMoARcPSD|3178494
o met teruglegging
o zonder teruglegging
variatie in steekproeven
concept kans
vb: het gooien met een dobbelsteen
kans op een 6? kans is 1 op 6 = 1:6= 1/6= 16,7%= 0,167
kans= een proportie kans neemt een waarde aan tussen 0 en 1 (€ (0,1))
het totaal van de kansen op alle waarden van een variabele= 1
randomness (toeval, onzekerheid) de mogelijke waarden zijn gekend, maar we
kennen de exacte waarde voor elke observatie niet
op korte termijn (weinig observaties) zeer onvoorspelbaar, uitkomsten van random
variabele kunnen zeer verschillend zijn van wat je zou verwachten
maar naarmate het aantal observaties stijgt, komt het aantal keren dat een bepaalde
uitkomst geobserveerd word steeds dichter bij wat je zou verwachten
kans dat je op lange termijn een 6 gooit met een dobbelsteen = cumulatieve
proportie
een random variabele (stochast, toevalsvariabele)
o verschillende waarden van variabele kunnen niet volledig a priori bepaald
worden
o kans kwantificeert radomness (een stochastische variabele) op lange termijn.
De kans op een bepaalde uitkomst is het aandeel van de uitkomst in het totaal
aantal uitkomsten op lange termijn
wet van de grote aantallen (law of large numbers)
o Jakob Bernoulli
o Aandeel van uitkomst in totaal aantal uitkomsten lijkt op lange termijn naar
een bepaalde waarde te convergeren
o Vb: bij herhaald werpen met dobbelsteen benadert de relatieve frequentie
van de uitkomst 6 op lange termijn de waarde 1/6
o Assumptie van onafhankelijkheid: uitkomst van een trial is onafhankelijk van
de uitkomst van andere trials.
2 definities van kans
o Theoretische kans:
Definitie: Verhouding tussen aantal gunstige uitkomsten over totaal
aantal uitkomsten
Op voorhand te bepalen
Op voorwaarde dat elke uitkomst dezelfde kans heeft op lange termijn
Voorgesteld door p
Vb: eerlijke dobbelstenen
=> probleem: soms onmogelijk om op voorhand kans te bepalen
o Empirische kans:
Definitie: de kans op ‘succes’: de limiet van de relatieve frequenties
(wanneer het aantal observaties oneindig word). De kans op een
bepaalde uitkomst is het aandeel van de uitkomst in het totaal aantal
uitkomsten op lange termijn.
Empirisch bepaald
Gedownload door Bebe GB ()
, lOMoARcPSD|3178494
=> probleem: de afhankelijkheid van observaties. Aangezien
oneindigheid nooit geobserveerd kan worden, zijn deze kansen altijd
benaderingen van hun limietwaarden.
Derde definitie
o Subjectieve definitie van kans
o Soms is het onmogelijk om zeer veel trials uit te voeren
o Kans op ‘succes’: de mate van vertrouwen dat uitkomst een ‘succes’ zal zijn,
gebaseerd op a priori informatie
o Bayesian statistics is een tak van de statistiek die vertrekt vanuit subjectieve
probabiliteit (thomas bayes)
Basisconcepten kansrekenen
Uitkomstenruimte (sample set)
o Verzameling van alle mogelijke uitkomsten
Vb: wanneer je een dobbelsteen eenmaal opgooit, is de
uitkomstenruimte1,2,3,4,5,6
Vb: wanneer je eenmaal een muntstuk opgoot, is de uitkomstenruimte
(K=kop, M=munt) K,M
Vb: tweemaal een muntstuk opgooien geeft KK,KM,MK,MM
o Hoeveel mogelijke uitkomsten zijn er in een uitkomstenruimte wanneer
verschillende trials plaatsvinden?
o Boomdiagram*
Gebeurtenis (event)
o Deelverzameling van uitkomsten
Vb. Gebeurtenis A = “een zes gooien” = {6} of
Gebeurtenis B = “een even aantal ogen gooien” = {2,4,6}
Vb. Bij worp met dobbelsteen: "Is de uitkomst een even
ogenaantal?” / "Heb je meer dan 4 gegooid?”
Deze vragen hebben betrekking op meer dan een uitkomst, de
eerste op de uitkomsten 2, 4 en 6, en de tweede op de
uitkomsten 5 en 6. De resultaten “even uitkomst” en “meer
ogen dan 4” zijn gebeurtenissen.
Deze worden voorgesteld door de respectievelijke
deelverzamelingen {2,4,6} en {5,6} van de uitkomstenruimte.
o Kans op een gebeurtenis
De kans op een gebeurtenis A (P(A)) wordt verkregen door de kansen
van elke individuele uitkomst binnen de gebeurtenis op te tellen.
Wanneer alle mogelijke uitkomsten dezelfde kans hebben, geeft dit:
Vb. Worp dobbelsteen: De gebeurtenis “een vier gooien met een
dobbelsteen” voorgesteld door de volgende deelverzameling {4} uit de
uitkomstenruimte {1,2,3,4,5,6}
heeft 1 mogelijke uitkomsten, totaal aantal uitkomsten in
uitkomstenruimte= 6 P(een vier gooien)=1/6
Contingentie tabellen
Gedownload door Bebe GB ()
Statistiek 2
Statistiek (Vrije Universiteit Brussel)
Scannen om te openen op Studocu
Studocu wordt niet gesponsord of ondersteund door een hogeschool of universiteit
Gedownload door Bebe GB ()
, lOMoARcPSD|3178494
Statistiek 2
Inhoud:
Inleiding: beschrijvende vs. Inferentiële statistiek, het concept kans
Kansrekenen, kansverdelingen en steekproeven-verdelingen
o Elementaire kansrekening
o Theoretische verdelingen
o Steekproevenverdelingen
o De centrale limietstelling
Inferentiële statistiek
o Betrouwbaarheidsintervallen
o Hypothesetoetsen op gemiddelden en percentages
o Vergelijking van 2 groepen
o Associatie tussen 2 categorische variabelen
o Bivariate lineaire regressie
o ANOVA
Inleiding
Beschrijvende vs. Inferentiële statistiek
Concept kans
Basisconcepten kansrekenen
Doelstellingen:
o Basisconcepten beschrijvende statistiek toelichten en kunnen berekenen
o Uitleggen wat beschrijvende en inferentiële statistiek zijn en vb kunnen geven
van beide soorten statistiek
o Relatie tussen toeval en kans uitgebreid kunnen bespreken
o Verschillende definities van kans kunnen geven
o Basisconcepten kansrekenen kunnen uitleggen en berekenen
Beschrijvende vs. Inferentiële statistiek
Beschrijvende of deductieve statistiek: beschrijven van de verzamelde gegevens
o Verzameling, organisatie en presentatie van de data
o Samenvatten van gegevens (a.d.h.v. statistieken, grafieken, tabellen,…)
teneinde globale patronen en kenmerken te ontdekken
o Vb: centrummaten en spreidingsmaten
steekproefstatistieken
inferentiële of inductieve statistiek: o.b.v. steekproef-gegevens conclusies trekken
m.b.t. de populatie
o de mate van betrouwbaarheid waarmee we van een steekproef naar een
bevolking kunnen generaliseren
o verklarende statistiek, maakt gebruik van kansrekening
o generalisatie van een steekproef Naar een populatie
parameters
steekproeven
een steekproef moet dezelfde karakteristieken hebben als van de populatie die het
vertegenwoordigd (representativiteit)
toevalssteekproef= iedereen evenveel kans om in de steekproef te zitten
Gedownload door Bebe GB ()
, lOMoARcPSD|3178494
o met teruglegging
o zonder teruglegging
variatie in steekproeven
concept kans
vb: het gooien met een dobbelsteen
kans op een 6? kans is 1 op 6 = 1:6= 1/6= 16,7%= 0,167
kans= een proportie kans neemt een waarde aan tussen 0 en 1 (€ (0,1))
het totaal van de kansen op alle waarden van een variabele= 1
randomness (toeval, onzekerheid) de mogelijke waarden zijn gekend, maar we
kennen de exacte waarde voor elke observatie niet
op korte termijn (weinig observaties) zeer onvoorspelbaar, uitkomsten van random
variabele kunnen zeer verschillend zijn van wat je zou verwachten
maar naarmate het aantal observaties stijgt, komt het aantal keren dat een bepaalde
uitkomst geobserveerd word steeds dichter bij wat je zou verwachten
kans dat je op lange termijn een 6 gooit met een dobbelsteen = cumulatieve
proportie
een random variabele (stochast, toevalsvariabele)
o verschillende waarden van variabele kunnen niet volledig a priori bepaald
worden
o kans kwantificeert radomness (een stochastische variabele) op lange termijn.
De kans op een bepaalde uitkomst is het aandeel van de uitkomst in het totaal
aantal uitkomsten op lange termijn
wet van de grote aantallen (law of large numbers)
o Jakob Bernoulli
o Aandeel van uitkomst in totaal aantal uitkomsten lijkt op lange termijn naar
een bepaalde waarde te convergeren
o Vb: bij herhaald werpen met dobbelsteen benadert de relatieve frequentie
van de uitkomst 6 op lange termijn de waarde 1/6
o Assumptie van onafhankelijkheid: uitkomst van een trial is onafhankelijk van
de uitkomst van andere trials.
2 definities van kans
o Theoretische kans:
Definitie: Verhouding tussen aantal gunstige uitkomsten over totaal
aantal uitkomsten
Op voorhand te bepalen
Op voorwaarde dat elke uitkomst dezelfde kans heeft op lange termijn
Voorgesteld door p
Vb: eerlijke dobbelstenen
=> probleem: soms onmogelijk om op voorhand kans te bepalen
o Empirische kans:
Definitie: de kans op ‘succes’: de limiet van de relatieve frequenties
(wanneer het aantal observaties oneindig word). De kans op een
bepaalde uitkomst is het aandeel van de uitkomst in het totaal aantal
uitkomsten op lange termijn.
Empirisch bepaald
Gedownload door Bebe GB ()
, lOMoARcPSD|3178494
=> probleem: de afhankelijkheid van observaties. Aangezien
oneindigheid nooit geobserveerd kan worden, zijn deze kansen altijd
benaderingen van hun limietwaarden.
Derde definitie
o Subjectieve definitie van kans
o Soms is het onmogelijk om zeer veel trials uit te voeren
o Kans op ‘succes’: de mate van vertrouwen dat uitkomst een ‘succes’ zal zijn,
gebaseerd op a priori informatie
o Bayesian statistics is een tak van de statistiek die vertrekt vanuit subjectieve
probabiliteit (thomas bayes)
Basisconcepten kansrekenen
Uitkomstenruimte (sample set)
o Verzameling van alle mogelijke uitkomsten
Vb: wanneer je een dobbelsteen eenmaal opgooit, is de
uitkomstenruimte1,2,3,4,5,6
Vb: wanneer je eenmaal een muntstuk opgoot, is de uitkomstenruimte
(K=kop, M=munt) K,M
Vb: tweemaal een muntstuk opgooien geeft KK,KM,MK,MM
o Hoeveel mogelijke uitkomsten zijn er in een uitkomstenruimte wanneer
verschillende trials plaatsvinden?
o Boomdiagram*
Gebeurtenis (event)
o Deelverzameling van uitkomsten
Vb. Gebeurtenis A = “een zes gooien” = {6} of
Gebeurtenis B = “een even aantal ogen gooien” = {2,4,6}
Vb. Bij worp met dobbelsteen: "Is de uitkomst een even
ogenaantal?” / "Heb je meer dan 4 gegooid?”
Deze vragen hebben betrekking op meer dan een uitkomst, de
eerste op de uitkomsten 2, 4 en 6, en de tweede op de
uitkomsten 5 en 6. De resultaten “even uitkomst” en “meer
ogen dan 4” zijn gebeurtenissen.
Deze worden voorgesteld door de respectievelijke
deelverzamelingen {2,4,6} en {5,6} van de uitkomstenruimte.
o Kans op een gebeurtenis
De kans op een gebeurtenis A (P(A)) wordt verkregen door de kansen
van elke individuele uitkomst binnen de gebeurtenis op te tellen.
Wanneer alle mogelijke uitkomsten dezelfde kans hebben, geeft dit:
Vb. Worp dobbelsteen: De gebeurtenis “een vier gooien met een
dobbelsteen” voorgesteld door de volgende deelverzameling {4} uit de
uitkomstenruimte {1,2,3,4,5,6}
heeft 1 mogelijke uitkomsten, totaal aantal uitkomsten in
uitkomstenruimte= 6 P(een vier gooien)=1/6
Contingentie tabellen
Gedownload door Bebe GB ()