80% oefeningen
formularium en tabellenbundel gegeven op examen (maar sommige wel nog zelf uit je hoofd ke)
INLEIDING
BEGRIPPEN
experimentele eenheden = de bestudeerde objecten (bv: studenten)
populatie = alle experimentele eenheden (bv: alle studenten aan de Ugent)
variabele = kenmerk van een individuele eenheid uit de populatie (bv: lengte, studieresultaat)
steekproef = deelverzameling van populatie (bv: 20 willekeurige studenten)
statistische gevolgtrekking = veralgemening vanuit de steekproef naar de populatie
betrouwbaarheidsmaat = uitspraak over de (on)zekerheid van de statistische gevolgtrekking
o Soorten variabelen
kwantitatieve variabele = een getal (bv: leeftijd)
kwalitatieve variabele = een kenmerk (bv: geslacht) --> kunnen ook als cijfer 0/1 zijn
discrete variabele = eindig aantal waarden die gehele getallen zijn (bv: aantal studenten)
continue variabele = ook tussenliggende waarden (bv: gewicht, afstand, …)
o Meetschaal
bepaalt welke wiskundige bewerkingen we kunnen toepassen op data
bv: 14 = rugnummer voetballer OF punten op examen OF 14 de plaats in een wedstrijd
nominale schaal = niet ordenbaar (bv: geslacht)
ordinale schaal = ordenbaar (bv: mening in enquête van zeer goed naar zeer slecht)
intervalschaal = ordenbaar + gelijke verschillen hebben zelfde betekenis (bv: temp in °C)
ratioschaal = ordenbaar + gelijke verschillen + absoluut nulpunt, kan niet onder 0 (bv: lengte)
o Parameters van ligging
modus = waarde van de variabele met hoogste aantal waarnemingen (frequentie)
mediaan = grenswaarde die de gerangschikte waarneming in 2 gelijke groepen verdeeld
rekenkundig gemiddelde = som alle waarnemingen (x1, x2, …) gedeeld door totale aantal
waarnemingen (n)
variantie = gemiddelde gekwadrateerde afwijking van de waarnemingen tov rekenkundig
gemiddelde
standaardafwijking = positieve vierkantswortel van de variantie
, STOCHASTISCHE VARIABELEN
= variabele die numerieke waarden aanneemt bij toevallige uitkomsten van een experiment
bij elke uitkomst wordt slechts 1 waarde aangenomen
o Discrete stochastische variabelen
= kunnen slechts een eindig aantal waarden aannemen
bv: opwerpen 2 muntstukken
kanshistogram -------------------------------------------------------------------------------------->
verwachtingswaarde μ = E(x) = Σx * p(x)
variantie σ2 = Σ(x – μ)2 * p(x)
standaardafwijking σ = √ σ 2
o Continue stochastische variabelen
= neemt oneindig aantal waarden aan
bv: tijdsduur tussen 2 meldingen bij de ‘112’
kansdichtheidsfunctie ------------------------------------------->
b
P(a ≪ x ≪ b) = ∫ f ( x ) dx
a
VERDELINGEN
o Binomiale verdeling (discreet) = X β (n ; p)
kenmerken:
1) Rij van n identieke deelexperimenten
2) Elk deelexperiment heeft 2 mogelijke uitkomsten: succes en mislukking
3) De kans op succes (of mislukking) is dezelfde bij elk deelexperiment
4) De deelexperimenten zijn onafhankelijk van elkaar
n = aantal deelexperimenten
x = aantal keer succes
p = kans op succes per deelexperiment
bv: rol 5 keer na elkaar een dobbelsteen, en noteer aantal keer dat je meer dan 4 ogen
gooit, wat is de kans dat dit aantal gelijk is aan 4?
1
= X β (5 ; ) P[X = 4]
3
=
verwachtingswaarde μ = n*p
variantie σ2 = n*p(1-p)
standaardafwijking σ = √ np(1− p)
, o Normale verdeling (continu) = X N(μ,σ)
μ = verwachtingswaarde
σ = standaardafwijking
normale verdeling (z) met μ=0 en σ=1
−1 2
1 2
∗z
= f(z) = e
√2 π
oefening 1:
Gebruiksduur (X) in uur tussen oplaadbeurten van gsm-batterij is normaal verdeeld met
μ=10 en σ=1,5. Wat is de kans dat de gsm moet worden opgeladen tussen 9 en 12 uren dat
je hem gebruikt hebt
=X N(10; 1,5)
P[9≪ X≪ 12] = P[-0,67≪ z≪ 1,33]
= P[-0,67≪ z≪ 0] + P[0≪ z≪ 1,33] (opzoeken in de tabel)
= P[0≪ z≪ 0,67] + 0,4082
= 0,2486 + 0,4082
= 0,6568
.
oefening 2:
Bepaal de grenswaarde g van X waarvoor er slechts 5% kans bestaat dat de gsm nog niet
dient te worden opgeladen, normaal verdeeld met μ=10 en σ=1,5.
P[ X ≥g] = 0,05
P[z≥( g−10)/1,5 ] = 0,05
P[0≪ z ≪ ¿ g-10) /1,5] = 0,45
=> (g-10)/1,5 = 1,645
=> g = 10 + 1,645 * 1,5 = 12,47 (uur)
elke helft van de grafiek is 0,5. Dit wil zeggen dat het groene deel een kans met waarde
van 0,45 heeft, deze waarde opzoeken in de tabel en hierbij krijg je grenswaarde 1,645
praktische regels:
1) spiegelen: P[X < -a] = P[X > a]
2) complement: P[X > a] = 1 – P[X < a]
o Soms kan binomiale verdeling benaderd worden door een normale verdeling
= X β (n ; p) benaderen door N(n*p ; √ np(1− p) )
VOORWAARDE: bij n≥30 en zowel n*p ≥ 5 en n*(1-p) ≥ 5
(zal in deze cursus altijd voldaan zijn)
OPGELET: continuïteitscorrectie
STEEKPROEFGROOTHEDEN
o Begrippen
parameter = numerieke beschrijvende maat voor een populatie (meestal onbekend)
steekproefgrootheid = numerieke beschrijvende maat voor een steekproef, wordt berekend
uit waarnemingen in de steekproef, zo een onbekende parameter schatten
steekproefvariabiliteit = uitkomst varieert van steekproef tot steekproef
steekproefverdeling = de kansverdeling van een steekproefgrootheid