HERHALING
Begrippen
Basiselementen van de statistiek
• Experimentele eenheden
De bestudeerde objecten
Vb. studenten
• De populatie
De verzameling experimentele eenheden
Vb. alle studenten aan de UGent
• Variabele
Kenmerk of eigenschap van een individuele eenheid uit de populatie
Vb. studieresultaat
• Steekproef
Deelverzameling van de populatie
Vb. 20 willekeurig gekozen studenten
• Statistische gevolgtrekking
Veralgemening vanuit de steekproef naar de populatie
• Betrouwbaarheidsmaat
Uitspraak over de (on)zekerheid van de statistische gevolgtrekking
Soorten variabelen
Kwantitatieve variabelen Kwalitatieve variabelen Discrete variabelen Continue variabelen
Kan eindig of aftelbaar
Indien ook
oneindig aantal
Een getal Een kenmerk tussenliggende waarden
verschillende waarden
mogelijk zijn
aannemen
Vb. leeftijd Vb. geslacht Vb. aantal studenten Vb. gewicht, afstand, …
Soorten meetschalen
KWALITATIEF KWANTITATIEF
Meetschaal 1) Nominale schaal 2) Ordinale schaal 3) Intervalschaal 4) Ratio schaal
- ordenbaar - ordenbaar
- gelijke verschillen - gelijke verschillen
- Niet-ordenbaar
hebben dezelfde hebben dezelfde
Eigenschap - Enkel opsomming - Ordenbaar
betekenis betekenis
mogelijk
- geen absoluut - absoluut nulpunt (0
nulpunt = ‘treedt niet op’)
Voorbeeld Vb. bij mening van Vb. hoeveel glazen
Vb. geslacht, ja-nee
een enquête: goed, drink je? A) 0-1 Vb. inkomen
vraag, …
matig, slecht B) 1-3 C) 3-6?
1
, Dus: getallen kunnen een verschillende betekenis hebben in
!!! De meetschaal bepaalt
verschillende situaties → dit hangt af van de meetschaal
welke wiskundige bewerkingen
Vb. het getal 14 kan wijzen op... we kunnen toepassen op data
̶ het rugnummer van een voetballer → nominaal / welke statistische toetsen we
̶ de score die een student behaalt op een examen → ratio kunnen uitvoeren
̶ de 14de plaats in een wedstrijd → ordinaal
➔ De informatie die het getal 14 bevat Zie extra voorbeelden dia 23-24
hangt af van de meetschaal
Beschrijvende en verklarende statistiek
• Beschrijvende statistiek
Beschrijven van verzamelde gegevens
Door
o grafische voorstellingen → staafjesdiagram, cirkeldiagram, boxplot, …
o Parameters → centrale tendentie (ligging), spreiding
• Verklarende statistiek
trekt conclusies over de gehele groep op basis van een deel (steekproef) van deze groep
Parameters
Parameters van ligging
• Modus
de waarde van de variabele met het hoogste aantal waarnemingen (frequentie)
• Mediaan
grenswaarde die de gerangschikte waarnemingen in twee gelijk groepen verdeelt
bij oneven aantal gegevens: de middelste waarneming
bij even aantal gegevens: het rekenkundig gemiddelde van de twee middelste waarnemingen
• Rekenkundig gemiddelde
de som van alle waarnemingen x1, x2, ..., xn, gedeeld door het totale aantal waarnemingen n
Parameters van spreiding
• variantie
• standaarddeviatie / standaardafwijking
2
,Stochastische variabelen: discrete en continue kansveranderlijken
Definitie
• Variabele die numerieke waarden aanneemt bij de toevallige uitkomsten van een experiment.
• Bij elke uitkomst wordt één en slechts één waarde aangenomen.
Soorten
• Discrete stochastische variabelen (discrete kansveranderlijken)
Kunnen slechts een eindig of aftelbaar oneindig aantal waarden aannemen
Vb. aantal ogen bij een worp met een dobbelsteen
• Continue stochastische variabelen (continue kansveranderlijken)
neemt een oneindig en niet aftelbaar aantal waarden aan, te
vergelijken met een interval of halfrechte op de reële getallenas
Vb. tijdsduur tussen 2 meldingen bij 112
Discrete kansveranderlijken
Stochastische variabele x
Continue kansveranderlijken
• De functie f(x) – die we de (kans)dichtheidsfunctie noemen – neemt hier de rol over van het
kanshistogram bij discrete stochastische variabelen.
3
, Verdelingen: binomiale verdeling (discreet), normale verdeling (continu) benaderen
Binomiale kansverdeling
Binomiaal experiment
• Een binomiaal experiment wordt gekenmerkt door:
1. rij van n identieke deelexperimenten
2. elk deelexperiment heeft twee uitkomsten: S (‘succes’) en M (‘mislukking’)
3. de kans op S (en dus ook op M) is dezelfde bij elk deelexperiment.
4. de deelexperimenten zijn onafhankelijk van elkaar.
• Aantal “successen” in een binomiaal experiment = een binomiale stochastische variabele.
Binomiale kansverdeling
X ~ B (n, p)
Voorbeeld dia 42
Eigenschappen binomiale verdeling
• µ=n.p
• σ² = n . p (1 – p)
• σ = √𝐧 . 𝐩 (𝟏 – 𝐩)
Normale kansverdeling
Grafisch
• Continu
• heuvelvormig en symmetrisch
• verwachtingswaarde, mediaan en modus vallen samen.
• heeft oneindig bereik
X ~ N (µ, σ)
Kansdichtheidsfunctie
4
Begrippen
Basiselementen van de statistiek
• Experimentele eenheden
De bestudeerde objecten
Vb. studenten
• De populatie
De verzameling experimentele eenheden
Vb. alle studenten aan de UGent
• Variabele
Kenmerk of eigenschap van een individuele eenheid uit de populatie
Vb. studieresultaat
• Steekproef
Deelverzameling van de populatie
Vb. 20 willekeurig gekozen studenten
• Statistische gevolgtrekking
Veralgemening vanuit de steekproef naar de populatie
• Betrouwbaarheidsmaat
Uitspraak over de (on)zekerheid van de statistische gevolgtrekking
Soorten variabelen
Kwantitatieve variabelen Kwalitatieve variabelen Discrete variabelen Continue variabelen
Kan eindig of aftelbaar
Indien ook
oneindig aantal
Een getal Een kenmerk tussenliggende waarden
verschillende waarden
mogelijk zijn
aannemen
Vb. leeftijd Vb. geslacht Vb. aantal studenten Vb. gewicht, afstand, …
Soorten meetschalen
KWALITATIEF KWANTITATIEF
Meetschaal 1) Nominale schaal 2) Ordinale schaal 3) Intervalschaal 4) Ratio schaal
- ordenbaar - ordenbaar
- gelijke verschillen - gelijke verschillen
- Niet-ordenbaar
hebben dezelfde hebben dezelfde
Eigenschap - Enkel opsomming - Ordenbaar
betekenis betekenis
mogelijk
- geen absoluut - absoluut nulpunt (0
nulpunt = ‘treedt niet op’)
Voorbeeld Vb. bij mening van Vb. hoeveel glazen
Vb. geslacht, ja-nee
een enquête: goed, drink je? A) 0-1 Vb. inkomen
vraag, …
matig, slecht B) 1-3 C) 3-6?
1
, Dus: getallen kunnen een verschillende betekenis hebben in
!!! De meetschaal bepaalt
verschillende situaties → dit hangt af van de meetschaal
welke wiskundige bewerkingen
Vb. het getal 14 kan wijzen op... we kunnen toepassen op data
̶ het rugnummer van een voetballer → nominaal / welke statistische toetsen we
̶ de score die een student behaalt op een examen → ratio kunnen uitvoeren
̶ de 14de plaats in een wedstrijd → ordinaal
➔ De informatie die het getal 14 bevat Zie extra voorbeelden dia 23-24
hangt af van de meetschaal
Beschrijvende en verklarende statistiek
• Beschrijvende statistiek
Beschrijven van verzamelde gegevens
Door
o grafische voorstellingen → staafjesdiagram, cirkeldiagram, boxplot, …
o Parameters → centrale tendentie (ligging), spreiding
• Verklarende statistiek
trekt conclusies over de gehele groep op basis van een deel (steekproef) van deze groep
Parameters
Parameters van ligging
• Modus
de waarde van de variabele met het hoogste aantal waarnemingen (frequentie)
• Mediaan
grenswaarde die de gerangschikte waarnemingen in twee gelijk groepen verdeelt
bij oneven aantal gegevens: de middelste waarneming
bij even aantal gegevens: het rekenkundig gemiddelde van de twee middelste waarnemingen
• Rekenkundig gemiddelde
de som van alle waarnemingen x1, x2, ..., xn, gedeeld door het totale aantal waarnemingen n
Parameters van spreiding
• variantie
• standaarddeviatie / standaardafwijking
2
,Stochastische variabelen: discrete en continue kansveranderlijken
Definitie
• Variabele die numerieke waarden aanneemt bij de toevallige uitkomsten van een experiment.
• Bij elke uitkomst wordt één en slechts één waarde aangenomen.
Soorten
• Discrete stochastische variabelen (discrete kansveranderlijken)
Kunnen slechts een eindig of aftelbaar oneindig aantal waarden aannemen
Vb. aantal ogen bij een worp met een dobbelsteen
• Continue stochastische variabelen (continue kansveranderlijken)
neemt een oneindig en niet aftelbaar aantal waarden aan, te
vergelijken met een interval of halfrechte op de reële getallenas
Vb. tijdsduur tussen 2 meldingen bij 112
Discrete kansveranderlijken
Stochastische variabele x
Continue kansveranderlijken
• De functie f(x) – die we de (kans)dichtheidsfunctie noemen – neemt hier de rol over van het
kanshistogram bij discrete stochastische variabelen.
3
, Verdelingen: binomiale verdeling (discreet), normale verdeling (continu) benaderen
Binomiale kansverdeling
Binomiaal experiment
• Een binomiaal experiment wordt gekenmerkt door:
1. rij van n identieke deelexperimenten
2. elk deelexperiment heeft twee uitkomsten: S (‘succes’) en M (‘mislukking’)
3. de kans op S (en dus ook op M) is dezelfde bij elk deelexperiment.
4. de deelexperimenten zijn onafhankelijk van elkaar.
• Aantal “successen” in een binomiaal experiment = een binomiale stochastische variabele.
Binomiale kansverdeling
X ~ B (n, p)
Voorbeeld dia 42
Eigenschappen binomiale verdeling
• µ=n.p
• σ² = n . p (1 – p)
• σ = √𝐧 . 𝐩 (𝟏 – 𝐩)
Normale kansverdeling
Grafisch
• Continu
• heuvelvormig en symmetrisch
• verwachtingswaarde, mediaan en modus vallen samen.
• heeft oneindig bereik
X ~ N (µ, σ)
Kansdichtheidsfunctie
4