INLEIDING
BEGRIPPEN
BASISELEMENTEN VAN DE STATISTIEK
Experimentele eenheden
- de bestudeerde objecten
- bv. studenten, machines, wielerwedstrijden, ...
Populatie
- de verzameling experimentele eenheden
- bv. alle studenten aan de UGent, alle laptops die een bepaalde firma verkocht heeft, ...
Variabele
- kenmerk of eigenschap van een individuele eenheid uit de populatie
- bv. lengte, levensduur, studieresultaat, ...
Steekproef
- deelverzameling van de populatie
- bv. 20 willekeurig gekozen studenten of laptops, ...
Statistische gevolgtrekking
- veralgemening vanuit de steekproef naar de populatie
Betrouwbaarheidsmaat
- uitspraak over de (on)zekerheid van de statistische gevolgtrekking
SOORTEN VARIABELEN
Kwantitatieve vs. kwalitatieve variabelen
- kwantitatieve: een getal (bv. leeftijd)
- kwalitatieve: een kenmerk (bv. geslacht)
Discrete vs. continue variabelen
- discrete variabele: kan eindig of aftelbaar oneindig aantal verschillende waarden aannemen
(bv. aantal studenten)
- continue variabele: indien ook tussenliggende waarden mogelijk zijn (bv. gewicht, afstand, …)
MEETSCHALEN
Getallen kunnen een verschillende betekenis hebben in verschillende situaties, bv. het getal 14 kan
wijzen op…
het rugnummer van een voetballer
de score die een student behaalt op een examen
de 14de plaats in een wedstrijd
De informatie die het getal 14 bevat, hangt af van de meetschaal die werd gebruikt om het getal te
bekomen.
De meetschaal bepaalt welke wiskundige bewerkingen we kunnen toepassen op data / welke
statistische toetsen we kunnen uitvoeren!!!
1
,Nominale schaal (bv. geslacht)
+ ordenbaar
= Ordinale schaal (bv. mening bij enquête: zeer goed, goed, matig, slecht, zeer slecht)
+ gelijke verschillen hebben zelfde betekenis
= Intervalschaal (bv. temperatuur in °C)
+ absoluut nulpunt
= Ratioschaal (bv. inkomen)
EIGENSCHAPPEN
Ordenbaarheid: de waarden die een variabele kan aannemen, duiden een volgorde aan.
Meeteenheid: verschillen tussen de waarden hebben een betekenis.
Absoluut nulpunt: de waarde 0 stelt de afwezigheid van het kenmerk voor.
VOORBEELDEN
NOMINALE VARIABELEN
- geslacht – waarden: man, vrouw, andere
- kiesintenties – waarden: CD&V, Groen, NVA, Anders, Vooruit, …
- provincie van herkomst – waarden: Oost-Vlaanderen, West-Vlaanderen, …
- rugnummers van voetballers – waarden: 1, 2, 3, …
ORDINALE VARIABELEN
- mate van instemming met een bepaalde stelling – waarden: volledig oneens, oneens, eerder
oneens, neutraal, eerder eens, …
- dienstgraden ZAP – waarden: docent, hoofddocent, hoogleraar, gewoon hoogleraar
INTERVALVARIABELEN
- temperatuur in graden Celsius – waarden: 0, -10, 25, …
- saldo op zichtrekeningen bij banken – waarden: 112,32; -1548,93; 23476,26, …
RATIOVARIABELEN
- lengte in cm – waarden: 0, 1, 141, 187, …
- maandelijks netto-inkomen in € – waarden: 0, 1400, 2250, 3400, …
- concentratietijd (in minuten) in de les – 0, 15, 45, 150, …
STATISTISCHE TOEPASSINGEN
Beschrijvende statistiek = beschrijven van verzamelde gegevens.
Verklarende statistiek = trekt conclusies over de gehele groep op basis van een deel (steekproef)
van deze groep.
BESCHRIJVENDE STATISTIEK
Grafische voorstellingen
- staafjesdiagram
- cirkeldiagram
- boxplot
Parameters
- centrale tendentie - ligging
- spreiding
2
, PARAMETERS VAN LIGGING
Modus: de waarde van de variabele met het hoogste aantal waarnemingen (frequentie)
Mediaan: grenswaarde die de gerangschikte waarnemingen in twee gelijke groepen verdeelt
- bij oneven aantal gegevens: de middelste waarneming
- bij even aantal gegevens: het rekenkundig gemiddelde van de twee middelste
waarnemingen
Rekenkundig gemiddelde: de som van alle waarnemingen x1, x2, …, xn, gedeeld door het totale
aantal waarnemingen n
PARAMETERS VAN SPREIDING
De variantie is de gemiddelde gekwadrateerde afwijking van de waarnemingen ten opzichte van het
rekenkundig gemiddelde.
De standaarddeviatie (of standaardafwijking) is de positieve vierkantswortel uit de variantie.
NOTITIES EN FORMULES
STOCHASTISCHE VARIABELEN
Definitie
- Variabele die numerieke waarden aanneemt bij de toevallige uitkomsten van een experiment.
- Bij elke uitkomst wordt één en slechts één waarde aangenomen.
Twee soorten
- Discrete stochastische variabelen
- Continue stochastische variabelen
DISCRETE KANSVERANDERLIJKEN
Kunnen slechts een eindig of aftelbaar oneindig aantal waarden aannemen
Bv. aantal ogen bij een worp met een dobbelsteen
Experiment: gelijktijdig opwerpen van twee eerlijke muntstukken.
Stochastische variabele x: aantal keer kruis.
3