BESCHRIJVENDE STATISTIEK EN KANSREKENEN
HOOFDSTUK 1: WAT IS STATISTIEK?
Lezen , geen grote theorievragen of meerkeuzevragen
WAAROM STATISTIEK?
Met statistiek kan men data verwerken tot bruikbare informatie.
DEFINITIE VAN STATISTIEK
Statistiek= het geheel van methodologieën voor het verzamelen, voorstellen, analyseren en interpreteren
van data of gegevens. Statistiek laat ons toe om gegevens of data te verwerken tot bruikbare informatie.
ONDERWERP VAN DE STATISTIEK
Er worden telkens een of meerdere vragen onderzocht over een populatie van objecten of elementen of
over een proces dat objecten of elementen genereert.
Gegevens over de populatie of het proces worden bekomen door een of meerdere eigenschappen of
karakteristieken van hun elementen te registreren
Deze eigenschappen of karakteristieken worden variabelen genoemd (de waarde van de eigenschap
varieert van element tot element → statistiek: de studie van de variabiliteit).
Steekproef= men werkt slechts met een deel van de elementen
GIGO= Garbage in, garbage out= het feit dat de meest geavanceerde statistische methoden weinig tot
geen betrouwbare informatie kunnen halen uit gegevens van slechte kwaliteit.
Stap 1: Beschrijvende of descriptieve statistiek= het voorstellen van steekproefgegevens Stap 2:
Het analyseren en interpreteren van de steekproefgegevens Inferentie= antwoorden en conclusies
worden veralgemeend naar de populatie of het proces
inferentiële statistiek, wiskundige statistiek, verklarende statistiek, steekproeftheorie
KANSREKENING
Kansrekening: bestudeert processen of experimenten waarbij de uitkomst onzeker is.
Verschil tussen kansrekening en statistiek: kansrekening bestudeert populaties en processen rechtstreeks, terwijl de
statistiek dit doet via steekproefgegevens.
,H2: DATA EN HUN VOORSTELLING
ENKEL KLEINE MEERKEUZEVAGEN
Data of gegevens: bevatten informatie omtrent een of meerdere variabelen van een aantal
elementen van een populatie of een aantal objecten gegenereerd door een proces. (Gegevens
worden verzameld over meerdere eigenschappen of variabelen.)
SOORTEN GEGEVENS EN MEETSCHALEN
Nominale en ordinale variabelen= categorische of kwalitatieve variabelen Daarnaast zijn er ook nog
kwantitatieve variabelen
CATEGORISCHE OF KWALITATIEVE VARIABELEN
NOMINALE VARIABELEN:
➔ De waarde van de variabele plaatst een element in een bepaalde klasse of categorie
➔ Vb.: geslacht (man/vrouw), nationaliteit, godsdienst, het al dan niet bezitten van een wagen,
gemeente (Antwerpen/Mechelen/…), hoogste opleidingsniveau (middelbaar/Bachelor/…)
➔ Cijfercodes
✓ Man = 0, vrouw = 1
✓ Postnummers van gemeenten
→ Cijfercodes impliceren geen volgorde en/of hoeveelheid! → niet mee rekenen! (behalve
absolute en relatieve frequenties (percentages))
ORDINALE VARIABELEN:
➔ Nominale variabelen waarbij er een ordening is tussen de klassen of categorieën
➔ Vb.: enquêtes (antwoorden op enquêtes: “1: helemaal eens”, “2: eerder eens”, “3: noch
eens, noch oneens”, “4: eerder oneens” of “5: helemaal oneens”), aantal sterren van hotels,
aantal Michelinsterren van restaurants
➔ Rekenkundige bewerkingen zinloos (behalve absolute en relatieve frequenties (percentages))
KWANTITATIEVE VARIABELEN
(Kwantitatieve variabelen hebben een meetniveau met numerieke waarden, zoals leeftijd, aantal
broers en zussen, inkomen.)
Worden uitgedrukt in een aantal vaste meeteenheden!
Bijna alle rekenkundige bewerkingen zinvol!
Vb’en: lengte, gewicht, aantal verkochte auto’s, temperatuur, duurtijd, aantal Kb per tijdseenheid…
- Intervalschaal
- Ratioschaal
,INTERVALSCHAAL:
➔ Geen natuurlijk nulpunt → geen natuurlijke ondergrens
➔ Verschil tussen 2u en 4u is gelijk aan het verschil tussen 21u en 23u
➔ Verhoudingen: niet zinvol
o 4u (’s nachts) is niet dubbel zo laat als 2u (’s nachts) (Het temperatuurverschil tussen 5
en 10 graden Celsius is even groot als het verschil tussen 30 en 35 graden. We kunnen
niet zeggen dat 20 graden twee keer zo warm is dan 10 graden.)
➔ Vb.: temperatuur (°C en Fahrenheit), tijd afgelezen op een klok
RATIOSCHAAL:
➔ Absoluut nulpunt
➔ Verhoudingen: zinvol! (2 meter is dubbel zo lang als 1m)
➔ Vb.: lengte, gewicht, temperatuur in Kelvin…
ANDERE MOGELIJKHEID VOOR OPDELING VAN KWANTITATIEVE VARIABELEN:
DISCRETE VARIABELE:
➔ Kan slechts een eindig of oneindig aftelbaar aantal verschillende waarden aannemen
➔ Vb.: het aantal passagiers op een lijnvlucht, het aantal kinderen in een gezin of het aantal
verzekeringspolissen dat een gezin afsloot
CONTINUE VARIABELE:
➔ Kan een continuüm van waarden aannemen2
➔ Vb.: lengte, duurtijd, gewicht en body mass index…
In de praktijk: alle waarnemingen van een continue variabele zullen discreet zijn. Een continue lengte wordt
in de praktijk gemeten tot op een bepaalde nauwkeurigheid (bijvoorbeeld een millimeter) en aldus discreet
gemaakt. Toch zullen we die lengte dan bestuderen alsof het een continue variabele betrof.
HIËRARCHIE VAN MEETSCHALEN
Ratioschaal
Intervalschaal
Ordinale meetschaal
Nominale meetschaal
➔ Ratioschaal is de hoogste of meest informatieve meetschaal
➔ Gegevens gemeten op een hogere schaal kunnen omgezet worden in gegevens op een lagere
schaal, maar niet omgekeerd! Statistische methoden voor lagere meetschalen kunnen
gebruikt worden voor hogere meetschalen, maar niet omgekeerd!
, DE DATAMATRIX
Matrix waarbij:
Rijen (= observatievector): de elementen of waarnemingen van een steekproef Kolommen:
verschillende gemeten variabelen
Univariate voorstelling: heeft betrekking op 1 variabele Bivariate
voorstelling: heeft betrekking op 2 variabelen Multivariate gegevens:
data bestaande uit meerdere variabelen
VOORSTELLEN VAN UNIVARIATE KWALITATIEVE VARIABELEN
➔ Frequenties en relatieve frequenties
➔ Staafdiagram
➔ Paretodiagram
➔ Cirkel-, sector- of taartdiagram (niet duidelijk als: veel categorieën die klein zijn: te smalle
streepjes)
HOOFDSTUK 1: WAT IS STATISTIEK?
Lezen , geen grote theorievragen of meerkeuzevragen
WAAROM STATISTIEK?
Met statistiek kan men data verwerken tot bruikbare informatie.
DEFINITIE VAN STATISTIEK
Statistiek= het geheel van methodologieën voor het verzamelen, voorstellen, analyseren en interpreteren
van data of gegevens. Statistiek laat ons toe om gegevens of data te verwerken tot bruikbare informatie.
ONDERWERP VAN DE STATISTIEK
Er worden telkens een of meerdere vragen onderzocht over een populatie van objecten of elementen of
over een proces dat objecten of elementen genereert.
Gegevens over de populatie of het proces worden bekomen door een of meerdere eigenschappen of
karakteristieken van hun elementen te registreren
Deze eigenschappen of karakteristieken worden variabelen genoemd (de waarde van de eigenschap
varieert van element tot element → statistiek: de studie van de variabiliteit).
Steekproef= men werkt slechts met een deel van de elementen
GIGO= Garbage in, garbage out= het feit dat de meest geavanceerde statistische methoden weinig tot
geen betrouwbare informatie kunnen halen uit gegevens van slechte kwaliteit.
Stap 1: Beschrijvende of descriptieve statistiek= het voorstellen van steekproefgegevens Stap 2:
Het analyseren en interpreteren van de steekproefgegevens Inferentie= antwoorden en conclusies
worden veralgemeend naar de populatie of het proces
inferentiële statistiek, wiskundige statistiek, verklarende statistiek, steekproeftheorie
KANSREKENING
Kansrekening: bestudeert processen of experimenten waarbij de uitkomst onzeker is.
Verschil tussen kansrekening en statistiek: kansrekening bestudeert populaties en processen rechtstreeks, terwijl de
statistiek dit doet via steekproefgegevens.
,H2: DATA EN HUN VOORSTELLING
ENKEL KLEINE MEERKEUZEVAGEN
Data of gegevens: bevatten informatie omtrent een of meerdere variabelen van een aantal
elementen van een populatie of een aantal objecten gegenereerd door een proces. (Gegevens
worden verzameld over meerdere eigenschappen of variabelen.)
SOORTEN GEGEVENS EN MEETSCHALEN
Nominale en ordinale variabelen= categorische of kwalitatieve variabelen Daarnaast zijn er ook nog
kwantitatieve variabelen
CATEGORISCHE OF KWALITATIEVE VARIABELEN
NOMINALE VARIABELEN:
➔ De waarde van de variabele plaatst een element in een bepaalde klasse of categorie
➔ Vb.: geslacht (man/vrouw), nationaliteit, godsdienst, het al dan niet bezitten van een wagen,
gemeente (Antwerpen/Mechelen/…), hoogste opleidingsniveau (middelbaar/Bachelor/…)
➔ Cijfercodes
✓ Man = 0, vrouw = 1
✓ Postnummers van gemeenten
→ Cijfercodes impliceren geen volgorde en/of hoeveelheid! → niet mee rekenen! (behalve
absolute en relatieve frequenties (percentages))
ORDINALE VARIABELEN:
➔ Nominale variabelen waarbij er een ordening is tussen de klassen of categorieën
➔ Vb.: enquêtes (antwoorden op enquêtes: “1: helemaal eens”, “2: eerder eens”, “3: noch
eens, noch oneens”, “4: eerder oneens” of “5: helemaal oneens”), aantal sterren van hotels,
aantal Michelinsterren van restaurants
➔ Rekenkundige bewerkingen zinloos (behalve absolute en relatieve frequenties (percentages))
KWANTITATIEVE VARIABELEN
(Kwantitatieve variabelen hebben een meetniveau met numerieke waarden, zoals leeftijd, aantal
broers en zussen, inkomen.)
Worden uitgedrukt in een aantal vaste meeteenheden!
Bijna alle rekenkundige bewerkingen zinvol!
Vb’en: lengte, gewicht, aantal verkochte auto’s, temperatuur, duurtijd, aantal Kb per tijdseenheid…
- Intervalschaal
- Ratioschaal
,INTERVALSCHAAL:
➔ Geen natuurlijk nulpunt → geen natuurlijke ondergrens
➔ Verschil tussen 2u en 4u is gelijk aan het verschil tussen 21u en 23u
➔ Verhoudingen: niet zinvol
o 4u (’s nachts) is niet dubbel zo laat als 2u (’s nachts) (Het temperatuurverschil tussen 5
en 10 graden Celsius is even groot als het verschil tussen 30 en 35 graden. We kunnen
niet zeggen dat 20 graden twee keer zo warm is dan 10 graden.)
➔ Vb.: temperatuur (°C en Fahrenheit), tijd afgelezen op een klok
RATIOSCHAAL:
➔ Absoluut nulpunt
➔ Verhoudingen: zinvol! (2 meter is dubbel zo lang als 1m)
➔ Vb.: lengte, gewicht, temperatuur in Kelvin…
ANDERE MOGELIJKHEID VOOR OPDELING VAN KWANTITATIEVE VARIABELEN:
DISCRETE VARIABELE:
➔ Kan slechts een eindig of oneindig aftelbaar aantal verschillende waarden aannemen
➔ Vb.: het aantal passagiers op een lijnvlucht, het aantal kinderen in een gezin of het aantal
verzekeringspolissen dat een gezin afsloot
CONTINUE VARIABELE:
➔ Kan een continuüm van waarden aannemen2
➔ Vb.: lengte, duurtijd, gewicht en body mass index…
In de praktijk: alle waarnemingen van een continue variabele zullen discreet zijn. Een continue lengte wordt
in de praktijk gemeten tot op een bepaalde nauwkeurigheid (bijvoorbeeld een millimeter) en aldus discreet
gemaakt. Toch zullen we die lengte dan bestuderen alsof het een continue variabele betrof.
HIËRARCHIE VAN MEETSCHALEN
Ratioschaal
Intervalschaal
Ordinale meetschaal
Nominale meetschaal
➔ Ratioschaal is de hoogste of meest informatieve meetschaal
➔ Gegevens gemeten op een hogere schaal kunnen omgezet worden in gegevens op een lagere
schaal, maar niet omgekeerd! Statistische methoden voor lagere meetschalen kunnen
gebruikt worden voor hogere meetschalen, maar niet omgekeerd!
, DE DATAMATRIX
Matrix waarbij:
Rijen (= observatievector): de elementen of waarnemingen van een steekproef Kolommen:
verschillende gemeten variabelen
Univariate voorstelling: heeft betrekking op 1 variabele Bivariate
voorstelling: heeft betrekking op 2 variabelen Multivariate gegevens:
data bestaande uit meerdere variabelen
VOORSTELLEN VAN UNIVARIATE KWALITATIEVE VARIABELEN
➔ Frequenties en relatieve frequenties
➔ Staafdiagram
➔ Paretodiagram
➔ Cirkel-, sector- of taartdiagram (niet duidelijk als: veel categorieën die klein zijn: te smalle
streepjes)