Samenvatting Statistiek blok 1 van de hoorcolleges
Om iets te meten vanuit een onderzoek/ enquête maken we gebruik van variabelen, een meetniveau
en dan bepalen we of deze continu of discreet is.
Verschillende typen meetniveau:
Kwalitatief:
Nominaal geen volgorde, geeft een naam aan iets. VB: man of vrouw, of auto, fiets, openbaar
vervoer.
Ordinaal wel volgorde, geeft een naam aan iets. VB: mbo, hbo, wo, of dun, normaal, dik.
Kwantitatief:
Interval zonder nulpunt, gaat over getallen, kan ook negatieve getallen zijn. VB: graden Celsius
Ratio met nulpunt, gaat over getallen, kan niet onder nul zijn. VB: Leeftijd in jaren, aantal
bezoeken.
Alleen bij de kwantitatieve variabelen kunnen de variabelen continu of discreet zijn.
Continu = als alle uitkomsten overal op de getallenlijn kunnen voorkomen. Hiermee bedoelen we dat
continu variabelen doorlopen; bijvoorbeeld bij centimeters kun je 1 cm maar ook 1,1 cm hebben.
Discreet = als er sprake is van een heel getal. Het is dus niet mogelijk om op te splitsen in stukjes;
bijvoorbeeld je kan niet 1,2 keer de bioscoop bezoeken.
Met dit geweten kunnen we beginnen:
Stap 1 maken van een frequentietabel. Hierbij is het belangrijk dat je goed let op welke variabelen je
hebt gebruikt. Want dit is bepalend voor welke grafiek er gemaakt wordt.
Van nominale en ordinale variabelen kwalitatief worden alleen cirkeldiagrammen en
staafdiagrammen gemaakt. Hierin werk je met percentages, omdat er dan gewerkt wordt met
verhoudingen. Zo zorg je ervoor dat er geen vertekend beeld wordt geschetst. Bijvoorbeeld als je bij
een andere enquête meer of minder respondenten hebt, wordt er gekeken naar verhoudingen en
geeft dit een realistisch beeld.
Van ordinale kwantitatieve variabelen wordt al meer berekent.
Grafieken die vaak voorkomen histogram en boxplot
Analyses die gedaan worden gemiddelde, modus, mediaan, kwartielen, standaarddeviatie etc.
Een aantal begrippen uitgelegd aan de hand van een voorbeeld.
Er is een verkennend onderzoek, hierbij worden vragen gesteld aan 10 bioscoopbezoekers, deze
groep van 10 mensen beschouwen we als een steekproef uit het totale bezoekersbestand. Dit totale
bezoekersbestand wordt ook wel de populatie genoemd. De steekproef moet representatief zijn; dat
houdt in dat de steekproef een getrouwe afspiegeling moet zijn van de populatie. Dit wordt vaak
gedaan aan de hand van een aantal belangrijke kenmerken:
Geslacht
Leeftijd
Etc.
, Liggingsmaten/centrummaten geven informatie over de ligging van het centrum van de verdeling.
Veel gebruikte centrummaat = het gemiddelde
Mediaan de middelste score (in volgorde)
Modus de meest voorkomende score
Scoreverdeling op ligging is soms niet voldoende daarom wordt er soms rekening gehouden met de
spreiding. Spreiding is een maat voor mogelijke afwijking van de afzonderlijke scores van de
liggingsmaat. De grootte van de spreiding geeft aan hoeveel waarde we moeten hechten aan de
maat van ligging.
Kleine spreiding maat ligging belangrijk nauwkeurig
Grote spreiding maat ligging wat minder waardevol
Deze spreidingsmaat wordt aan de hand van de standaarddeviatie uitgerekend. Aan de hand van de
formule:
Sx= de standaarddeviatie
Fi = de frequentie
Mi= midden
= gemiddelde
N= totale frequentie
Die gekke m = de som van
Berekenen van een cirkeldiagram vanuit een frequentietabel.
Het percentage = frequentie/totale frequentie x 100
Het aantal graden = 360 x (percentage ^ /100)
Belangrijk is dat het beschikt over een duidelijke titel, bron en dat de percentages weergegeven zijn
en een eventuele legenda.
Het berekenen van een staafdiagram.
Ook hier deel van geheel x 100
Belangrijk dat je altijd met percentages werkt, zodat je de verhoudingen weet. De assen benoemd en
zorgt voor losse staven.
Voor het maken van het histogram.
Nodig frequentiedichtheid
Kenmerkend: Staven zitten aan elkaar.
Belangrijk: de assen benoemen en de juiste bijschriften gebruiken.
Om iets te meten vanuit een onderzoek/ enquête maken we gebruik van variabelen, een meetniveau
en dan bepalen we of deze continu of discreet is.
Verschillende typen meetniveau:
Kwalitatief:
Nominaal geen volgorde, geeft een naam aan iets. VB: man of vrouw, of auto, fiets, openbaar
vervoer.
Ordinaal wel volgorde, geeft een naam aan iets. VB: mbo, hbo, wo, of dun, normaal, dik.
Kwantitatief:
Interval zonder nulpunt, gaat over getallen, kan ook negatieve getallen zijn. VB: graden Celsius
Ratio met nulpunt, gaat over getallen, kan niet onder nul zijn. VB: Leeftijd in jaren, aantal
bezoeken.
Alleen bij de kwantitatieve variabelen kunnen de variabelen continu of discreet zijn.
Continu = als alle uitkomsten overal op de getallenlijn kunnen voorkomen. Hiermee bedoelen we dat
continu variabelen doorlopen; bijvoorbeeld bij centimeters kun je 1 cm maar ook 1,1 cm hebben.
Discreet = als er sprake is van een heel getal. Het is dus niet mogelijk om op te splitsen in stukjes;
bijvoorbeeld je kan niet 1,2 keer de bioscoop bezoeken.
Met dit geweten kunnen we beginnen:
Stap 1 maken van een frequentietabel. Hierbij is het belangrijk dat je goed let op welke variabelen je
hebt gebruikt. Want dit is bepalend voor welke grafiek er gemaakt wordt.
Van nominale en ordinale variabelen kwalitatief worden alleen cirkeldiagrammen en
staafdiagrammen gemaakt. Hierin werk je met percentages, omdat er dan gewerkt wordt met
verhoudingen. Zo zorg je ervoor dat er geen vertekend beeld wordt geschetst. Bijvoorbeeld als je bij
een andere enquête meer of minder respondenten hebt, wordt er gekeken naar verhoudingen en
geeft dit een realistisch beeld.
Van ordinale kwantitatieve variabelen wordt al meer berekent.
Grafieken die vaak voorkomen histogram en boxplot
Analyses die gedaan worden gemiddelde, modus, mediaan, kwartielen, standaarddeviatie etc.
Een aantal begrippen uitgelegd aan de hand van een voorbeeld.
Er is een verkennend onderzoek, hierbij worden vragen gesteld aan 10 bioscoopbezoekers, deze
groep van 10 mensen beschouwen we als een steekproef uit het totale bezoekersbestand. Dit totale
bezoekersbestand wordt ook wel de populatie genoemd. De steekproef moet representatief zijn; dat
houdt in dat de steekproef een getrouwe afspiegeling moet zijn van de populatie. Dit wordt vaak
gedaan aan de hand van een aantal belangrijke kenmerken:
Geslacht
Leeftijd
Etc.
, Liggingsmaten/centrummaten geven informatie over de ligging van het centrum van de verdeling.
Veel gebruikte centrummaat = het gemiddelde
Mediaan de middelste score (in volgorde)
Modus de meest voorkomende score
Scoreverdeling op ligging is soms niet voldoende daarom wordt er soms rekening gehouden met de
spreiding. Spreiding is een maat voor mogelijke afwijking van de afzonderlijke scores van de
liggingsmaat. De grootte van de spreiding geeft aan hoeveel waarde we moeten hechten aan de
maat van ligging.
Kleine spreiding maat ligging belangrijk nauwkeurig
Grote spreiding maat ligging wat minder waardevol
Deze spreidingsmaat wordt aan de hand van de standaarddeviatie uitgerekend. Aan de hand van de
formule:
Sx= de standaarddeviatie
Fi = de frequentie
Mi= midden
= gemiddelde
N= totale frequentie
Die gekke m = de som van
Berekenen van een cirkeldiagram vanuit een frequentietabel.
Het percentage = frequentie/totale frequentie x 100
Het aantal graden = 360 x (percentage ^ /100)
Belangrijk is dat het beschikt over een duidelijke titel, bron en dat de percentages weergegeven zijn
en een eventuele legenda.
Het berekenen van een staafdiagram.
Ook hier deel van geheel x 100
Belangrijk dat je altijd met percentages werkt, zodat je de verhoudingen weet. De assen benoemd en
zorgt voor losse staven.
Voor het maken van het histogram.
Nodig frequentiedichtheid
Kenmerkend: Staven zitten aan elkaar.
Belangrijk: de assen benoemen en de juiste bijschriften gebruiken.