Methoden om data samen te vatten wordt beschrijvende statistiek genoemd. De kenmerken van een
dataset worden samengevat, ofwel de data hier is een beschrijving van de statistische feiten.
Bij inferentiële statistiek daarentegen wordt een hypothese getoetst of bepaal je of je data
generaliseerbaar zijn naar een bredere populatie. Er worden conclusies getrokken, parameters afgeleid,
verbanden gelegd tussen feiten, er wordt betekenis aan de data gegeven en er worden uitspraken gedaan
over deze data over een gehele populatie (doel).
Er zijn verschillende soorten meterniveaus:
Categorische variabelen:
• Nominaal. Categorie
Een nominale variabele kun je alleen categoriseren en er zijn verschillen tussen de categorieën,
maar er zit geen volgorde in.
Je kunt niet beweren dat de ene categorie beter is dan de anderen
Bijvoorbeeld: nationaliteiten, gender, automerken, enz.
• Ordinaal. Categorie en rangorde
Een ordinale variabele kun je categoriseren, maar er zit ook een volgorde in. Je kunt de
categorieën rangschikken.
Je weet nog niks over de verschillend tussen de categorieën (intervals)
Bijvoorbeeld: top tien, laag-gemiddeld-hoog, Likertschaal-vragen, enz.
Kwantitatieve variabelen
• Interval. Categorie, rangorde en gelijke intervallen
Een interval variabele kun je categoriseren en deze categorieën kun je in een rangorde plaatsen,
maar er zitten ook vergelijkbare/gelijke intervallen tussen de categorieën.
Een interval schaal heeft geen natuurlijk nulpunt
Bijvoorbeeld: toetsscores, temperatuur, enz.
• Ratio. Categorie, rangorde, gelijke intervallen en natuurlijk nulpunt
Een ratio variabele kun je categoriseren, deze categorieën kun je in een rangorde plaatsen, er
zit een vergelijkbare interval tussen de categorieën en deze variabelen hebben een betekenisvol
en natuurlijk nulpunt.
Bijvoorbeeld: gewicht, leeftijd, lengte (NIET TEMPERATUUR)
Kwantitatieve variabelen zijn op te delen in:
• Discreet.
Categorieën kunnen een bepaalde set/waarden aannemen.
Bijvoorbeeld: 1, 2, 3, 4, 5, enz.
• Continue.
Continue variabelen komen voor als de waarden een interval vormen.
Deze variabelen kunnen tussenliggende variabelen aannemen.
Bijvoorbeeld: 1,56, 3.047, enz.
Een voorbeeld van een continue variabele zijn toetsscores (7,6) of lengte (1,75m).
, Samenvatting Beschrijvende en Inferentiële statistiek - Deeltoets
Case = iets of iemand die je onderzoekt
Populatie = gehele doelgroep
Sample = steekproef, gedeelte van je populatie (subgroep)
Variabelen = karakteristieken van iets of iemand die je onderzoekt. De karakteristieken van het
subject/de variabelen moeten van elkaar verschillen.
Voorbeeld: gewicht, lengte, leeftijd, stad, kleur, teams, enz.
Constante = soort variabele, maar er zit geen verschil in. Deze variabele blijft in het onderzoek
hetzelfde, ofwel constant.
Voorbeeld: Cases van hetzelfde land. In een onderzoek worden verschillende voetbalteams
onderzocht, waarvan elk team verschillende karakteristieken heeft, maar de constante is dat
alle teams uit hetzelfde land komen, bijvoorbeeld Nederland.
De beste manier om alle informatie te verzamelen over de cases en de bijbehorende variabelen is door
middel van een datamatrix. In een datamatrix bevinden de cases zich in de rijen en de variabelen zich
in de kolommen.
Gegevens in de datamatrix worden ook wel observaties genoemd.
Een datamatrix is nodig voor statistische analyses.
Frequentietabel = laat zien hoe de waarden van een variabele verdeeld zijn. Het
is een soort samenvatting van analyses.
In een frequentietabel worden de variabelen opnieuw en op een andere manier
gecodeerd door bijvoorbeeld intervallen te maken. Kwantitatieve variabelen
worden dan ordinale variabelen.
Bijvoorbeeld door gewichtsklassen te maken. Eerst was iets 66,7kg (kwantitatieve
variabele), maar door de hercodering valt het nu binnen de klasse 65-70 kg
(ordinale variabele).
Figuur 1: Frequentietabel