Wat is Statistiek?
Statistiek is de wetenschap van het verzamelen, ordenen en
interpreteren van numerieke gegevens (data). Het helpt
onderzoekers om inzichten en conclusies te trekken uit gegevens.
Toepassing van Statistiek
In toegepast onderzoek gebruik je statistiek om
Een steekproef te kiezen uit een populatie
Te bepalen of deze steekproef representatief is
Beschrijvende of inferentiële statistiek toe te passen
Het juiste analysetype te kiezen (bijv. t-test, ANOVA, regressie)
Te werken met experimenteel of niet-experimenteel
onderzoeksdesign
Descriptieve Statistiek Inferentiële Statistiek
Beschrijft data met cijfers, grafieken, Maakt voorspellingen of trekt conclusies over een
tabellen populatie op basis van een steekproef
Populatie: de volledige groep waar je iets over wil weten
Steekproef: een deel van de populatie dat je daadwerkelijk onderzoekt
Betrouwbaarheid = precisie
Validiteit = meet je echt wat je wilt meten (geen vertekening)
Soort Type Voorbeelden
Nominaal Categorie zonder volgorde Geslacht, haarkleur
Ordinaal Categorie met volgorde Eens / neutraal / oneens
Interval Numeriek, geen absoluut nulpunt Temperatuur (°C)
Ratio Numeriek, mét absoluut nulpunt Lengte, gewicht
Discrete variabelen: bijv. aantal broers/zussen
Continue variabelen: bijv. lengte, tijd, gewicht
Belangrijke Maten in Descriptieve Statistiek
, 1. Centrale tendens: gemiddelde, mediaan, modus
2. Spreiding: standaarddeviatie, variantie
3. Positie: percentielen, kwartielen
Inferentiële Statistiek & Hypothesetoetsing
Doel: met een steekproef uitspraken doen over de populatie.
Veelvoorkomende problemen:
Sampling error: toeval
Sampling bias: verkeerde steekproef
Response bias: sociaal wenselijke of foutieve antwoorden
Non-response bias: niet iedereen doet mee
Type Gebruik
Z-verdeling Als de standaarddeviatie bekend is
T-verdeling Als de standaarddeviatie onbekend is
Chi-kwadraatverdeling Voor categorische variabelen (nominaal/ordinaal)
F-verdeling Voor ANOVA (meerdere groepen vergelijken)
Hypothesetoetsing: de 5 stappen
1. Aannames bepalen
2. Hypothesen opstellen (bijv. H₀: er is geen verschil)
3. Teststatistiek berekenen (zoals t-waarde)
4. P-waarde bepalen
5. Conclusie trekken (H₀ verwerpen of behouden)
Type fouten:
- Type I fout (α): vals-positief (ten onrechte H₀ verwerpen)
- Type II fout (β): vals-negatief (ten onrechte H₀ behouden)
De 3 Belangrijkste Analyses
1. T-test: Vergelijk 2 groepen op één uitkomstvariabele
, 2. ANOVA: Vergelijk 2 of meer groepen op één uitkomstvariabele
3. Regressieanalyse: Onderzoek het verband tussen 2 numerieke
variabelen
ANOVA – Analyse van Varianties
Gebruik: bij meer dan 2 groepen
F-waarde: zegt of er ergens een verschil is tussen groepen
Belangrijk: als F significant is, weet je nog niet tussen welke groepen
→ dan gebruik je een post-hoc test (zoals Tukey)
Regressieanalyse
Onderzoek of er een lineaire relatie is tussen X (voorspeller) en Y
(uitkomst)
Aannames
o Lineair verband
o Onafhankelijke observaties
o Gelijke variantie (homoscedasticiteit)
o Normaal verdeelde fouten (residuen)
Eén Voorbeeld, Drie Analyses
Een onderzoeksvraag zoals "verschil in cijfer tussen twee groepen
studenten" kan je op drie manieren analyseren:
- T-test
- ANOVA
- Regressie
Ze geven vergelijkbare resultaten maar via verschillende statistische
wegen.
Wat moet je deze week doen: Zelfstudie uit Agresti (2018) hoofdstuk 9 of
Warner (2013) hoofdstuk 9 ; Canvas quiz van week 1 maken; Vrijdagles
bijwonen met uitleg, voorbeelden en quizjes
, Week 1.2 samenvatting
Toetsing = 30 multiplechoicevragen waarvan 10 vragen over Statistiek 1
& 2 (A&F 2009/2012/2018) en 20 vragen over analyses uit Statistiek 3
(Warner 2013/2020).
Leermiddelen en Leerdoelen
Colleges + Q&A: theorie, toepassing, herhaling (week 1 t/m 6)
Q&A week 7
Boeken
o Agresti (2018), hoofdstukken 9 & 12
o Warner (2020-II): hoofdstuk 5, 7, 8, 9, 11, 14
o Warner (2013): hoofdstuk 6, 9, 12, 13, 15, 16, 17, 19, 22
Oefening:
o Begripsvragen aan het einde van elk hoofdstuk
o Herhaling Statistiek 1 & 2 in week 1
o StatTalk: kennisclips van 4-5 minuten
o Grasple + wekelijkse quizzes op Canvas
o Volledige oefentoetsen van Statistiek 1 & 2
Handige link: “The List”
Google Spreadsheet met overzicht en hulpmiddelen:
https://docs.google.com/spreadsheets/d/1V4Lun8VvdVqtIgUq-
VqNROzQl10plmz7o1iKlpWc41E/edit?usp=sharing
T-verdeling Z-verdeling
Gebruikt bij onbekende Gebruikt bij bekende
populatiestandaarddeviatie, meer populatiestandaarddeviatie, minder
spreiding spreiding
OLS - Ordinary Least Squares (Regressie)
OLS is een manier om een lijn te vinden die het best past bij de data.
Wordt gebruikt bij bivariate regressie (één voorspeller en één
uitkomst).
Variantieverdeling in Venn-diagram
o SS total = totale spreiding
o SS regression = verklaarde variantie
o SS residual = onverklaarde variantie