We bekijken de plaats van statistiek in het onderzoek en besluiten dat het zonder statistiek om op basis
van steekproeven geldige conclusies te trekken over het gedrag van mensen in het algemeen.
1.1 wat is de bedoeling van statistiek?
Statistiek is louter een hulpmiddel bij empirisch onderzoek dat erop gericht is algemeen geldende
uitspraken te doen over wetmatigheden in de realiteit.
Vanuit een beperkt aantal observaties uitspraken doen over mensen in het algemeen.
Voorbeeld: zijn mannen beter in kaartlezen dan vrouwen?
Mannen scoren gemiddeld 46/50 en vrouwen gemiddeld 43/50. Kunnen we dan besluiten dat mannen
beter zijn in kaartlezen dan vrouwen? Of is het verschil niet groot genoeg om dit te beweren? Of is het
verschil te wijten aan toeval?
het is niet makkelijk om een beslissing te maken zonder houvast
Houvast: Door de inductieve statistiek. Adhv een statische toets kunnen we een beslissing maken
DUS: statistiek biedt ons de nodige regels om consequent en verantwoord conclusies te trekken over
wetmatigheden in menselijk gedrag.
1.2 De empirische cyclus
(= fasen waaruit wetenschappelijk onderzoek bestaat)
1) Vraagstelling of probleemstelling: waarop wilt het onderzoek antwoord geven? In welke
variabele zijn we geïnteresseerd?
2) Operationaliseren: de variabelen uit de vraagstelling meetbaar maken.
3) Steekproef trekken: de nodige respondenten verzamelen. Belangrijk onderscheid tussen
select en aselect
4) Gegevens verzamelen: doen we volgens hoe we het hebben neergeschreven in de
operationalisatiefase.
5) Beschrijvende statistiek: de verzamelde gegevens op verschillende manieren beschrijven
(centrummaten, spreidingsmaten, grafieken,…)
deze beschrijving geeft ons nog geen informatie over het verband tussen variabelen of
groepen
6) Inductieve statistiek: verdergaande analyses van de gegevens
7) Conclusies trekken: op basis van de analyse, een duidelijk antwoord op de vraagstelling
DUS: Met behulp van inductieve statistiek kunnen we na gaan of de verschillen en verbanden uit onze
data betekenisvol genoeg zijn om te veronderstellen dat ze zich ook in de bredere populatie op
dezelfde manier voordoen.
1.3 Het probleem van de inductieve statistiek
We kunnen nooit gegevens hebben over een complete populatie. we willen wel algemene
wetmatigheden weten van de hele populatie
Oplossing: trekken van steekproeven we verzamelen gegevens uit een beperkt aantal
onderzoekseenheden (cases) en leiden daaruit algemene conclusies af.
Kernprobleem: welke garantie hebben we dat de conclusies ook geldig zijn voor de rest van de
populatie?
We zijn nooit 100% zeker over de conclusies die we trekken vanuit steekproeven!!
,Het is belangrijk om te weten hoe groot onze onzekerheid is.
hoe groot is de kans dat onze conclusies fout zijn?
1.4 Statische significantie
Wat is significantie?
- op basis van steekproeven geen zekerheden
- wanneer dan verschillen/verbanden?
als we besluiten dat iets “statistisch significant” is
bv. verschil tussen scores kaartlezen 51/60 en 39/60 is significant, tussen 42/60 en 47/60 is niet
significant.
bv. verband tussen lengte en gewicht is significant, verband tussen lengte en hoeveelheid hersenen is
niet significant.
1.5 Kansberekening
= hulpmiddel bij hypothesetoetsing
Nodig om tot die significantie te komen: hypothesetoetsing
- stel: onderzoek naar effect van muziek op depressie
- deelnemers luisteren 1u naar emo-rock of hip-hop
- emo-rock luisteraars zijn meer depressief dan hip-hop luisteraars
- maar kan dat toevallig zijn? Is het niet waarschijnlijk om zo’n verschil te observeren ook al is er
geen invloed van muziek?
DUS:
• we veronderstellen even dat muziek geen invloed heeft
• we berekenen hoe waarschijnlijk het is om onze scores te observeren
we berekenen dus de kans dat de verschillen enkel te wijten zijn aan toevallige variabiliteit (altijd
aanwezig)
− Grote kans = heel waarschijnlijk is, besluiten we dat er geen verschil is, geen uitzonderlijke
observatie
− Kleine kans = heel onwaarschijnlijk is, besluiten we dat er wel een verschil is
Statistische significantie nagaan dmv kansberekening:
Is het geobserveerde verschil groot genoeg om significant te zijn
Toegepast:
,Nieuwe vragen:
Hoe moeten we die kans berekenen?
• op basis van kansverdelingen (bv. standaardnormale verdeling)
• met behulp van verschillende toetsen
Wat is dan een “grote” en een “kleine” kans?
• 5% of 0.05 meest courant (zie later)
Zekerheid?
nooit 100% zeker van conclusie
onzekerheid is geen probleem, als we maar de mate van onzekerheid kennen!
bv: “We concluderen met 95% zekerheid dat popfunk zorgt voor een betere gemoedstoestand dan
melancholische rock”
1.6 Toetsen
toetsingssituaties zijn heel uiteenlopend:
− verschil in depressie bij verschillende muziek?
− verschil in depressie vóór en na beluisteren van muziek?
− verschil in depressie bij verschillende muziek en 2 methoden gedragstherapie?
− 500 deelnemers of slechts 20?
− …
bijgevolg ook uiteenlopende toetsen
hiervoor zullen we rekening moeten houden met het aantal variabelen, het meetniveau van de
variabelen, het aantal deelnemers, manier waarop deelnemers verdeeld zijn over het onderzoek.
(H4 – H10 vaak voorkomende statische toetsen)
1.7 Misbruik van statistiek
Statistiek is geen doel opzich!
Onduidelijke steekproef:
- “95% van de Belgen is tevreden over Activia”
Gebrek aan context:
- “Duracell-batterijen gaan tot 5 maal langer mee”
Interne validiteit:
- Laat het onderzoeksopzet toe om causale conclusies te trekken?
1.7.1 interne validiteit
, = Ongeoorloofde causale conclusie
interne validiteit : Mate waarin we met een onderzoeksontwerp causale conclusies kunnen
trekken over effect van OV op AV
3 voorwaarden:
1. Effect van OV op AV in voorspelde richting
2. Oorzaak moet in tijd voorafgaan aan gevolg
3. Geen andere verklaringen voor gevonden verband
bv: Kunnen kinderen beter lezen als ze door hun ouders vaak worden voorgelezen?
− test bij 20 kinderen die vaak worden voorgelezen en 20 kinderen die nooit worden voorgelezen
− eerste groep scoort 7, tweede groep scoort 6
− significant verschil, maar ook intern valide?
voorwaarde 1: scoren de kinderen die worden voorgelezen hoger dan de andere kinderen?
ok (na statistische test)
voorwaarde 2: gaat de oorzaak vooraf aan het gevolg? Komt het voorlezen vóór de betere lees-score
of kan het ook omgekeerd?
voorwaarde 3: is er geen andere verklaring voor het verband?
Om alternatieve verklaringen uit te sluiten: experimenteel onderzoek
− randomiseren
− voormeting
− nameting
− controleren voor storende variabelen
− …
= methodologie: noodzakelijk om juiste conclusies te trekken, statistiek alleen is onvoldoende!
1.7.2 Externe validiteit
= Ongeoorloofde generalisatie
externe validiteit: mate waarin resultaten van het onderzoek kunnen gegeneraliseerd worden over:
1. situaties (lijkt de onderzoekssituatie genoeg op de “dagelijkse” situatie?)
2. methoden (wordt hetzelfde resultaat gevonden met een andere methode?)
3. tijd (zelfde resultaten in een andere periode?)
4. populaties (zelfde resultaten in andere populatie?)
Statistische generalisatie is nog iets anders!
kunnen we generaliseren vanuit de steekproef naar de populatie waaruit de steekproef werd
getrokken?
1.8 Samengevat:
• Toetsende statistiek volgt op beschrijvende statistiek in de empirische cyclus.
• Bedoeling is om op basis van verzamelde data een onderbouwde beslissing te nemen over
verband/verschil.
• Dat we over deze beslissing nooit 100% zeker zijn is niet erg, zo lang we maar de mate van
onzekerheid kennen.
• Om die mate van onzekerheid te bepalen, hebben we kansberekeningen nodig.
• Op basis daarvan kunnen we significantie berekenen.
• Statistiek is geen wetenschap op zich. Statistische conclusies zijn pas waardevol als ook aan
de randvoorwaarden voldaan is en statistiek niet misbruikt wordt.