Module 6: data-analyse: statistische inferentie
Descriptieve statistiek
- Data is gewoon data tenzij we er iets mee doen
o Distributie: de totale set van scores
o Aantal scores wordt aangeduid met de letter N
- Descriptieve statistiek = bepaalde variabelen beschrijven en visualiseren Zie module 4
Steekproef Populatie
Gemiddelde X¯ µ
Standaarddeviatie S σ
Statistiek Parameter
Inferentiële statistiek
- Een besluitvormingsproces dat ons in staat stelt om een schatting te maken van onbekende
populatiekenmerken vanuit steekproefgegevens iets zeggen over de populatie op basis
van de steekproef
o Schattingen van populatieparameters
o Testen van hypothesen
- Uiteindelijk moeten we besluiten hoe goed een steekproef een bepaalde populatie
representeert
- Twee belangrijke concepten liggen aan de basis
o Probabiliteit
o Sampling error
- De steekproef moet een goede representatie zijn van de populatie!
Probabiliteit (waarschijnlijkheid)
- De kans dat een gebeurtenis optreedt, gezien al de mogelijke uitkomsten (p)
- Voorspellingen, hoe waarschijnlijk is iets?
- Voorbeelden: hoe groot is de kans dat je 6 keer een 5 gooit na elkaar, hoe groot is de kans op
regen, hoe groot is de kans dat je de euromillions wint,…
- Probabiliteit:
o p is altijd een waarde tussen 0 en 1
o kans dat je bijvoorbeeld een 6 gooit: 1/6
o kans dat je geen zes gooit: 1-1/6
o betekenis van de waarde 0: het gaat sws niet gebeuren
o betekenis van de waarde 1: het gaat absoluut gebeuren
o belangrijk: elke uitkomst heeft een gelijke kans om te gebeuren
1
, Onderzoeksmethoden en dataverwerking 2021-2022
Probabiliteit – interpretatie en gebruik in onderzoek
- probabiliteit gaat over de ‘long run’ het gaat niet meteen over een enkele patiënt
o voorbeeld: de kans dat je herstelt van een hamstringblessure is 75% dan is de
kans dat jij herstelt NIET 75%, maar 75% van de patiënten worden verwacht te
herstellen
- probabiliteit binnen onderzoek
1. schatting van de populatieparameters
2. hypothesetesten: om te bepalen of waargenomen effecten waarschijnlijk zijn
opgetreden door toeval of niet
! examenvraag
Als je meer mensen in je steekproef hebt, wordt de steekproef (meer/minder) representatief voor de
populatie??? poweranalyse, via een formule bekijken hoeveel mensen je precies nodig hebt voor
een studie
Sampling error – steekproefverdeling van gemiddelden
Sampling distribution: wanneer je een oneindig aantal steekproeven uit een populatie zou nemen
- hoe meer steekproeven je neemt
o hoe meer je histogram gaat lijken op een normaalverdeling
o hoe meer het steekproefgemiddelde gelijk wordt aan het populatiegemiddelde
o de steekproef zal meer representatief worden voor de populatie
o de sampling error zal kleiner zijn
- Een steekproefverdeling is theoretisch, maar de eigenschappen van een normale curve zijn
voorspelbaar we kunnen het concept van de steekproefverdeling gebruiken om conclusies
te trekken uit steekproefgegevens
- Hoe doet men dit?
o De standaardafwijking van de steekproefverdeling wordt ook de standaardfout van
het gemiddelde genoemd (= standard deviation of the sampling distribution)
o De SEM is een schattig van de standaardafwijking van de populatie met behulp van
de steekproefgegevens
o Sem vertelt dus iets over de mate van de steekproeffout
Grote SEM (standaardfout) bij een kleine steekproefgrootte
Kleine SEM (standaardfout) bij een grote steekproef
o Informatie die we nodig hebben om de standaardafwijking van de populatie te
schatten
Standaarddeviatie van de steekproef (s)
Steekproefgrootte (n)
2