Statistiek 1
1. De statistiek in het onderzoek
1.1. Belangrijke begrippen (deze moet je kunnen kennen en beschrijven!)
Kwaliteitsvol onderzoek – voorwaarden van Brinkman
Onderzoeksfasen – operationalisering
Experiment – correlationeel onderzoek – kwalitatief – kwantitatief
Variabele – afhankelijke variabele – onafhankelijke variabele – covariaat
Causaliteit – criteria van Hume & Mill
Populatie – steekproef – steekproeftrekkingen
Beschrijvende statistiek – inductieve/verklarende statistiek
1.2. Wat is statistiek? lege doos met allerlei formules zegt pas iets als je toepast
Statistiek is de wetenschap van
- Het verzamelen van gegevens (technieken aanlegt op een betrouwbare manier)
- Het classificeren van gegevens (zoeken naar patronen en structuren + verschillen)
- Het samenvatten van gegevens (in één of enkele getallen samenvatten bv; gemiddelde
+ werken met verschillen)
- Het organiseren van gegevens
- Het analyseren van gegevens
- Het interpreteren van gegevens
Gegevens worden verzameld via een steekproef uit een populatie
- Populatie (de bestudeerde groep) bv: ALLE werknemers van bedrijf Spicy Nuts
Met: N = de populatieomvang
- Steekproef (een selectie uit de populatie) bv: werknemers die vragenlijst invulden
Met: n = de steekproefgrootte
- Census: N = n
Gegevens worden bestudeerd via beschrijvende en/of inductieve statistiek
- Beschrijvende statistiek: kenmerken van steekproefgegevens samenvatten EN
uitspraken beperkt tot steekproef (beperken op de steekproef)
- Inductieve statistiek: kenmerken van steekproefgegevens gebruiken als schattingen
voor populatiekenmerken EN uitspraken veralgemenen naar populatie EN
veralgemenen gaat gepaard met onzekerheden (kansuitspraken) + ook wel
verklarende statistiek genoemd (populatie onder de aandacht, je gaat de gegevens
gebruiken die je hebt verzamelt en ook van de mensen die je niet hebt gemeten
gebruiken)
Steekproef zo kwaliteitsvol samenstellen (is belangrijk!)
, 1.3. Wat is onderzoek.
Onderzoek leidt tot algemene uitspraken gebaseerd op observaties (= waarnemingen in de
werkelijkheid)
- Jan is ziek individueel uitspraak (individu is ver van algemeen), observeerbaar
- Rapunzel is lang ongelukkig geweest individu, niet observeerbaar (niet controleren)
- Kabouters zijn kleiner dan mensen algemene uitspraak, niet observeerbaar
- Bomen hebben een stam algemene uitspraak, observeerbaar
- TP-studenten zijn socialer dan IT-studenten algemene uitspraak, observeerbaar
Algemene uitspraken bevatten een mate van onzekerheid (0-100%)
Deterministische uitspraken = zekerheden, wetmatigheden, definities, …
Probabilistische uitspraken = onzekerheden
- Jan is ziek eerder deterministisch
- Rapunzel is lang ongelukkig geweest eerder probabilistisch
- Kabouters zijn kleiner dan mensen eerder deterministisch
- Bomen hebben een stam eerder deterministisch
- TP-studenten zijn socialer dan IT-studenten eerder probabilistisch
Statistiek is een onderzoekhulpmiddel = helpt om gegevens (=observaties) te vertalen naar
algemene uitspraken
- Beschrijvende statistiek: waarnemingen uitspraken over steekproef EN
onzekerheden hangen af kwaliteit van onderzoek (gegevens) (deterministisch)
- Inductieve statistiek: waarnemingen uitspraken over populatie EN onzekerheden
hangen af van kwaliteit van onderzoek (gegevens) & kansberekening
(probabilistisch)
Kwaliteitsvolle gegevens bekomen via kwaliteitsvol onderzoek
- Objectiviteit (iedereen krijgt koffie of niks, in een groep met criminelen gaat dit dan
vooroordelen met zich meenemen?)
- Controleerbaarheid (eens gegevens verzameld ‘ruwe gegevens’, interviews worden
geschreven nadien uitgevoerd en afgeprint en zo kan je het ook nog eens controleren)
- Herhaalbaarheid (draaiboek schrijven over deelnemers + ander proefleider kan
overnemen)
- Systematiek (experimenteren)
nauwgezet omschrijven van en gedragen tijdens een onderzoek
(dia 13 artikel ijsjes gele stuk is draaiboek en groene stuk is bep. uitspraken kunnen doen)
1.3.1. Soorten onderzoek
Hoe gaan we ons ‘draaiboek’ vorm
geven (herhaalbaarheid)
Om experimenten te analyseren
hebben we variabelen nodig zoals
AV en OV.
,Variabele: een verzameling van thematisch gerelateerde informatie
Bv; ontbijttype: ijsje, koud water, geen ontbijt
Onafhankelijke variabelen (OV): een variabele bestaande uit condities, groepen,
manipulaties, interventies, …
Afhankelijke variabelen (AV): een variabele bestaande uit metingen van cases, deelnemers
… (hangt de informatie af van iets anders?)
Resultaten: zorgt een bepaalde conditie voor een aantoonbare wijziging in de metingen? EN
interpretatie waarin een verband tussen AV en OV wordt nagegaan
Vragenlijststudie of een enquete alleen
info verzamelen van de deelnemers.
Deelnemers vragen wat ze als ontbijt
hebben gegeten daarna registreren. En
het gegeven antwoord vertalen in een
‘nutri-score’
Gestandaardiseerde vragenlijst
Onbetrouwbaar omdat je alle info laat
komen van je deelnemers je meet
twee dingen en ziet of er een relatie zit
tussen.
Geen OV of AV = niet van toepassing
Covariaten: variabelen bestaande uit metingen van cases, deelnemers, … (variabelen die we
nemen)
Resultaten: zorgt een bepaalde conditie voor een aantoonbare wijziging in de metingen? EN
interpretatie waarin een verband tussen AV en OV wordt nagegaan
1.3.2. Soorten verbanden (obv onderzoek kunnen selecteren welke verband op ex)
Verband: uitspraak waarin de relatie tussen variabelen wordt uitgedrukt
- Gezonder ontbijten maakt slimmer x; gezondheid van ontbijt Y: iq van deelnemer
direct causaal verband want variabel X veroorzaakt Y.
- Gezonder ontbijten stimuleert de intelligentie en slimmere mensen maken gezondere
ontbijtkeuzes x; gezondheid van ontbijt y; iq van deelnemer gaat in twee
richtingen het één veroorzaakt ander en de andere veroorzaakt het één covariatie
verband het gaat twee richtingen uit.
- Slimmere mensen eten gezonder invers causaal verband
- Slimme ouders hebben een grotere kans op slimmere kinderen, slimmere ouders
leren kinderen gezondere ontbijtkeuzes te maken indirect verband heel moeilijk
nooit iets exact of perfect iets gaan weten in de praktijk. Het systematisch werken is
, hier het belangrijkste, je gaat bouwen op het werk van de onderzoekers die voor ons
hebben gedaan. Als je onderzoek gaat opzetten dan weet je wat de mogelijke
processen zijn die een mogelijke invloed gaan kunnen hebben.
X = gezondheid van ontbijt; Y = intelligentie van deelnemer; Z = intelligentie van ouders
Zwakte van een correlationeel onderzoek is dat we alleen maar meten.
Direct causale verbanden criteria van Hume & Mill = voorwaarden om te kunnen spreken
van een direct causaal verband (X veroorzaakt Y)
- Tijdruimtelijke structuur van oorzaak & gevolg
- Oorzaak vindt plaats voor het gevolg
chronologische verloop (logische aanpak, OV eerst toepassen gevolg aan
een meting dus alles gebeurt in een bepaalde volgorde)
- Als de oorzaak niet plaatsvindt, dan is er geen meetbaar gevolg
belang van controleconditie (een nul- of basismeting als vergelijkingspunt)
als we naar OV gaan kijken, belangrijkste conditie is ijsje (experimentele conditie) je kan het
nagaan als je een basismeting hebt gedaan, geen ontbijt stimuleert niks bij de mensen.
Belang van nul-meting!!!!
- Er zijn geen alternatieve verklaringen
geen indirecte verbanden ieder deel benaderen als het protocol dat er is.
Je doet alles zo nauwkeurig volgens het plan zodat de laatste zonde risico goed
verloopt.
Kenmerken van een experiment
- Chronologie: OV AV: eerst groepsindeling/manipulaties/interventies/… dan
metingen
- Controle conditie: OV: meestal ook een basis- of controlemeting (controle conditie)
- Geen indirecte verbanden? Blijft discussiepunt: afhankelijk van de kwaliteit van het
onderzoek vooronderzoek goed doen en dan volgens de regel van
kwaliteitsonderzoek gedragen zodat het goed verloopt!
Criteria van Brinkman = noodzakelijke voorwaarden voor kwaliteitsvol onderzoek
Criteria van Hume & Mill = voorwaarden om sterkere uitspraken te kunnen maken; in het
beste geval: causale (als-dan) uitspraken
Voorbeeld examenvraag:
Tijdens het academiejaar 2023-2024 ontwikkelde een groep studenten een handleiding voor
sportcoaches om de trainingsmethoden van hun teams te evalueren. Deze handleiding zorgt
ervoor dat elke coach dezelfde criteria en procedures kan gebruiken om de prestaties van hun
teams te beoordelen.
Welk criterium van Brinkman wordt met deze handleiding extra in de verf gezet?
- Controleerbaarheid (iedereen kan controleren of de onderzoek klopt)
- Herhaalbaarheid (grondige procedures zodat het goed herhaalbaar is.)
- Objectiviteit (het gaat over de inhoud van het draaiboek wat pp moeten doen)
- Systematiek (voor onderzoek die je doet van andere onderzoeken)
1. De statistiek in het onderzoek
1.1. Belangrijke begrippen (deze moet je kunnen kennen en beschrijven!)
Kwaliteitsvol onderzoek – voorwaarden van Brinkman
Onderzoeksfasen – operationalisering
Experiment – correlationeel onderzoek – kwalitatief – kwantitatief
Variabele – afhankelijke variabele – onafhankelijke variabele – covariaat
Causaliteit – criteria van Hume & Mill
Populatie – steekproef – steekproeftrekkingen
Beschrijvende statistiek – inductieve/verklarende statistiek
1.2. Wat is statistiek? lege doos met allerlei formules zegt pas iets als je toepast
Statistiek is de wetenschap van
- Het verzamelen van gegevens (technieken aanlegt op een betrouwbare manier)
- Het classificeren van gegevens (zoeken naar patronen en structuren + verschillen)
- Het samenvatten van gegevens (in één of enkele getallen samenvatten bv; gemiddelde
+ werken met verschillen)
- Het organiseren van gegevens
- Het analyseren van gegevens
- Het interpreteren van gegevens
Gegevens worden verzameld via een steekproef uit een populatie
- Populatie (de bestudeerde groep) bv: ALLE werknemers van bedrijf Spicy Nuts
Met: N = de populatieomvang
- Steekproef (een selectie uit de populatie) bv: werknemers die vragenlijst invulden
Met: n = de steekproefgrootte
- Census: N = n
Gegevens worden bestudeerd via beschrijvende en/of inductieve statistiek
- Beschrijvende statistiek: kenmerken van steekproefgegevens samenvatten EN
uitspraken beperkt tot steekproef (beperken op de steekproef)
- Inductieve statistiek: kenmerken van steekproefgegevens gebruiken als schattingen
voor populatiekenmerken EN uitspraken veralgemenen naar populatie EN
veralgemenen gaat gepaard met onzekerheden (kansuitspraken) + ook wel
verklarende statistiek genoemd (populatie onder de aandacht, je gaat de gegevens
gebruiken die je hebt verzamelt en ook van de mensen die je niet hebt gemeten
gebruiken)
Steekproef zo kwaliteitsvol samenstellen (is belangrijk!)
, 1.3. Wat is onderzoek.
Onderzoek leidt tot algemene uitspraken gebaseerd op observaties (= waarnemingen in de
werkelijkheid)
- Jan is ziek individueel uitspraak (individu is ver van algemeen), observeerbaar
- Rapunzel is lang ongelukkig geweest individu, niet observeerbaar (niet controleren)
- Kabouters zijn kleiner dan mensen algemene uitspraak, niet observeerbaar
- Bomen hebben een stam algemene uitspraak, observeerbaar
- TP-studenten zijn socialer dan IT-studenten algemene uitspraak, observeerbaar
Algemene uitspraken bevatten een mate van onzekerheid (0-100%)
Deterministische uitspraken = zekerheden, wetmatigheden, definities, …
Probabilistische uitspraken = onzekerheden
- Jan is ziek eerder deterministisch
- Rapunzel is lang ongelukkig geweest eerder probabilistisch
- Kabouters zijn kleiner dan mensen eerder deterministisch
- Bomen hebben een stam eerder deterministisch
- TP-studenten zijn socialer dan IT-studenten eerder probabilistisch
Statistiek is een onderzoekhulpmiddel = helpt om gegevens (=observaties) te vertalen naar
algemene uitspraken
- Beschrijvende statistiek: waarnemingen uitspraken over steekproef EN
onzekerheden hangen af kwaliteit van onderzoek (gegevens) (deterministisch)
- Inductieve statistiek: waarnemingen uitspraken over populatie EN onzekerheden
hangen af van kwaliteit van onderzoek (gegevens) & kansberekening
(probabilistisch)
Kwaliteitsvolle gegevens bekomen via kwaliteitsvol onderzoek
- Objectiviteit (iedereen krijgt koffie of niks, in een groep met criminelen gaat dit dan
vooroordelen met zich meenemen?)
- Controleerbaarheid (eens gegevens verzameld ‘ruwe gegevens’, interviews worden
geschreven nadien uitgevoerd en afgeprint en zo kan je het ook nog eens controleren)
- Herhaalbaarheid (draaiboek schrijven over deelnemers + ander proefleider kan
overnemen)
- Systematiek (experimenteren)
nauwgezet omschrijven van en gedragen tijdens een onderzoek
(dia 13 artikel ijsjes gele stuk is draaiboek en groene stuk is bep. uitspraken kunnen doen)
1.3.1. Soorten onderzoek
Hoe gaan we ons ‘draaiboek’ vorm
geven (herhaalbaarheid)
Om experimenten te analyseren
hebben we variabelen nodig zoals
AV en OV.
,Variabele: een verzameling van thematisch gerelateerde informatie
Bv; ontbijttype: ijsje, koud water, geen ontbijt
Onafhankelijke variabelen (OV): een variabele bestaande uit condities, groepen,
manipulaties, interventies, …
Afhankelijke variabelen (AV): een variabele bestaande uit metingen van cases, deelnemers
… (hangt de informatie af van iets anders?)
Resultaten: zorgt een bepaalde conditie voor een aantoonbare wijziging in de metingen? EN
interpretatie waarin een verband tussen AV en OV wordt nagegaan
Vragenlijststudie of een enquete alleen
info verzamelen van de deelnemers.
Deelnemers vragen wat ze als ontbijt
hebben gegeten daarna registreren. En
het gegeven antwoord vertalen in een
‘nutri-score’
Gestandaardiseerde vragenlijst
Onbetrouwbaar omdat je alle info laat
komen van je deelnemers je meet
twee dingen en ziet of er een relatie zit
tussen.
Geen OV of AV = niet van toepassing
Covariaten: variabelen bestaande uit metingen van cases, deelnemers, … (variabelen die we
nemen)
Resultaten: zorgt een bepaalde conditie voor een aantoonbare wijziging in de metingen? EN
interpretatie waarin een verband tussen AV en OV wordt nagegaan
1.3.2. Soorten verbanden (obv onderzoek kunnen selecteren welke verband op ex)
Verband: uitspraak waarin de relatie tussen variabelen wordt uitgedrukt
- Gezonder ontbijten maakt slimmer x; gezondheid van ontbijt Y: iq van deelnemer
direct causaal verband want variabel X veroorzaakt Y.
- Gezonder ontbijten stimuleert de intelligentie en slimmere mensen maken gezondere
ontbijtkeuzes x; gezondheid van ontbijt y; iq van deelnemer gaat in twee
richtingen het één veroorzaakt ander en de andere veroorzaakt het één covariatie
verband het gaat twee richtingen uit.
- Slimmere mensen eten gezonder invers causaal verband
- Slimme ouders hebben een grotere kans op slimmere kinderen, slimmere ouders
leren kinderen gezondere ontbijtkeuzes te maken indirect verband heel moeilijk
nooit iets exact of perfect iets gaan weten in de praktijk. Het systematisch werken is
, hier het belangrijkste, je gaat bouwen op het werk van de onderzoekers die voor ons
hebben gedaan. Als je onderzoek gaat opzetten dan weet je wat de mogelijke
processen zijn die een mogelijke invloed gaan kunnen hebben.
X = gezondheid van ontbijt; Y = intelligentie van deelnemer; Z = intelligentie van ouders
Zwakte van een correlationeel onderzoek is dat we alleen maar meten.
Direct causale verbanden criteria van Hume & Mill = voorwaarden om te kunnen spreken
van een direct causaal verband (X veroorzaakt Y)
- Tijdruimtelijke structuur van oorzaak & gevolg
- Oorzaak vindt plaats voor het gevolg
chronologische verloop (logische aanpak, OV eerst toepassen gevolg aan
een meting dus alles gebeurt in een bepaalde volgorde)
- Als de oorzaak niet plaatsvindt, dan is er geen meetbaar gevolg
belang van controleconditie (een nul- of basismeting als vergelijkingspunt)
als we naar OV gaan kijken, belangrijkste conditie is ijsje (experimentele conditie) je kan het
nagaan als je een basismeting hebt gedaan, geen ontbijt stimuleert niks bij de mensen.
Belang van nul-meting!!!!
- Er zijn geen alternatieve verklaringen
geen indirecte verbanden ieder deel benaderen als het protocol dat er is.
Je doet alles zo nauwkeurig volgens het plan zodat de laatste zonde risico goed
verloopt.
Kenmerken van een experiment
- Chronologie: OV AV: eerst groepsindeling/manipulaties/interventies/… dan
metingen
- Controle conditie: OV: meestal ook een basis- of controlemeting (controle conditie)
- Geen indirecte verbanden? Blijft discussiepunt: afhankelijk van de kwaliteit van het
onderzoek vooronderzoek goed doen en dan volgens de regel van
kwaliteitsonderzoek gedragen zodat het goed verloopt!
Criteria van Brinkman = noodzakelijke voorwaarden voor kwaliteitsvol onderzoek
Criteria van Hume & Mill = voorwaarden om sterkere uitspraken te kunnen maken; in het
beste geval: causale (als-dan) uitspraken
Voorbeeld examenvraag:
Tijdens het academiejaar 2023-2024 ontwikkelde een groep studenten een handleiding voor
sportcoaches om de trainingsmethoden van hun teams te evalueren. Deze handleiding zorgt
ervoor dat elke coach dezelfde criteria en procedures kan gebruiken om de prestaties van hun
teams te beoordelen.
Welk criterium van Brinkman wordt met deze handleiding extra in de verf gezet?
- Controleerbaarheid (iedereen kan controleren of de onderzoek klopt)
- Herhaalbaarheid (grondige procedures zodat het goed herhaalbaar is.)
- Objectiviteit (het gaat over de inhoud van het draaiboek wat pp moeten doen)
- Systematiek (voor onderzoek die je doet van andere onderzoeken)