H1: over statistiek, statistieken en mathemafobia
Statistiek kan levens redden
- Florence Nightingale: diagram over oorzaken van Britse sterfgevallen
- maatschappelijke problemen vaststellen
vb. aantonen dat roken longkanker veroorzaakt
vb. genderkloof; betaalbaarheid woningmarkt
- machthebbers controleren
vb. corruptie in kaart brengen
- World Data Forum: belang van goede statistiekbureaus
Wat is statistiek?
- Historische context: statisticum (latijn)= ‘van de staat’
- Statistiek is de wetenschap van het verzamelen, organiseren, presenteren, analyseren en interpreteren
van gegevens of data volgend een numerieke logica
Nut voor een sociale wetenschapper?
- eigen onderzoek voeren
- bestaand onderzoek begrijpen/beoordelen: meten we wat we beweren te meten? - hoe zijn de cijfers
verzameld? - hoe zijn de cijfers geanalyseerd? - hoe zijn de cijfers gepresenteerd?
- kennis statistiek is onontbeerlijk
ONDERZOEKSELEMENTEN
- Populatie met N onderzoekselementen: ALLE mogelijke elementen worden onderzocht
= groep waarover onderzoek een uitspraak wil doen
- Steekproef (sample) met n onderzoekselementen: slechts EEN DEEL van groter geheel aan elementen
onderzocht (moet aselect/representatief zijn!)
= selectie uit totale populatie, waarop je onderzoek uitvoert
- Volkstelling (census): onderzoek van het geheel/volledige populatie proveren ondervragen
➔ De dinosaurus van de statistiek want dit wordt niet meer gedaan omdat je nooit echt de hele
bevolking bereikt. (ook duur en dikwijls vertekend)
, lOMoAR cPSD| 46898732
Problemen bij dataverzameling
1. Selectiebias
- Deelnemers zijn geen goede weergave van gehele populatie; niet representatief genoeg
- Bv. daklozen, zeevaarders, etc. komen niet in contact met enquêtes en krijgen geen stem
2. Non-responsbias
- Van het aantal mensen die mogen deelnemen aan het onderzoek zijn er maar weinigen die effectief
deelnemen (vertekend beeld)
- Kan zijn omdat ze niet willen of enquête terecht bij niet de juiste mensen
3. Responsbias
- Vertekening in de antwoorden van de deelnemers
- Door bv. suggestieve vraagstelling of sociale wenselijkheid
Voorbeeld ALFRED KINSEY:
- Alfred Kinsey, 1948: het seksleven van de Amerikaanse man:
50% van de getrouwde Amerikaanse mannen ging al een vreemd; 10% van de Amerikaanse mannen is
homoseksueel; 8% van de Amerikaanse mannen heeft ooit seks gehad met een dier .
➔ Kritiek:
- selectiebias: populatie 60 milj mannen en steekproef 5300 = niks mis mee, MAAR ertekening in wie hij
benaderde vb. universiteiten, homobars
- non-responsbias: vertekening in wie uiteindelijk deelnam vb. delicaat onderwerp, enkel extraverten
durfden mee te doen
- responsbias: vertekening in de antwoorden van deelnemers (niet helemaal eerlijk)
vb. suggestieve vraagstelling? (“Hoe oud was u toen u de eerste keer vreemd ging” i.p.v. “Bent
u al eens vreemdgegaan?”), Sociale wenselijkheid?
, lOMoAR cPSD| 46898732
Soorten steekproeven
THE GOOD:
- EAS: de enkelvoudige aselecte steeproef
➢ Iedereen krijgt gelijke kans om gekozen te worden
➢ Varianten:
➔ Clustersteekproef: uit verschillende groepen (andere geografische gebieden bv.) elementen
halen
(= tweestrapssteekproef) alles willekeurig, maar in twee stappen
Aselecte steekproef in twee stappen werken:
Vb. onderzoek middelbaar onderwijs: je wil iedereen een willekeurige ondervraging laten doen en je
trekt willekeurig dan zit je met het probleem dat de ene leerling helemaal in Kortrijk woont terwijl de
andere in Beerse woont waardoor je heel lang onderweg zou zijn
→ Dus je neemt eerst een random selectie van een aantal gemeenten (dan moet je maar naar die
gemeenten reizen)
→ En binnen die gemeenten ga je random leerlingen trekken
➔ Gestratificeerde steekproef: populatie indelen in categorieën (strata/subgroepen) (bv.
geslacht) en daaruit een toevalssteekproef halen.
Je maakt gebruik van voorkennis bij selectie onderzoekselementen
THE BAD:
- Convenience steekproef
➢ Je stuurt een link en laat mensen zelf kiezen of ze willen deelnemen (selectiebias en
nonresponsbias!!)
THE UGLY:
- The quotasteekproef
➢ Niet heel willekeurig.
➢ = gebruik maken van voorkennis bij selectie onderzoekselementen, steekproef kiezen op basis van
quota (bv. 50.000 man)
➢ Interviewer gaat selecteren o.b.v. bepaalde criteria (leeftijd, geslacht) (verschil met gestratificeerd!)
-> gevaar selectiebias door subjectiviteit bij het kiezen van steekproef.
➢ men beslist hoeveel men van een subcategorie in steekproef wil en maakt zo een ‘miniatuurversie
van de maatschappij’, MAAR representativiteit is belangrijker dan steekproefgroote!!
, lOMoAR cPSD| 46898732
NIET ALLE STEEKPROEVEN HEBBEN EVENVEEL WAARDE:
- Probleem van selectiebias vb. poll op facebook
- Websurveys met vrijwillige respons
- Gebruik Straw Poll: Literary Digest-schandaal 1936 Alf Landon vs Franklin Roosevelt: peilingonderzoek
➢ 10 miljoen Amerikanen gecontacteerd (uit telefoongidsen, abonneelijsten, rijbewijzen), 2,4 miljoen
antwoorden -> Alf Landon zou winnen
➢ Selectiebias = Geen representatieve voorstelling van de samenleving want niet veel mensen hadden
een auto, telefoon… zo bracht enkel rijke klasse stem uit (republikeinen)
➢ Non-responsbias = slechts 2.4 miljoen stuurden voorkeur door van de ong. 10 miljoen Amerikanen
- George Gallup: Quotasteekproef
➢ Steekproef van 50 000 Amerikanen: miniatuurversie van de Amerikaanse samenleving
➢ Beter om een representatieve steekproef te hebben dan een grote
➢ Representativiteit is belangrijker dan de steekproefgrootte, maar als de steekproef representatief
is, is een grote n beter dan een kleine
Problemen bij de presentatie van data
- Populariteit van het gemiddelde is risky omdat het gevoelig is voor uitschieters
- Misleidende grafieken
➢ y-as
➢ Animaties zorgt voor misleiding