Statistiek 2
Hoofdstuk 1. Inductieve statistiek in onderzoek
1.1 Welke plaats heeft statistiek in onderzoek en wat is het kernprobleem van inductieve statistiek?
Stel: onderzoek naar het effect van muziek op depressie
• deelnemers luisteren 1u naar melancholische rock of 1u naar popfunk
o melancholie: score van 102 op depressieve gevoelens
o popfunk: score van 99 op depressieve gevoelens
• vaststelling: “melancholie luisteraars zijn meer depressief dan popfunk luisteraars”
o stel dat de gegevens 120 vs 92 zijn, dan voelt het comfortabeler om te zeggen dat er
een verschil is; maar stel nu dat het 105 vs 97 is, dan twijfel je weer
• Kan dat toevallig zijn? Is het niet waarschijnlijk om zo een verschil te observeren ook al is er
geen invloed van muziek?
Probleem: Wanneer is een verschil groot genoeg?
• Wat als onze steekproeven toevallig onevenwichtig zijn samengesteld? Wanneer trekken we
een conclusie van verschil/verband?
• statistiek biedt regels om te beslissen; berekeningen zijn nodig om regels toe te passen
• hypothesetoetsing is nodig om tot significantie te komen
De empirische cyclus
• theorie: melorock = popfunk
• hypothese: melorock meer depressie dan popfunk
• dataverzameling: neem vragenlijst af na luisteren naar melorock of popfunk
• beschrijvende statistiek: melorock = 102 en popfunk = 99
• inductieve statistiek: Is 102 significant groter dan 99?
Statistisch significant
• Wanneer is een verschil groot genoeg? = het kernprobleem van de inductieve statistiek
• Wanneer kunnen we het verschil generaliseren naar de populatie?
• statistiek biedt regels om te beslissen via hypothesetoetsing en significantie
1.2 Wat is de rol van kansberekening en toetsen in de statistiek?
Kansberekening
• statistische significantie nagaan dmv kansberekening
• Is het geobserveerde verschil groot genoeg om significant te zijn?
Denkoefening waarin we kansen gebruiken
• 1: we gaan ervan uit dat er in werkelijkheid géén verschil is (omgekeerde redenering)
o populatie A = populatie B
• 2: we gaan de kans berekenen dat we in dat geval die observatie gaan doen (beide bv 102)
o steekproef A > steekproef B
• 3: grote kans → wellicht is het verschil geen echt verschil
• 3: kleine kans → mogelijk is het verschil ook een echt verschil
1
,Nieuwe vragen
• Hoe moeten we die kans berekenen?
o op basis van kansverdelingen (bv standaardnormale verdeling)
o met behulp van verschillende toetsen verder verwerken
• Wat is dan een “grote” en een “kleine” kans?
o 5% of 0.05 is het meest courant (zie later)
Zekerheid?
• we zijn nooit 100% zeker van de conclusie
• onzekerheid is geen probleem, als we maar de mate van onzekerheid kennen
• vb: “We concluderen met 95% zekerheid dat popfunk zorgt voor een betere gemoedstoestand
dan melancholische rock”
• zekerheid neemt wel toe naarmate er meer en meer studies hetzelfde bevestigen
Toetsen: toetsingssituaties zijn heel uiteenlopend
• Verschil in depressie bij verschillende muziek?
• Verschil in depressie vóór en na beluisteren van muziek?
• Verschil in depressie bij verschillende muziek en 2 methoden gedragstherapie?
• 500 deelnemers of slechts 20?
1.3 Hoe kan statistiek misbruikt worden en wat doen we daaraan?
Misbruik van statistiek
• onduidelijke steekproef: “95% van de Belgen is tevreden over Activia”
• gebrek aan context: “Duracell-batterijen gaan tot 5 maal langer mee”
• interne validiteit: Laat het onderzoeksopzet toe om causale conclusies te trekken?
Om alternatieve verklaringen uit te sluiten: experimenteel onderzoek
• randomiseren
• voormeting
• nameting
• controleren voor storende variabelen
• = methodologie: noodzakelijk om juiste conclusies te trekken, statistiek alleen is onvoldoende!
Correcte statistieken: laat anderen het harde werk doen en haal cijfers bij
Samengevat
• toetsende statistiek volgt op beschrijvende statistiek in de empirische cyclus
• de bedoeling is om obv verzamelde data een onderbouwde beslissing te nemen over verband
of verschil
• dat we over deze beslissing nooit 100% zeker zijn is niet erg, zo lang we maar de mate van
onzekerheid kennen
• om die mate van onzekerheid te bepalen, hebben we kansberekeningen nodig
• op basis daarvan kunnen we significantie berekenen
• statistiek is geen wetenschap op zich
• statistische conclusies zijn pas waardevol als ook aan de randvoorwaarden voldaan is en
statistiek niet misbruikt wordt
2
,Hoofdstuk 2. Kansverdeling en kansberekening
2.1 Wat is een kansverdeling en hoe kunnen we haar kenmerken berekenen?
Waarom hebben we kansen nodig?
• er zijn twee soorten vragen bij het bestuderen van de populatie obv steekproefgegevens
o hypothesetoetsing: met 95% zekerheid verschilt groep 1 met groep 2 in IQ-score
o interval-estimatie: het gemiddelde lijkt met 95% zekerheid tussen … en …
Frequentieverdeling
• kansverdeling lijkt heel erg op frequentieverdeling
• het uitzetten van geobserveerde data in een frequentieverdeling
• vb: frequentieverdeling van variabele ‘aantal ogen bij werpen van 2 dobbelstenen’ bij N = 50
Kansverdelingen
• nadenken over wat er kan gebeuren wanneer we 50 keer een dobbelsteen gooien
• vb: kansverdeling van variabele ‘aantal ogen bij het werpen van 2 dobbelstenen’ bij N = 50
Frequentieverdeling vs kansverdelingen
• verloop van de kansverdeling: gemiddelde en standaard-
afwijking bij kansverdeling niet echt mogelijk wegens
geen observaties, maar wél obv kansberekening
• kansverdeling is analoog aan de frequentieverdeling
o frequentieverdeling = geobserveerde waarden
o kansverdeling = hypothetische waarden
Gemiddelde kansverdeling
• gemiddelde van een kansverdeling = ‘verwachte waarde’ →
• vb: bij het gooien van 1 dobbelsteen →
Variantie kansverdelingen
• variantie van een kansverdeling →
• vb: bij het gooien van 1 dobbelsteen →
Kansverdelingen
• kansen zijn van groot belang in onderzoek omdat ze ons in staat stellen om te beslissen of een
observatie heel uitzonderlijk is of eerder heel gewoon
• om kansen te berekenen maken we gebruik van kansverdelingen: theoretische verdelingen
van mogelijke waarden en bijhorende kansen van een variabele
• sommige kansverdelingen kunnen we perfect kennen (bv dobbelsteen gooien), andere
kansverdelingen moeten we eerder schatten (bv intelligentie)
3
, 2.2 Wat is de steekproevenverdeling van het gemiddelde en hoe kunnen we de vorm van deze
verdeling kennen?
Steekproevenverdelingen van … (gemiddelde)
• een bijzondere kansverdeling: de steekproevenverdeling van het gemiddelde
o uit heel de populatie blijven we maar steekproeven trekken van 100 deelnemers en
die vormen een nieuwe verdeling
o je bekomt dus uit iedereen zijn individuele score een gemiddelde van de 100
deelnemers uit de steekproef, die gemiddeldes samen vormen een nieuwe grafiek
o Wat is dan de kans om een bepaald gemiddelde te observeren?
• verwachte waarde van steekproevenverdeling = populatiegemiddelde …
• →
Steekproevenverdelingen van … (gemiddelde)
• vb: populatie = 2, 4, 6
• we gaan een steekproef trekken van N = 2
• er zijn 9 mogelijke uitkomsten dus de kans is 1/9
• het gemiddelde van de populatie →
• het gemiddelde van de kansverdeling →
• dus: de verwachte waarde van de steekproevenverdeling = populatiegemiddelde …
• gemiddelde van de steekproef is een zuivere schatter van het gemiddelde van de populatie
• schatter: we schatten met behulp van het steekproefgemiddelde het populatiegemiddelde
• zuiver: geen systematische afwijkingen
4
Hoofdstuk 1. Inductieve statistiek in onderzoek
1.1 Welke plaats heeft statistiek in onderzoek en wat is het kernprobleem van inductieve statistiek?
Stel: onderzoek naar het effect van muziek op depressie
• deelnemers luisteren 1u naar melancholische rock of 1u naar popfunk
o melancholie: score van 102 op depressieve gevoelens
o popfunk: score van 99 op depressieve gevoelens
• vaststelling: “melancholie luisteraars zijn meer depressief dan popfunk luisteraars”
o stel dat de gegevens 120 vs 92 zijn, dan voelt het comfortabeler om te zeggen dat er
een verschil is; maar stel nu dat het 105 vs 97 is, dan twijfel je weer
• Kan dat toevallig zijn? Is het niet waarschijnlijk om zo een verschil te observeren ook al is er
geen invloed van muziek?
Probleem: Wanneer is een verschil groot genoeg?
• Wat als onze steekproeven toevallig onevenwichtig zijn samengesteld? Wanneer trekken we
een conclusie van verschil/verband?
• statistiek biedt regels om te beslissen; berekeningen zijn nodig om regels toe te passen
• hypothesetoetsing is nodig om tot significantie te komen
De empirische cyclus
• theorie: melorock = popfunk
• hypothese: melorock meer depressie dan popfunk
• dataverzameling: neem vragenlijst af na luisteren naar melorock of popfunk
• beschrijvende statistiek: melorock = 102 en popfunk = 99
• inductieve statistiek: Is 102 significant groter dan 99?
Statistisch significant
• Wanneer is een verschil groot genoeg? = het kernprobleem van de inductieve statistiek
• Wanneer kunnen we het verschil generaliseren naar de populatie?
• statistiek biedt regels om te beslissen via hypothesetoetsing en significantie
1.2 Wat is de rol van kansberekening en toetsen in de statistiek?
Kansberekening
• statistische significantie nagaan dmv kansberekening
• Is het geobserveerde verschil groot genoeg om significant te zijn?
Denkoefening waarin we kansen gebruiken
• 1: we gaan ervan uit dat er in werkelijkheid géén verschil is (omgekeerde redenering)
o populatie A = populatie B
• 2: we gaan de kans berekenen dat we in dat geval die observatie gaan doen (beide bv 102)
o steekproef A > steekproef B
• 3: grote kans → wellicht is het verschil geen echt verschil
• 3: kleine kans → mogelijk is het verschil ook een echt verschil
1
,Nieuwe vragen
• Hoe moeten we die kans berekenen?
o op basis van kansverdelingen (bv standaardnormale verdeling)
o met behulp van verschillende toetsen verder verwerken
• Wat is dan een “grote” en een “kleine” kans?
o 5% of 0.05 is het meest courant (zie later)
Zekerheid?
• we zijn nooit 100% zeker van de conclusie
• onzekerheid is geen probleem, als we maar de mate van onzekerheid kennen
• vb: “We concluderen met 95% zekerheid dat popfunk zorgt voor een betere gemoedstoestand
dan melancholische rock”
• zekerheid neemt wel toe naarmate er meer en meer studies hetzelfde bevestigen
Toetsen: toetsingssituaties zijn heel uiteenlopend
• Verschil in depressie bij verschillende muziek?
• Verschil in depressie vóór en na beluisteren van muziek?
• Verschil in depressie bij verschillende muziek en 2 methoden gedragstherapie?
• 500 deelnemers of slechts 20?
1.3 Hoe kan statistiek misbruikt worden en wat doen we daaraan?
Misbruik van statistiek
• onduidelijke steekproef: “95% van de Belgen is tevreden over Activia”
• gebrek aan context: “Duracell-batterijen gaan tot 5 maal langer mee”
• interne validiteit: Laat het onderzoeksopzet toe om causale conclusies te trekken?
Om alternatieve verklaringen uit te sluiten: experimenteel onderzoek
• randomiseren
• voormeting
• nameting
• controleren voor storende variabelen
• = methodologie: noodzakelijk om juiste conclusies te trekken, statistiek alleen is onvoldoende!
Correcte statistieken: laat anderen het harde werk doen en haal cijfers bij
Samengevat
• toetsende statistiek volgt op beschrijvende statistiek in de empirische cyclus
• de bedoeling is om obv verzamelde data een onderbouwde beslissing te nemen over verband
of verschil
• dat we over deze beslissing nooit 100% zeker zijn is niet erg, zo lang we maar de mate van
onzekerheid kennen
• om die mate van onzekerheid te bepalen, hebben we kansberekeningen nodig
• op basis daarvan kunnen we significantie berekenen
• statistiek is geen wetenschap op zich
• statistische conclusies zijn pas waardevol als ook aan de randvoorwaarden voldaan is en
statistiek niet misbruikt wordt
2
,Hoofdstuk 2. Kansverdeling en kansberekening
2.1 Wat is een kansverdeling en hoe kunnen we haar kenmerken berekenen?
Waarom hebben we kansen nodig?
• er zijn twee soorten vragen bij het bestuderen van de populatie obv steekproefgegevens
o hypothesetoetsing: met 95% zekerheid verschilt groep 1 met groep 2 in IQ-score
o interval-estimatie: het gemiddelde lijkt met 95% zekerheid tussen … en …
Frequentieverdeling
• kansverdeling lijkt heel erg op frequentieverdeling
• het uitzetten van geobserveerde data in een frequentieverdeling
• vb: frequentieverdeling van variabele ‘aantal ogen bij werpen van 2 dobbelstenen’ bij N = 50
Kansverdelingen
• nadenken over wat er kan gebeuren wanneer we 50 keer een dobbelsteen gooien
• vb: kansverdeling van variabele ‘aantal ogen bij het werpen van 2 dobbelstenen’ bij N = 50
Frequentieverdeling vs kansverdelingen
• verloop van de kansverdeling: gemiddelde en standaard-
afwijking bij kansverdeling niet echt mogelijk wegens
geen observaties, maar wél obv kansberekening
• kansverdeling is analoog aan de frequentieverdeling
o frequentieverdeling = geobserveerde waarden
o kansverdeling = hypothetische waarden
Gemiddelde kansverdeling
• gemiddelde van een kansverdeling = ‘verwachte waarde’ →
• vb: bij het gooien van 1 dobbelsteen →
Variantie kansverdelingen
• variantie van een kansverdeling →
• vb: bij het gooien van 1 dobbelsteen →
Kansverdelingen
• kansen zijn van groot belang in onderzoek omdat ze ons in staat stellen om te beslissen of een
observatie heel uitzonderlijk is of eerder heel gewoon
• om kansen te berekenen maken we gebruik van kansverdelingen: theoretische verdelingen
van mogelijke waarden en bijhorende kansen van een variabele
• sommige kansverdelingen kunnen we perfect kennen (bv dobbelsteen gooien), andere
kansverdelingen moeten we eerder schatten (bv intelligentie)
3
, 2.2 Wat is de steekproevenverdeling van het gemiddelde en hoe kunnen we de vorm van deze
verdeling kennen?
Steekproevenverdelingen van … (gemiddelde)
• een bijzondere kansverdeling: de steekproevenverdeling van het gemiddelde
o uit heel de populatie blijven we maar steekproeven trekken van 100 deelnemers en
die vormen een nieuwe verdeling
o je bekomt dus uit iedereen zijn individuele score een gemiddelde van de 100
deelnemers uit de steekproef, die gemiddeldes samen vormen een nieuwe grafiek
o Wat is dan de kans om een bepaald gemiddelde te observeren?
• verwachte waarde van steekproevenverdeling = populatiegemiddelde …
• →
Steekproevenverdelingen van … (gemiddelde)
• vb: populatie = 2, 4, 6
• we gaan een steekproef trekken van N = 2
• er zijn 9 mogelijke uitkomsten dus de kans is 1/9
• het gemiddelde van de populatie →
• het gemiddelde van de kansverdeling →
• dus: de verwachte waarde van de steekproevenverdeling = populatiegemiddelde …
• gemiddelde van de steekproef is een zuivere schatter van het gemiddelde van de populatie
• schatter: we schatten met behulp van het steekproefgemiddelde het populatiegemiddelde
• zuiver: geen systematische afwijkingen
4