Statistiek
1. Inductieve statistiek
Statistiek biedt regels om te beslissen; berekeningen zijn nodig om regels te kunnen toepassen
De empirische cyclus
Statistisch significant
- Wanneer is een verschil groot genoeg= kernprobleem van de inductieve statistiek
- Wanneer kunnen we het verschil generaliseren naar populatie
- Statistiek biedt regels om te beslissen via
o Hypothesetoetsing en significantie
1.1. Wat is de rol van kansberekening en toetsen in de statistiek
Statistische significantie nagaan dmv kansberekening:
Is het geobserveerde verschil groot genoeg om significant te zijn?
Nieuwe vragen:
- Hoe moeten we die kans berekenen ?
o Op basis van kansverdelingen (bv. Standaardformaten verdeling)
o Met behulp van verschillende toetsen
- Wat is dan een grote en een kleine kans
o 5% of 0,05 meerstemmig courant
Zekerheid?
Nooit 100% zeker van conclusie
Onzekerheid is geen probleem, als we maar de mate van onzekerheid kennen!
, - Bv. We concluderen met 95% zekerheid dat popfunk zorgt voor een betere gemoedstoestand
dan melancholische rock
Toetsen
Toestingssituaties zijn heel uiteenlopend
- Verschil in depressie bij verschillende muziek?
- Verschil in depressie voor en na beluisteren van muziek
- Verschil in depressie bij verschillende muziek en 2 methoden gedragstherapie
- 500 deelnemers of slechts 20?
—>uiteenlopende toetsen
1.2. Hoe kan statistiek misbruikt worden en wat doen we daaraan?
Onduidelijke steekproef: 95% van de Belgen is tevreden over Activia
Gebrek aan context: Duracell-batterijen gaan tot 5 maal langer mee
Interne validiteit: laat het onderzoeksopzet toe om causale conclusies te trekken
Om alternatieve verklaringen uit te sluiten: experimenteel onderzoek
- Randomiseren
- Voormeting
- Nameting
- Controleren voor storende variabelen
= methodologie: noodzakelijk om juiste conclusies te trekken, statistiek alleen is onvoldoende
Correcte statistiek
Laat anderen het harde werk doen en haal cijfers bij bv. Statistiek Vlaanderen, gapminder
2. Kansverdelingen
Doelstellingen:
2.1. Wat is een kansverdeling en hoe kunnen we haar kenmerken berekenen
Waarom hebben we kansen nodig?
- Twee soorten vragen bij bestuurden van populatie op basis van steekproefgegeven
o Hypothesetoetsing: vergelijking tussen 2 groepen
o Intervalestimatie: betrouwbaarheidsinterval
,Frequentieverdeling van de variable aantal opgen bij het werpen van twee dobbelstenen bij N=50
Kansverdeling van de variabele aantal opgen bij het werpen van twee dobbelstenen bij N= 50
Kansverdelingen maken we op basis van hypothetische waarden
Frequentieverdeling maken we op basis van geobserveerde waarden
Verloop van de kansverdeling?
Gemiddelde en standaardafwijking bij kansverdeling niet echt mogelijk wegen geen observaties, maar
wel op basis van kansberekening
Gemiddelde van de kansverdeling: verwachte waarde
Variantie van een kansverdeling
, - Kansen in van groot belang in onderzoek omdat ze ons in staat stellen om te beslissen of een
observatie heel uitzonderlijk is of eerder heel gewoon
- Om kansen te berekenen maken we gebruik van kansverdelingen: theoretische verdelingen
van mogelijke waarden en bijhorend kansen van een variabele
- Sommige kansverdelingen kunnen we perfect kunnen (bv. Dobbelsteen gooien), andere
kansverdelingen moeten we eerder schatten (bv. Intelligentie)
2.2. Wat is de steekproevenverdeling van het gemiddelde en hoe
kunnen we de vorm van deze verdeling kennen?
Een bijzondere kansverdeling:
De steekproeven-verdeling van het gemiddelde
Verwachte waarde van steekproevenverdeling= populatiegemiddelde
u
Verwachte waarde van steekproevenverdeling= populatiegemiddelde 𝜇𝑋̅
Gemiddelde van de steekproef is een zuivere schatter van het gemiddelde van de populatie
Schatter: we schatten met behulp van het steekproefgemiddelde het populatiegemiddlede
Zuiver: geen systematische afwijkingen
Standaardafwijking van steekproevenverdeling= standaardgoud van gemiddelde 𝜎𝑋̅
1. Inductieve statistiek
Statistiek biedt regels om te beslissen; berekeningen zijn nodig om regels te kunnen toepassen
De empirische cyclus
Statistisch significant
- Wanneer is een verschil groot genoeg= kernprobleem van de inductieve statistiek
- Wanneer kunnen we het verschil generaliseren naar populatie
- Statistiek biedt regels om te beslissen via
o Hypothesetoetsing en significantie
1.1. Wat is de rol van kansberekening en toetsen in de statistiek
Statistische significantie nagaan dmv kansberekening:
Is het geobserveerde verschil groot genoeg om significant te zijn?
Nieuwe vragen:
- Hoe moeten we die kans berekenen ?
o Op basis van kansverdelingen (bv. Standaardformaten verdeling)
o Met behulp van verschillende toetsen
- Wat is dan een grote en een kleine kans
o 5% of 0,05 meerstemmig courant
Zekerheid?
Nooit 100% zeker van conclusie
Onzekerheid is geen probleem, als we maar de mate van onzekerheid kennen!
, - Bv. We concluderen met 95% zekerheid dat popfunk zorgt voor een betere gemoedstoestand
dan melancholische rock
Toetsen
Toestingssituaties zijn heel uiteenlopend
- Verschil in depressie bij verschillende muziek?
- Verschil in depressie voor en na beluisteren van muziek
- Verschil in depressie bij verschillende muziek en 2 methoden gedragstherapie
- 500 deelnemers of slechts 20?
—>uiteenlopende toetsen
1.2. Hoe kan statistiek misbruikt worden en wat doen we daaraan?
Onduidelijke steekproef: 95% van de Belgen is tevreden over Activia
Gebrek aan context: Duracell-batterijen gaan tot 5 maal langer mee
Interne validiteit: laat het onderzoeksopzet toe om causale conclusies te trekken
Om alternatieve verklaringen uit te sluiten: experimenteel onderzoek
- Randomiseren
- Voormeting
- Nameting
- Controleren voor storende variabelen
= methodologie: noodzakelijk om juiste conclusies te trekken, statistiek alleen is onvoldoende
Correcte statistiek
Laat anderen het harde werk doen en haal cijfers bij bv. Statistiek Vlaanderen, gapminder
2. Kansverdelingen
Doelstellingen:
2.1. Wat is een kansverdeling en hoe kunnen we haar kenmerken berekenen
Waarom hebben we kansen nodig?
- Twee soorten vragen bij bestuurden van populatie op basis van steekproefgegeven
o Hypothesetoetsing: vergelijking tussen 2 groepen
o Intervalestimatie: betrouwbaarheidsinterval
,Frequentieverdeling van de variable aantal opgen bij het werpen van twee dobbelstenen bij N=50
Kansverdeling van de variabele aantal opgen bij het werpen van twee dobbelstenen bij N= 50
Kansverdelingen maken we op basis van hypothetische waarden
Frequentieverdeling maken we op basis van geobserveerde waarden
Verloop van de kansverdeling?
Gemiddelde en standaardafwijking bij kansverdeling niet echt mogelijk wegen geen observaties, maar
wel op basis van kansberekening
Gemiddelde van de kansverdeling: verwachte waarde
Variantie van een kansverdeling
, - Kansen in van groot belang in onderzoek omdat ze ons in staat stellen om te beslissen of een
observatie heel uitzonderlijk is of eerder heel gewoon
- Om kansen te berekenen maken we gebruik van kansverdelingen: theoretische verdelingen
van mogelijke waarden en bijhorend kansen van een variabele
- Sommige kansverdelingen kunnen we perfect kunnen (bv. Dobbelsteen gooien), andere
kansverdelingen moeten we eerder schatten (bv. Intelligentie)
2.2. Wat is de steekproevenverdeling van het gemiddelde en hoe
kunnen we de vorm van deze verdeling kennen?
Een bijzondere kansverdeling:
De steekproeven-verdeling van het gemiddelde
Verwachte waarde van steekproevenverdeling= populatiegemiddelde
u
Verwachte waarde van steekproevenverdeling= populatiegemiddelde 𝜇𝑋̅
Gemiddelde van de steekproef is een zuivere schatter van het gemiddelde van de populatie
Schatter: we schatten met behulp van het steekproefgemiddelde het populatiegemiddlede
Zuiver: geen systematische afwijkingen
Standaardafwijking van steekproevenverdeling= standaardgoud van gemiddelde 𝜎𝑋̅