Statistiek III: univariate data-analyse - schakeljaar
Inleiding
1. Inductieve technieken
Vraag: ‘In welke mate is dit
een goede weergave van de
werkelijkheid?’ ‘Valt er een
verschil waar te nemen?’
Vraag: ‘Hoe groot mag het
verschil zijn?’
2. Betrouwbaarheidsinterval
• 95% betrouwbaarheidsinterval
- Een omgeving rondom het resultaat van 1 replicatie zodat in 95% van de replicaties een
interval wordt gevonden dat de echte populatiewaarde van de onderzochte variabele (het
resultaat op populatie niveau) bevat.
- Interval definiëren rond het populatiegemiddelde.
• Gedrag van de betrouwbaarheid
- Klein BI impliceert een hoge betrouwbaarheid en dus een kleine foutenmarge
- Grote steekproef <-> kostprijs, tijd, organisatie…
- Lager betrouwbaarheidsniveau (99%, 95%, 90%...) <-> risico: exploratief onderzoek
- Kleinere σ <-> meetprocedures, design, homogene groepen
é s ù
BI voor m = ê x ± za ú
1
ë 2 n û
, Statistiek III: univariate data-analyse - schakeljaar
• Waarschuwingen i.v.m. schatters
- Formules voor schatters gelden enkel onder de voorwaarde dat de gegevens bekomen zijn
uit een Enkelvoudige Aselecte Steekproef (EAS, de mate waarin hieraan is voldaan moet
geëvalueerd worden).
- Voor specifieke meer complexe steekproefmodellen bestaan aangepaste formules (o.a.
wegingen).
- Voor “gemakkelijkheidshalve” of ad hoc steekproeven met een vertekening (bias) van
onbekende omvang is er geen methode voor correcte inferentie.
- Het gemiddelde is niet robuust voor uitschieters…
- Bij kleine steekproeven worden betrouwbaarheidsintervallen wellicht te klein geschat.
- σ moet gekend zijn…
3. Significantietoetsen
3.1. Significantietoets in 4 stappen
1. Formuleer de nul- en de alternatieve hypothesen.
2. Bepaal de waarde van de toetsingsgrootheid.
3. Bepaal de overschrijdingskans p voor de data. (theoretisch vs. resampling)
4. Formuleer de conclusie in APA.
Voorbeeld: Klassieke aanpak
• Experiment met 40 patiënten
- 20 nieuw medicijn: (minstens) 15 genezen Vraag: ‘Kan dit resultaat berusten op toeval?’
- 20 placebo: 10 genezen
• Kansrekenen
Schatter van fractie successen in de placebo-groep :
# successen in steekproef X 10
= p̂ = = = = 0.50 = Binomiaalverdeling B(20,.50)
steekproefgrootte n 20
→ Nulhypothese: 50% kans op succes/overlening
P éë X ³ 15ùû = P éë X = 15ùû + P éë X = 16ùû + ...+ P éë X = 20ùû
= .01479 +.00462 + .00109 + .00018 + .00002 + 0
= .02069
→ .02 < .05 -> de kans dat dit resultaat zou berusten op toeval is klein.
• Benadering met normaalverdeling
= ± Zelfde resultaat, zelfde besluit
2
Inleiding
1. Inductieve technieken
Vraag: ‘In welke mate is dit
een goede weergave van de
werkelijkheid?’ ‘Valt er een
verschil waar te nemen?’
Vraag: ‘Hoe groot mag het
verschil zijn?’
2. Betrouwbaarheidsinterval
• 95% betrouwbaarheidsinterval
- Een omgeving rondom het resultaat van 1 replicatie zodat in 95% van de replicaties een
interval wordt gevonden dat de echte populatiewaarde van de onderzochte variabele (het
resultaat op populatie niveau) bevat.
- Interval definiëren rond het populatiegemiddelde.
• Gedrag van de betrouwbaarheid
- Klein BI impliceert een hoge betrouwbaarheid en dus een kleine foutenmarge
- Grote steekproef <-> kostprijs, tijd, organisatie…
- Lager betrouwbaarheidsniveau (99%, 95%, 90%...) <-> risico: exploratief onderzoek
- Kleinere σ <-> meetprocedures, design, homogene groepen
é s ù
BI voor m = ê x ± za ú
1
ë 2 n û
, Statistiek III: univariate data-analyse - schakeljaar
• Waarschuwingen i.v.m. schatters
- Formules voor schatters gelden enkel onder de voorwaarde dat de gegevens bekomen zijn
uit een Enkelvoudige Aselecte Steekproef (EAS, de mate waarin hieraan is voldaan moet
geëvalueerd worden).
- Voor specifieke meer complexe steekproefmodellen bestaan aangepaste formules (o.a.
wegingen).
- Voor “gemakkelijkheidshalve” of ad hoc steekproeven met een vertekening (bias) van
onbekende omvang is er geen methode voor correcte inferentie.
- Het gemiddelde is niet robuust voor uitschieters…
- Bij kleine steekproeven worden betrouwbaarheidsintervallen wellicht te klein geschat.
- σ moet gekend zijn…
3. Significantietoetsen
3.1. Significantietoets in 4 stappen
1. Formuleer de nul- en de alternatieve hypothesen.
2. Bepaal de waarde van de toetsingsgrootheid.
3. Bepaal de overschrijdingskans p voor de data. (theoretisch vs. resampling)
4. Formuleer de conclusie in APA.
Voorbeeld: Klassieke aanpak
• Experiment met 40 patiënten
- 20 nieuw medicijn: (minstens) 15 genezen Vraag: ‘Kan dit resultaat berusten op toeval?’
- 20 placebo: 10 genezen
• Kansrekenen
Schatter van fractie successen in de placebo-groep :
# successen in steekproef X 10
= p̂ = = = = 0.50 = Binomiaalverdeling B(20,.50)
steekproefgrootte n 20
→ Nulhypothese: 50% kans op succes/overlening
P éë X ³ 15ùû = P éë X = 15ùû + P éë X = 16ùû + ...+ P éë X = 20ùû
= .01479 +.00462 + .00109 + .00018 + .00002 + 0
= .02069
→ .02 < .05 -> de kans dat dit resultaat zou berusten op toeval is klein.
• Benadering met normaalverdeling
= ± Zelfde resultaat, zelfde besluit
2