Statistiek 3BLC
Variantieanalyse
Vergelijken van resultaten om de precisie na te gaan. Bv. twee analysemethodes met elkaar
vergelijken of de accuraatheid van twee laboranten te bepalen.
Binnenvariantie:
Om de gemiddelde variatie tussen de verschillende steekproeven te achterhalen.
Dit is de spreiding tov. Het steekproefgemiddelde
Tussenvariantie:
Maat voor de spreiding van de steekproef gemiddelde tov. het gemiddelde.
Als de steekproeven van dezelfde populatie afkomstig zijn zal de spreiding minimaal zijn.
Als de tussenvariantie groter is dan de binnenvariantie komen de steekproeven uit
verschillende populaties.
! De relatieve grootte van de tussen variatie ten opzichte van de binnen variatie is een maat
voor hoe waarschijnlijk het is dat de verschillende steekproeven uit dezelfde populatie
komen hoe groter de houding hoe kleiner de waarschijnlijkheid!
ANOVA
Iets zeggen over de gemiddelden van de verschillende populaties.
Wat is de oorzaak van de fout?
- Toeval of een analyse fout.
! zegt niks over hoe goed de resultaten zijn. Of dat één methode beter is dan een andere.!
H0: het verschil in de meetresultaten is te wijten aan puur toeval.
2
St
F= 2
Sb
F< F 0,95 →nulhypothese aanvaarden.
F> F 0,95 → nulhypothse verwerpen, er kan met 95% zekerheid gezegd worden dat het verschil
statistisch significant is en te wijten is aan een analyse fout.
Excel
Gegevens-> gegevensanalyse-> unifactoriële variantieanalyse.
Resultaat:
, Uitschieters
Een waarde opsporen dat niet in de ijklijn lijkt te passen, deze data ligt meestal relatief ver
verwijdert van de rest.
Uitschieters hebben een grotere invloed op het gemiddelde dan op de mediaan.
Enkel bij datasets dat normaalverdeeld zijn
Wat is de oorzaak van de uirschieter?
- Notatie fout
- Staal heeft niet dezelfde behandeling overlopen als de andere
- Toevalige fout
- Fout aan de methode of apparatuur
Als de oorzaak onbekend is, zal dit meetpunt in de meeste gevallen verwijders worden van
de dataset.
Verdachte data’s kunnen via de Dixon-toets of via de Grubb’s test geïdentificeerd worden.
Toets van Dixon
De Q-toets, waarbij de relatieve afwijking vergeleken wordt t.o.v. de grenswaarden. Om de
waarschijnlijkheid te bepalen dat een meetwaarde één uitschieter is. Alle berekeningen
moeten analoog gebeuren en mag éénmaal per data set toegepast worden. Geschikt voor
datasets tot n=40.
De relatieve afwijking:
H0: Geen uitschieters.
Relatieve afwijking < grenswaarden (zie tabel)-> nulhypothse aanwaard.
Relatieve afwijking > grenswaarden (zie tabel)-> nulhypothse verworpen.
!De grenswaarde is afhankelijk van de betrouwbaarheid, 95% of 99%!
Variantieanalyse
Vergelijken van resultaten om de precisie na te gaan. Bv. twee analysemethodes met elkaar
vergelijken of de accuraatheid van twee laboranten te bepalen.
Binnenvariantie:
Om de gemiddelde variatie tussen de verschillende steekproeven te achterhalen.
Dit is de spreiding tov. Het steekproefgemiddelde
Tussenvariantie:
Maat voor de spreiding van de steekproef gemiddelde tov. het gemiddelde.
Als de steekproeven van dezelfde populatie afkomstig zijn zal de spreiding minimaal zijn.
Als de tussenvariantie groter is dan de binnenvariantie komen de steekproeven uit
verschillende populaties.
! De relatieve grootte van de tussen variatie ten opzichte van de binnen variatie is een maat
voor hoe waarschijnlijk het is dat de verschillende steekproeven uit dezelfde populatie
komen hoe groter de houding hoe kleiner de waarschijnlijkheid!
ANOVA
Iets zeggen over de gemiddelden van de verschillende populaties.
Wat is de oorzaak van de fout?
- Toeval of een analyse fout.
! zegt niks over hoe goed de resultaten zijn. Of dat één methode beter is dan een andere.!
H0: het verschil in de meetresultaten is te wijten aan puur toeval.
2
St
F= 2
Sb
F< F 0,95 →nulhypothese aanvaarden.
F> F 0,95 → nulhypothse verwerpen, er kan met 95% zekerheid gezegd worden dat het verschil
statistisch significant is en te wijten is aan een analyse fout.
Excel
Gegevens-> gegevensanalyse-> unifactoriële variantieanalyse.
Resultaat:
, Uitschieters
Een waarde opsporen dat niet in de ijklijn lijkt te passen, deze data ligt meestal relatief ver
verwijdert van de rest.
Uitschieters hebben een grotere invloed op het gemiddelde dan op de mediaan.
Enkel bij datasets dat normaalverdeeld zijn
Wat is de oorzaak van de uirschieter?
- Notatie fout
- Staal heeft niet dezelfde behandeling overlopen als de andere
- Toevalige fout
- Fout aan de methode of apparatuur
Als de oorzaak onbekend is, zal dit meetpunt in de meeste gevallen verwijders worden van
de dataset.
Verdachte data’s kunnen via de Dixon-toets of via de Grubb’s test geïdentificeerd worden.
Toets van Dixon
De Q-toets, waarbij de relatieve afwijking vergeleken wordt t.o.v. de grenswaarden. Om de
waarschijnlijkheid te bepalen dat een meetwaarde één uitschieter is. Alle berekeningen
moeten analoog gebeuren en mag éénmaal per data set toegepast worden. Geschikt voor
datasets tot n=40.
De relatieve afwijking:
H0: Geen uitschieters.
Relatieve afwijking < grenswaarden (zie tabel)-> nulhypothse aanwaard.
Relatieve afwijking > grenswaarden (zie tabel)-> nulhypothse verworpen.
!De grenswaarde is afhankelijk van de betrouwbaarheid, 95% of 99%!