HC 1 Herhaling T-toetsen
Vertekening: de gevonden associatie ≠ de werkelijke
- OR (odds ratio) en RR (relative ratio) meten
•Selectie – selectieprobleem: steekproef representeert de doelpopulatie niet
•Differentiële selectie: kans voor ene groep om in onderzoekspopulatie terecht te komen ≠
kans voor andere groep om in onderzoekspopulatie terecht te komen. Associatie in
onderzoekspopulatie ≠ associatie in doelpopulatie
•Non-differentiële selectie: selectiekans is niet voor iedereen gelijk, maar associatie in
onderzoekspopulatie = associatie in doelpopulatie
•Misclassificatie – meetprobleem
•Differentiële misclassificatie: meetfout verschilt per groep
•Non-differentiële misclassificatie: meetfout is voor iedereen in de studie gelijk
Betrouwbaarheid = Herhaalbaarheid
Validiteit = Correctheid
Meten = Weten
Confounding en effectmodificatie -> Verhelpen door stratificatie
,Sensitiviteit, specificiteit en diagnostische waarde
Sensitiviteit = Ware positieve geeft aan hoe goed een test de goede positieve
aangeeft (ezelsbruggetje: sensatie = positief)
"Hoe goed kan de test zieke personen identificeren?"
Specificiteit = Ware negatieve geeft aan hoe goed een test de goede negatieve
aangeeft (ezelsbruggetje: specifiek = negatief iets moet breed zijn)
"Hoe goed kan de test gezonde personen identificeren?"
Binomiale verdeling
- De verdeling wordt gekarakteriseerd door twee parameters: het aantal
experimenten (n) en de kans op succes bij een enkel experiment (p).
Normale verdeling
- Het wordt vaak gebruikt om continue variabelen te modelleren bij symetrische
verdeling, en het wordt beschreven door twee parameters: het gemiddelde (μ)
en de standaardafwijking (σ).
Lognormale verdeling
- Wordt beschreven door twee parameters: het gemiddelde (μ) en de
standaardafwijking (σ). Vaak bij modellen die asymetrisch normaal verdeeld
zijn.
Standaardiseren
Nulhypothese significantie toets
Structuur van een toets: H0 en Ha, toetsingsgrootheid, betrouwbaarheid
Toetsingsgrootheid = vertaalslag
Toets op properties / gemiddelden
Kritische kanttekeningen bij toetsing
Betrouwbaarheidsinterval
Gezocht: ‘objectieve’ procedure om te bepalen welke populatieverwachting past bij
steekproef
Resultaat heet ‘betrouwbaarheidsinterval’
Precieze interpretatie is lastig:
We kunnen met 95% betrouwbaarheid stellen dat de werkelijke waarde μ (het
populatiegemiddelde) tussen A en B ligt.
Bij herhaling van de procedure zou 95 van de 100 keer de werkelijke waarde μ (het
populatiegemiddelde) in het interval tussen A en B liggen.
Het betrouwbaarheidsinterval [van A tot B] geeft mogelijke waarden voor de
populatiewaarde, passend bij onze data en gebruik makend van 95% nauwkeurigheid.
Berekening is ‘goed te doen’
Vergelijking met statistisch toetsen is mogelijk
, One sample test
- Met dezelfde informatie uit de steekproef kan ook een BI(μ) worden geconstrueerd
- 〖BI〗_(95%) (μ)=x ̅±t_(a=0,05;df=13)×sd/√n=37,10±2,160×0,195∕√14
- 〖BI〗_(95%) (μ)=[36,99;37,21]
- Aan dit interval zie je dat 37 graden ‘past’ bij onze steekproef
Gepaarde t toets
•Met dezelfde informatie uit de steekproef kan ook een BI(Δ) worden geconstrueerd
•〖BI〗_(95%) (Δ)=d ̅±t_(a=0,05;df=20)×〖sd〗_d/√n
•t_(a=0,05;df=20): bij welk aantal standaardafwijkingen in een t-verdeling met 20
vrijheidsgraden geldt een overschrijdingskans van 5%?
•〖BI〗_(95%) (Δ)=d ̅±t_(a=0,05;df=20)×〖sd〗_d/√n=0,14±2,086×0,126∕√21
•〖BI〗_(95%) (Δ)=[0,09;0,18]
•Aan dit interval zie je dat “geen verandering” niet ‘past’ bij onze onderzoeksgegevens (want
de 0 zit er niet tussen)
2 zijdige t toets
•Met dezelfde informatie uit de steekproef kan ook een BI(Δ) worden geconstrueerd
•〖BI〗_(95%) (μ)=(d ̅_T-d ̅_R )±t_(a=0,05;df=24)×√((〖sd〗_T^2)/n_T +(〖sd〗_R^2)/n_R )
•〖BI〗_(95%) (Δ)=(0, 075-0,200)±2,064×0,051
•〖BI〗_(95%) (Δ)=[-0,230;-0,019]
•Aan dit interval zie je dat een verschil in temperatuursverandering van ‘0’ tussen
topsporters en recreanten op basis van dit onderzoek moet worden verworpens
Vertekening: de gevonden associatie ≠ de werkelijke
- OR (odds ratio) en RR (relative ratio) meten
•Selectie – selectieprobleem: steekproef representeert de doelpopulatie niet
•Differentiële selectie: kans voor ene groep om in onderzoekspopulatie terecht te komen ≠
kans voor andere groep om in onderzoekspopulatie terecht te komen. Associatie in
onderzoekspopulatie ≠ associatie in doelpopulatie
•Non-differentiële selectie: selectiekans is niet voor iedereen gelijk, maar associatie in
onderzoekspopulatie = associatie in doelpopulatie
•Misclassificatie – meetprobleem
•Differentiële misclassificatie: meetfout verschilt per groep
•Non-differentiële misclassificatie: meetfout is voor iedereen in de studie gelijk
Betrouwbaarheid = Herhaalbaarheid
Validiteit = Correctheid
Meten = Weten
Confounding en effectmodificatie -> Verhelpen door stratificatie
,Sensitiviteit, specificiteit en diagnostische waarde
Sensitiviteit = Ware positieve geeft aan hoe goed een test de goede positieve
aangeeft (ezelsbruggetje: sensatie = positief)
"Hoe goed kan de test zieke personen identificeren?"
Specificiteit = Ware negatieve geeft aan hoe goed een test de goede negatieve
aangeeft (ezelsbruggetje: specifiek = negatief iets moet breed zijn)
"Hoe goed kan de test gezonde personen identificeren?"
Binomiale verdeling
- De verdeling wordt gekarakteriseerd door twee parameters: het aantal
experimenten (n) en de kans op succes bij een enkel experiment (p).
Normale verdeling
- Het wordt vaak gebruikt om continue variabelen te modelleren bij symetrische
verdeling, en het wordt beschreven door twee parameters: het gemiddelde (μ)
en de standaardafwijking (σ).
Lognormale verdeling
- Wordt beschreven door twee parameters: het gemiddelde (μ) en de
standaardafwijking (σ). Vaak bij modellen die asymetrisch normaal verdeeld
zijn.
Standaardiseren
Nulhypothese significantie toets
Structuur van een toets: H0 en Ha, toetsingsgrootheid, betrouwbaarheid
Toetsingsgrootheid = vertaalslag
Toets op properties / gemiddelden
Kritische kanttekeningen bij toetsing
Betrouwbaarheidsinterval
Gezocht: ‘objectieve’ procedure om te bepalen welke populatieverwachting past bij
steekproef
Resultaat heet ‘betrouwbaarheidsinterval’
Precieze interpretatie is lastig:
We kunnen met 95% betrouwbaarheid stellen dat de werkelijke waarde μ (het
populatiegemiddelde) tussen A en B ligt.
Bij herhaling van de procedure zou 95 van de 100 keer de werkelijke waarde μ (het
populatiegemiddelde) in het interval tussen A en B liggen.
Het betrouwbaarheidsinterval [van A tot B] geeft mogelijke waarden voor de
populatiewaarde, passend bij onze data en gebruik makend van 95% nauwkeurigheid.
Berekening is ‘goed te doen’
Vergelijking met statistisch toetsen is mogelijk
, One sample test
- Met dezelfde informatie uit de steekproef kan ook een BI(μ) worden geconstrueerd
- 〖BI〗_(95%) (μ)=x ̅±t_(a=0,05;df=13)×sd/√n=37,10±2,160×0,195∕√14
- 〖BI〗_(95%) (μ)=[36,99;37,21]
- Aan dit interval zie je dat 37 graden ‘past’ bij onze steekproef
Gepaarde t toets
•Met dezelfde informatie uit de steekproef kan ook een BI(Δ) worden geconstrueerd
•〖BI〗_(95%) (Δ)=d ̅±t_(a=0,05;df=20)×〖sd〗_d/√n
•t_(a=0,05;df=20): bij welk aantal standaardafwijkingen in een t-verdeling met 20
vrijheidsgraden geldt een overschrijdingskans van 5%?
•〖BI〗_(95%) (Δ)=d ̅±t_(a=0,05;df=20)×〖sd〗_d/√n=0,14±2,086×0,126∕√21
•〖BI〗_(95%) (Δ)=[0,09;0,18]
•Aan dit interval zie je dat “geen verandering” niet ‘past’ bij onze onderzoeksgegevens (want
de 0 zit er niet tussen)
2 zijdige t toets
•Met dezelfde informatie uit de steekproef kan ook een BI(Δ) worden geconstrueerd
•〖BI〗_(95%) (μ)=(d ̅_T-d ̅_R )±t_(a=0,05;df=24)×√((〖sd〗_T^2)/n_T +(〖sd〗_R^2)/n_R )
•〖BI〗_(95%) (Δ)=(0, 075-0,200)±2,064×0,051
•〖BI〗_(95%) (Δ)=[-0,230;-0,019]
•Aan dit interval zie je dat een verschil in temperatuursverandering van ‘0’ tussen
topsporters en recreanten op basis van dit onderzoek moet worden verworpens