HC1 - Herhaling & t-toetsen
Herhaling
odds < 1 = geen beschermend effect
odds > 1 = beschermend effect
Onderzoeksdesigns Frequentiematen en effectmaten
- Dichotoom vs continu
- OR, RR, IDR, NNT, APB, APT
- Welke maat gebruik je wanneer?
Vertekening → gevonden associatie is niet gelijk aan werkelijke associatie
- Selectie - selectieprobleem: steekproef representeert doelpopulatie niet
- Differentiële selectie → kans om in onderzoekspopulatie terecht te komen is niet voor
alle groepen gelijk (associatie in onderzoekspopulatie ≠ associatie in doelpopulatie)
- Non-differentiële selectie → selectiekans is niet voor iedereen gelijk, maar associatie in
onderzoekspopulatie = associatie in doelpopulatie
- Misclassificatie - meetprobleem
- Differentiële misclassificatie → meetfout verschilt per groep
- Non-differentiële misclassificatie → meetfout voor iedereen in studie gelijk
Betrouwbaarheid (herhaalbaarheid) → als ik onderzoek nog een keer doe op dezelfde manier, krijg je
dan dezelfde resultaten?
Validiteit (correctheid) → meet ik wel wat ik wil meten?
Confounding → zowel verband met determinant als uitkomstmaat
Effectmodificatie → relatie tussen determinant en uitkomstmaat is voor
verschillende groepen anders (bv kans hartaanval anders bij mannen en vrouwen)
Samenvattende maten
- Proportie / gemiddelde / mediaan
- Standaardafwijking / IQR
De basis
- Rekenregels (complement-, som-, productregels)
- Stelling van Bayes i.r.t. sensitiviteit, specificiteit en diagnostische waarde
,Kansmodellen
- Binomiale, Poisson, Normale en Lognormale verdeling
- Standaardiseren
Standaardafwijking van gemiddelde is standaardafwijking delen door wortel van steekproeven
Toetsen
- Structuur van een toets: H0 en Ha, toetsingsgrootheid, betrouwbaarheid
- Toetsingsgrootheid = vertaalslag
- Toets op proporties / gemiddelden
- Kritische kanttekeningen bij toetsing
Betrouwbaarheidsintervallen
- Veel aandacht voor betekenis en interpretatie
- t- en z- verdeling
T-toetsen
- Als uitkomsten kwantitatief zijn
- Familie van toetsen waarbij gemiddelde van steekproef (x) model staat voor
populatieparameter (μ)
- Standaardafwijking (sd) staat model voor populatieparameter (σ)
- Gemiddelden moeten kunnen worden beschouwd als trekking uit normale verdeling
Belangrijke conceptuele gedachte
- Waarden x en sd zijn onafhankelijk van elkaar → als je gemiddelde berekent zegt dat nog niks
over de waarde van de standaardafwijking
- Door de dubbele onzekerheid gebruik je t-verdeling (aantal vrijheidsgraden bepaalt in
hoeverre t-verdeling lijkt op z-verdeling)
- Hoe meer waarnemingen → hoe meer het lijkt op z-verdeling
Bij 1-steekproef t-toets (one sample t-test)
- Vergelijk uitkomst uit steekproef met normwaarde (zet je onder nulhypothese)
- Toetst of steekproef getrokken kan zijn uit populatie met steekproef onder nulhypothese
- Het onderzoek betreft (bijna altijd) een transversaal cohort
- Centrale vraag → “Hoe verhoudt de situatie zich in vergelijking tot de norm?”
, - Voorwaarden
- Gegevens zijn onafhankelijk → je moet binnen dataset geen groepjes kunnen
herkennen (terug te vinden in logboek / methodesectie artikel)
- Schatting voor populatieverwachting (μ) mag worden beschouwd als trekking uit
Normale verdeling → bepalen door bekijken Q-Q-plot / histogram op oog
bekijken (niet met toets)
- Berekenen:
- Eén- of tweezijdig hypothese toetsen?
- Toetsingsgrootheid (TG):
- H0 klopt → TG volgt een t-verdeling
- T verdeling heeft (n - 1 per onderzoeksgroep) vrijheidsgraden
- Overschrijdingskans berekenen
Met dezelfde info uit steekproef kan B(μ) worden geconstrueerd:
-
- (opzoeken in tabel / excel)
Gepaarde t-toets (matched pairs / paired samples t-test)
- Studieontwerp: vergelijk twee waarnemingen met elkaar → prospectieve studie
- Voorwaarden
- Eenheden zijn onderling afhankelijk → dus niet gegroepeerd
- Waarnemingen steeds in paren (afhankelijk) → steeds 2 waarnemingen aan 1 eenheid
- Het gemiddelde van verschil metingen is Normaal verdeeld (centrale limiet stelling)
- Verschil is onafhankelijk van meetwaarde op t=0
- Berekenen:
- Verschil bepalen tussen beide metingen (d = xt=1 - xt=0)
- Door gepaarde waarnemingen te reduceren tot 1 verschil, is rest hetzelfde als
bij 1-steekproef t-toets
- Alleen andere symbolen:
- H0 = 0 (→ meestal zo, maar hoeft niet per se)
- Toetsingsgrootheid berekenen → Gevonden verschil tussen gemiddelde verschillen en
verwachting onder H0 (meestal ‘0’) gerelateerd aan de variabiliteit van het gemiddelde van de verschilscores
- Overschrijdingskans bepalen
Met dezelfde info uit steekproef kan B(Δ) worden geconstrueerd:
-
, 2-steekproef t-toets (independent samples test)
- Vergelijk twee groepen met continue uitkomst met elkaar → transversaal cohort /
patiënt-controleonderzoek / prospectief cohort/experimenteel onderzoek
- Voorwaarden
- Binnen de twee groepen zijn de waarnemingen onderling onafhankelijk bemonsterd
- Gemiddelde van beide groepen moet kunnen worden beschouwd als Normaal
verdeelde kansvariabele (CLS)
- Voor de ‘pooled variance t-test’ → beide groepen zijn getrokken uit populatie met
identieke spreiding (er bestaat een oplossing als dit niet het geval is)
- Bepaal varianties en vergelijk → exact dezelfde spreiding = toets voor
homogene varianties, anders toets voor heterogene varianties (zwakker)
- Bij 2-steekproef t-toets op verschilscores, zijn de verschilscores onafhankelijk van
meetwaarde op t=0
- Verschilscores uitzetten op y-as tegen variabele op x-as voor beide groepen los
- Het klopt tenzij er een duidelijk verschil is tussen beide lijnen
- Berekenen [bij verschil]:
- d = xt=1 - xt=0 → d-scores van beide groepen op 1 as zetten
- H0 en Ha opstellen
- Aannames checkenµ
- Toetsingsgrootheid (TG)
- Verschil t-test voor homogene en heterogene varianties:
- Aantal vrijheidsgraden wordt anders bepaald:
lkl;k
getal wordt afgerond naar beneden
- Overschrijdingskans bepalen
Met dezelfde info uit steekproef kan B(Δ) worden geconstrueerd:
-
Soorten onderzoeken
Case-control studie
- 1 groep cases, 1 groep controles (enige variabele moet de uitkomst zijn, verder gelijke groepen)
- Selecteren op uitkomst
- Vaak gebruikt voor zeldzame aandoeningen
- +: doordat je selecteert op uitkomst heb je sowieso proefpersonen
-: recall bias
Herhaling
odds < 1 = geen beschermend effect
odds > 1 = beschermend effect
Onderzoeksdesigns Frequentiematen en effectmaten
- Dichotoom vs continu
- OR, RR, IDR, NNT, APB, APT
- Welke maat gebruik je wanneer?
Vertekening → gevonden associatie is niet gelijk aan werkelijke associatie
- Selectie - selectieprobleem: steekproef representeert doelpopulatie niet
- Differentiële selectie → kans om in onderzoekspopulatie terecht te komen is niet voor
alle groepen gelijk (associatie in onderzoekspopulatie ≠ associatie in doelpopulatie)
- Non-differentiële selectie → selectiekans is niet voor iedereen gelijk, maar associatie in
onderzoekspopulatie = associatie in doelpopulatie
- Misclassificatie - meetprobleem
- Differentiële misclassificatie → meetfout verschilt per groep
- Non-differentiële misclassificatie → meetfout voor iedereen in studie gelijk
Betrouwbaarheid (herhaalbaarheid) → als ik onderzoek nog een keer doe op dezelfde manier, krijg je
dan dezelfde resultaten?
Validiteit (correctheid) → meet ik wel wat ik wil meten?
Confounding → zowel verband met determinant als uitkomstmaat
Effectmodificatie → relatie tussen determinant en uitkomstmaat is voor
verschillende groepen anders (bv kans hartaanval anders bij mannen en vrouwen)
Samenvattende maten
- Proportie / gemiddelde / mediaan
- Standaardafwijking / IQR
De basis
- Rekenregels (complement-, som-, productregels)
- Stelling van Bayes i.r.t. sensitiviteit, specificiteit en diagnostische waarde
,Kansmodellen
- Binomiale, Poisson, Normale en Lognormale verdeling
- Standaardiseren
Standaardafwijking van gemiddelde is standaardafwijking delen door wortel van steekproeven
Toetsen
- Structuur van een toets: H0 en Ha, toetsingsgrootheid, betrouwbaarheid
- Toetsingsgrootheid = vertaalslag
- Toets op proporties / gemiddelden
- Kritische kanttekeningen bij toetsing
Betrouwbaarheidsintervallen
- Veel aandacht voor betekenis en interpretatie
- t- en z- verdeling
T-toetsen
- Als uitkomsten kwantitatief zijn
- Familie van toetsen waarbij gemiddelde van steekproef (x) model staat voor
populatieparameter (μ)
- Standaardafwijking (sd) staat model voor populatieparameter (σ)
- Gemiddelden moeten kunnen worden beschouwd als trekking uit normale verdeling
Belangrijke conceptuele gedachte
- Waarden x en sd zijn onafhankelijk van elkaar → als je gemiddelde berekent zegt dat nog niks
over de waarde van de standaardafwijking
- Door de dubbele onzekerheid gebruik je t-verdeling (aantal vrijheidsgraden bepaalt in
hoeverre t-verdeling lijkt op z-verdeling)
- Hoe meer waarnemingen → hoe meer het lijkt op z-verdeling
Bij 1-steekproef t-toets (one sample t-test)
- Vergelijk uitkomst uit steekproef met normwaarde (zet je onder nulhypothese)
- Toetst of steekproef getrokken kan zijn uit populatie met steekproef onder nulhypothese
- Het onderzoek betreft (bijna altijd) een transversaal cohort
- Centrale vraag → “Hoe verhoudt de situatie zich in vergelijking tot de norm?”
, - Voorwaarden
- Gegevens zijn onafhankelijk → je moet binnen dataset geen groepjes kunnen
herkennen (terug te vinden in logboek / methodesectie artikel)
- Schatting voor populatieverwachting (μ) mag worden beschouwd als trekking uit
Normale verdeling → bepalen door bekijken Q-Q-plot / histogram op oog
bekijken (niet met toets)
- Berekenen:
- Eén- of tweezijdig hypothese toetsen?
- Toetsingsgrootheid (TG):
- H0 klopt → TG volgt een t-verdeling
- T verdeling heeft (n - 1 per onderzoeksgroep) vrijheidsgraden
- Overschrijdingskans berekenen
Met dezelfde info uit steekproef kan B(μ) worden geconstrueerd:
-
- (opzoeken in tabel / excel)
Gepaarde t-toets (matched pairs / paired samples t-test)
- Studieontwerp: vergelijk twee waarnemingen met elkaar → prospectieve studie
- Voorwaarden
- Eenheden zijn onderling afhankelijk → dus niet gegroepeerd
- Waarnemingen steeds in paren (afhankelijk) → steeds 2 waarnemingen aan 1 eenheid
- Het gemiddelde van verschil metingen is Normaal verdeeld (centrale limiet stelling)
- Verschil is onafhankelijk van meetwaarde op t=0
- Berekenen:
- Verschil bepalen tussen beide metingen (d = xt=1 - xt=0)
- Door gepaarde waarnemingen te reduceren tot 1 verschil, is rest hetzelfde als
bij 1-steekproef t-toets
- Alleen andere symbolen:
- H0 = 0 (→ meestal zo, maar hoeft niet per se)
- Toetsingsgrootheid berekenen → Gevonden verschil tussen gemiddelde verschillen en
verwachting onder H0 (meestal ‘0’) gerelateerd aan de variabiliteit van het gemiddelde van de verschilscores
- Overschrijdingskans bepalen
Met dezelfde info uit steekproef kan B(Δ) worden geconstrueerd:
-
, 2-steekproef t-toets (independent samples test)
- Vergelijk twee groepen met continue uitkomst met elkaar → transversaal cohort /
patiënt-controleonderzoek / prospectief cohort/experimenteel onderzoek
- Voorwaarden
- Binnen de twee groepen zijn de waarnemingen onderling onafhankelijk bemonsterd
- Gemiddelde van beide groepen moet kunnen worden beschouwd als Normaal
verdeelde kansvariabele (CLS)
- Voor de ‘pooled variance t-test’ → beide groepen zijn getrokken uit populatie met
identieke spreiding (er bestaat een oplossing als dit niet het geval is)
- Bepaal varianties en vergelijk → exact dezelfde spreiding = toets voor
homogene varianties, anders toets voor heterogene varianties (zwakker)
- Bij 2-steekproef t-toets op verschilscores, zijn de verschilscores onafhankelijk van
meetwaarde op t=0
- Verschilscores uitzetten op y-as tegen variabele op x-as voor beide groepen los
- Het klopt tenzij er een duidelijk verschil is tussen beide lijnen
- Berekenen [bij verschil]:
- d = xt=1 - xt=0 → d-scores van beide groepen op 1 as zetten
- H0 en Ha opstellen
- Aannames checkenµ
- Toetsingsgrootheid (TG)
- Verschil t-test voor homogene en heterogene varianties:
- Aantal vrijheidsgraden wordt anders bepaald:
lkl;k
getal wordt afgerond naar beneden
- Overschrijdingskans bepalen
Met dezelfde info uit steekproef kan B(Δ) worden geconstrueerd:
-
Soorten onderzoeken
Case-control studie
- 1 groep cases, 1 groep controles (enige variabele moet de uitkomst zijn, verder gelijke groepen)
- Selecteren op uitkomst
- Vaak gebruikt voor zeldzame aandoeningen
- +: doordat je selecteert op uitkomst heb je sowieso proefpersonen
-: recall bias