Alle methodes van voorgaande hoofdstukken = parametrische methodes
➔ de geldigheid v/d interferentie is enkel correct als er voldaan wordt aan parametrische veronderstellingen
Deze veronderstellingen = distributionele veronderstellingen
➔ vb.: de observaties zijn normaal verdeeld, de lineariteit v/h regressiemodel,…
Wanneer we over statistische besluitvorming spreken, is bijvoorbeeld de p-waarde van een statistische test, of de
probabilistische interpretatie van een betrouwbaarheidsinterval enkel correct interpreteerbaar onder bepaalde
veronderstellingen:
• De p-waarde: de kans dat de tesstatistiek T onder de nulhypothese meer extreem is dan de waarde t als H0
waar is
➔ kans wordt berekend op basis van de nul distributie van T
➔ Wordt bij parametrische testen afgeleid dor de steunen op veronderstellingen over de verdelingen van
observaties
Als er niet aan deze veronderstellingen voldaan wordt, dan is de p-waarde fout ➔ En de conclusies die
hierop gebaseerd waren waarschijnlijk ook.
• Betrouwbaarheidsintervallen: de berekening van een betrouwbaarheidsinterval steunt op distributionele
veronderstellingen
Als er niet aan deze veronderstellingen voldaan wordt, dan kunnen de intervallen een foutieve interpretatie
hebben
Asymptotische testen zijn moeilijker te plaatsen, we beschouwen ze als niet parametrisch
➔men zou kunnen stellen dat bv. een t-test asymptotisch niet-parametrisch is, omdat bij erg grote
steekproefgroottes de distributionele veronderstelling van normaliteit niet meer belangrijk is.
Voordelen parametrische methoden:
➔ Efficiënt en flexibel wanneer er aan de voorwaarden voldaan is
➢ Efficiënt; bij een constante steekproefgrootte hebben de testen een grote power en zijn de
betrouwbaarheidsintervallen smakker
➢ Flexibel: het is eenvoudig om de methoden in te zetten voor experimenten met meer complexe designs
Als er niet voldaan is aan de veronderstellingen van de parameterische methoden kunnen we voor bepaalde designs
overschakelen naar niet-parametrische methoden die in deze situatie nog steeds formeel geldig zijn.
Vergelijken van 2 groepen
Voorbeeld cholesteorol
Meten van cholestorolconcentratie i/h bloed van 10 mensen
➔ groep 1: 5 patienten die 2 dagen geleden een hartaanval hadden
➔ groep 2/ 5 patienten die gezond zijn
Onderzoeksvraag: is de cholestorolconcentratie verschillend bij hartpatiënten en gezonde personen?
Data:
, De boxplots en qqplots geven aan dat er mogelijks outliers in de data voorkomen. Het is moeilijk om inzicht te
krijgen in de verdeling van de data gezien er maar 5 observaties zijn per groep.
Permutatietesten
Hypotheses: 𝐻0 : 𝜇1 = 𝜇2 versus 𝐻1 : 𝜇1 ≠ 𝜇2
Met 𝜇1 en 𝜇2 de gemiddelde uitkomsten van respectievelijk groep 1 en groep 2
➔ de hypotheses zijn dus in termen van gemiddelden
Voorwaarden voor een 2-sample t-test uit te mogen voeren:
• Normaliteit van de uitkomsten in de twee behandelingsgroepen Te weinig individuen in de groepen
• Gelijkheid van varianties om deze voorwaarden na te gaan