Inleiding
Overzichtstabel hypothesetesten
Vragen bij keuze hypothesetest
1. Wat is het meetniveau van de variabele?
○ Categorisch/kwalitatief (antwoord categorieën, sluiten elkaar uit) (cijfers heeft geen numerieke betekenis) :
■ Nominaal: geen rangorde toekennen (geslacht, oogkleur, bloedgroep, ja/nee vraag)
■ Ordinaal: wel een rangorde (leeftijdsklasse)
■ Dichotoom: bestaat maar uit 2 anwtoordcategorien (geslacht = man/vrouw)
● Binair: cijfer 0 en 1 gebruiken (bv 0: afwezigheid, 1: aanwezigheid)
○ Numeriek/ kwantitatief: cijfers hebben wel een numerieke betekenis
■ Ratio: hebben een absoluut nulpunt (temperatuur in K)
■ Interval: hebben geen absoluut nulpunt ((temperatuur in °C)
2. Is mijn continue variabele normaal verdeeld (parametrisch) of niet-normaal verdeeld (nietparametrisch)?
○ Discreet: tellingen, tussenliggende waarde zijn niet mogelijk (aantal kinderen in het gezin)
○ Continue: tussenliggende waarden wel mogelijk (lichaamsgewicht)
3. Hoeveel groepen wil ik vergelijken?
4. Indien 2 or meer groepen: zijn mijn groepen gepaard of ongepaard?
Parametrisch vs niet-parametrisch
Parametrisch = z/t-test Niet-parametrisch = wilcoxon test
● Gebeurt op actuele meetwaarden ● Gebaseerd op de rangen
● Voorwaarden: ● Voorwaarden:
○ Continu variabele ○ Continu of categorisch
○ Normaal verdeeld (hangt samen met continu) ○ Willekeurige verdeling
● Gebaseerd op centrale maten (gemiddelde, ● Ongevoelig voor outliers en geschikt voor scheve
standaarddeviatie) die gevoelig zijn voor outliers verdelingen
,Gepaard vs Ongepaard
Gepaard
● Dezelfde personen worden op verschillende momenten gemeten OF vergelijking van twee of meer nauw verbonden
waarnemingen binnen een individu of eenheid (= afhankelijk)
○ Vb. Bloeddrukmeting vóór en na een behandeling bij dezelfde patiënt.
○ Vb. Slaapkwaliteit meten tussen mannen en vrouwen binnen hetzelfde gezin.
Ongepaard
● Twee of meer onafhankelijke groepen worden met elkaar vergeleken.
○ Vb. Bloeddrukmeting tussen behandelde groep en placebo groep
○ Vb. Slaapkwaliteit meten tussen vrouwelijke en mannelijke studenten uit de opleiding geneeskunde
Uitwerking hypothesetest in SPSS
● Exploratieve data-analyse (EDA): 1e analyse om te zien hoe data eruit ziet (boxplot, histogram, …)
○ Doel: normaliteit nagaan → parametrische test of niet-parametrische test?
● Descriptieve statistiek
○ Centrum- en spreidingsmaat rapporteren of gepaste numerieke rapportering
○ Grafische voorstelling
● Inductieve statistiek
○ Onderzoeksvragen formuleren in een nul- of alternatieve hypothese
○ Nulhypothese testen, voldoende bewijsmateriaal hiertegen?
○ Voldoende tegenbewijs dan verwerpen
○ Niet voldoende tegenbewijs dan niet verwerpen
● Manuele uitwerking in de syntax
○ Logboek bijhouden van al onze acties die we doen
○ Gebruiken om zaken manueel uit te werken
○ Zaken berekenen
● Conclusie
○ Rapporteren
Exploratieve data-analyse
Nagaan normaliteit in SPSS:
● Histogram
● Boxplot
● Q-Q plot!
● Shapiro-Wilk test → normaliteitstest
→ via “Explore”(SPSS)
,Histogram – Boxplot – Q-Q plot voor links, normaal en rechts
Boxplot
● In relatie tot five number summary: min - Q1 (P25) - Q2 (P50) - Q3 (P75) - max
● Blauwe box
○ Vanboven = Q3
○ Vanonder = Q1
○ Box = interkwartielafstand
○ Zwarte lijn = Q2
○ Whiskers = min en max
○ Cirkeltjes = outliers (waarde die meer dan anderhalve keer de interkwartielafstand (IKA) gelegen is van Q1 of
Q3)
○ Sterretje = meer extreme waarde (waarde die meer dan drie keer de interkwartielafstand (IKA) gelegen is van
Q1 of Q3)
Q-Q plot
● = quantile-quantile plot
● Percentielen = kwantielen die bij bepaald percentage horen
○ Kwartielen = decimale waarde
○ P = 95 = 0.95 kwantiel
● = Grafische voorstelling waarbij de kwantielen van 2 verdelingen tegen elkaar worden uitgezet
→ als de beide uit dezelfde komen moeten de punten op de rechte liggen
→ op y-as: wat het zou moeten zijn als data normaal verdeeld is
● Normaal: volgt mooi de lijn (moet niet perfect zijn)
● Links en rechts: punten wijken af van de lijn
, Q-Q plot
Voorbeelden:
Shapiro-Wilk test → normaliteitstest
● Wij doen die bij een significantieniveau van 5% → α = 0.05
● Rechts: significant → p < 0.05
● Normaal: niet significant → p ≥ 0.05
● Links: significant → p < 0.05
● Nulhypothese: data volgt een normale verdeling
● Alternatieve hypothese: het volgt geen normale verdeling
● Significant resultaat: nul verwerpen en alternatieve accepteren = niet-normale verdeling