STATISTIEK 2
HC1
Onafhankelijke t-toets
Toetst of de gemiddelde van een variabele in twee onafhankelijke steekproeven zodanig van elkaar
verschillen dat ze redelijkerwijs niet uit twee populaties afkomstig zijn die hetzelfde gemiddelde
hebben.
Stap 1. Vooronderstelingen t-toets
- Meetniveau:
o Afhankelijke variabele: continue (ratio/interval)
o Onafhankelijke variabele: dichotoom
- Aselecte steekproef
o Geen samplingbias
o Twee onafhankelijke steekproeven
- Data is normaal verdeeld
o Geen skewness of kurtosis
o Controleren a.d.h.v. histogram met normaalcurve of kengetallen
- Steekproef niet te klein
Stap 2. Hypothese t-toets
- H0: Er is geen verschil tussen twee groepen -> 1 = 2
- H1: Er is een verschil tussen twee groepen -> 1 2
Stap 3. Berekenen toetsgrootheid
Verschil tussen 2 steekproefuitkomsten (𝑥̅̅̅1 − ̅̅̅)
𝑥2 gaan we uitdrukken in toetsgrootheid t. Deze
toetsgrootheid volgt een bekende kansverdeling wanneer H0 waar is (t-verdeling). Er kan zo worden
vastgesteld hoe groot de kans is op het gevonden steekproefverschil als H0 in de populatie waar is.
Stap 4. Conclusie over H0
Soms wordt er van tevoren een besliscriterium, kansdrempel, gesteld en op basis daarvan nemen we
een besluit:
- Als p < dan wordt H0 verworpen -> significant effect
- Als t > Tk dan wordt H0 verworpen -> significant effect
Stap 5. Conclusie rapporteren
- Gemiddelde van groep 1 (M=…, SD=…) is (niet) significant verschillend van gemiddelde
van groep 2 (M=…, SD=…), t(df)=…, p</>.05.
Onderzoeken verdeling op basis van kengetallen
- Op basis van steekproefgegevens
- Bij perfect normale verdeling van data:
o Gemiddelde = mediaan = modus
o 99.7% van de waarnemingen binnen 3 SD’s van gemiddelde
▪ Skewness (scheefheid) = 0
▪ Kurtosis (platheid) = 0
,Correlatie
- Pearson correlatiecoëfficiënt
- Spearman’s rho
Pearsons correlatie
- Bij 2 variabelen van minimaal interval meetniveau
- Lineair verband (met spreidingsdiagram te controleren)
o -1 = sterk negatief verband
o 0 = geen verband
o 1 = sterk positief verband
Spearman’s rho
- Niet-lineair verband
- Ordinaal meetniveau
- Kleine steekproefgrootte (10<n<20)
- Wel sprake van stijgend of dalend verband
Opstellen hypotheses
Hypothese -> uitspraak over de populatie, vaak een voorspelling van een parameter in de populatie
- H0: “Er is geen effect” (alleen toeval speelt een rol) (niet significant)
- H1: “Er is een effect” (verschil in resultaat tussen groepen 0) (significant)
H0 proberen we te verwerpen met onze statistische toets. Als de H0 wordt verworpen wordt de
alternatieve H1 aangenomen.
Hypothesen gaan over de populatie en worden in symbolen geschreven; voor gemiddelde en
voor correlaties
Eenzijdige vs. tweezijdige hypothesen
Tweezijdig
- H0: 1 = 2
- H1: 1 2
Eenzijdig
- H0: 1 2
- H1: 1 < 2
Eenzijdige hypothese wordt gebruikt wanneer er duidelijk in de theorie/literatuur/andere resultaten
wordt aangegeven dat er al een bepaalde verwachting is.
,HC2
Maak altijd eerste spreidingsdiagram
- Checken lineair verband
- Wanneer je geen lineair verband hebt → spearman correlatie, maakt gebruikt van
rangscores
Voorbeeld Spearman vs. Pearson
- Output Spearman:
o Hoe hoger de
correlatiecoëfficiënt, hoe groter
het verband
- Bij het gebruiken van de Pearson correlatie,
zou je een veel lagere correlatiecoëfficiënt
krijgen
Output berekenen correlatie in R
Practicum opdracht 1.2: onderzoeken van de relatie tussen systolische en diastolische bloeddruk
- Stap 1: spreidingsdiagram maken om verdeling van data te zien
o Is er een lineair verband? Zo ja, dan pearson correlatiecoëfficiënt berekenen
- Stap 2: pearson correlatiecoëfficiënt berekenen
- H1: we verwachten een correlatie hoger dan 0
- H2: we verwachten een correlatie gelijk/lager dan 0
- Correlatie = 0.607
o Niet extreem hoog, maar wel significant
o H0 kan worden verworpen
Conclusie: er is een significatie positieve relatie tussen systolische en diastolische bloeddruk (r = 0.61,
p < 0.001, eenzijdig)
, Opdracht 1.3abc: is er verschil in balansvermogen van mannen en vrouwen?
- Onderzoeken hoe de waardes van de gegevens zijn verdeeld
- Hypothese toetsen: t-toets
o Veronderstellingen t-toets
▪ Meetniveau:
• Afhankelijke variabele: continue (ratio/interval)
• Onafhankelijke variabele: dichotoom
▪ Aselecte steekproef
▪ Data is normaal verdeeld
▪ Steekproef niet te klein
Onderzoeken verdeling
- Op basis van steekproefgegevens
- Door middel van beoordelen:
o Histogram
o Kengetallen
- Waarden van de kengetallen bij perfecte
normaalverdeling:
o Gemiddelde = mediaan = modus
o 99.7% van de waarnemingen ligt
binnen 3 SD’s van gemiddelde
o De skewness/kurtosis wijkt te veel af
als hij groter is dan 1 of kleiner dan -1
Non-parametrische alternatieven voor t-toets
- Gebruiken wanneer…:
o Afhankelijke variabele ordinaal
o Afhankelijke variabele interval/ratio, maar sterke afwijking van normaliteit
o Zeer kleine steekproef
- Toetsen:
o Onafhankelijke t-toets → Mann-Whitney toets
o Gepaarde t-toets → rangtekentoets van Wilcoxon
Verschillende soorten t-toetsen
- Onafhankelijke t-toets → verschil in gemiddelden tussen 2 onafhankelijke groepen
tijdens 1 meting
o De twee groepen hebben gelijke varianties
o De twee groepen hebben ongelijke varianties
- Afhankelijke t-toets → vergelijkingen binnen (proef)personen met twee metingen (paired
samples t-test). Vergelijken van gemiddelden.
- One sample t- toets → vergelijken gemiddelden van groep met een constante
HC1
Onafhankelijke t-toets
Toetst of de gemiddelde van een variabele in twee onafhankelijke steekproeven zodanig van elkaar
verschillen dat ze redelijkerwijs niet uit twee populaties afkomstig zijn die hetzelfde gemiddelde
hebben.
Stap 1. Vooronderstelingen t-toets
- Meetniveau:
o Afhankelijke variabele: continue (ratio/interval)
o Onafhankelijke variabele: dichotoom
- Aselecte steekproef
o Geen samplingbias
o Twee onafhankelijke steekproeven
- Data is normaal verdeeld
o Geen skewness of kurtosis
o Controleren a.d.h.v. histogram met normaalcurve of kengetallen
- Steekproef niet te klein
Stap 2. Hypothese t-toets
- H0: Er is geen verschil tussen twee groepen -> 1 = 2
- H1: Er is een verschil tussen twee groepen -> 1 2
Stap 3. Berekenen toetsgrootheid
Verschil tussen 2 steekproefuitkomsten (𝑥̅̅̅1 − ̅̅̅)
𝑥2 gaan we uitdrukken in toetsgrootheid t. Deze
toetsgrootheid volgt een bekende kansverdeling wanneer H0 waar is (t-verdeling). Er kan zo worden
vastgesteld hoe groot de kans is op het gevonden steekproefverschil als H0 in de populatie waar is.
Stap 4. Conclusie over H0
Soms wordt er van tevoren een besliscriterium, kansdrempel, gesteld en op basis daarvan nemen we
een besluit:
- Als p < dan wordt H0 verworpen -> significant effect
- Als t > Tk dan wordt H0 verworpen -> significant effect
Stap 5. Conclusie rapporteren
- Gemiddelde van groep 1 (M=…, SD=…) is (niet) significant verschillend van gemiddelde
van groep 2 (M=…, SD=…), t(df)=…, p</>.05.
Onderzoeken verdeling op basis van kengetallen
- Op basis van steekproefgegevens
- Bij perfect normale verdeling van data:
o Gemiddelde = mediaan = modus
o 99.7% van de waarnemingen binnen 3 SD’s van gemiddelde
▪ Skewness (scheefheid) = 0
▪ Kurtosis (platheid) = 0
,Correlatie
- Pearson correlatiecoëfficiënt
- Spearman’s rho
Pearsons correlatie
- Bij 2 variabelen van minimaal interval meetniveau
- Lineair verband (met spreidingsdiagram te controleren)
o -1 = sterk negatief verband
o 0 = geen verband
o 1 = sterk positief verband
Spearman’s rho
- Niet-lineair verband
- Ordinaal meetniveau
- Kleine steekproefgrootte (10<n<20)
- Wel sprake van stijgend of dalend verband
Opstellen hypotheses
Hypothese -> uitspraak over de populatie, vaak een voorspelling van een parameter in de populatie
- H0: “Er is geen effect” (alleen toeval speelt een rol) (niet significant)
- H1: “Er is een effect” (verschil in resultaat tussen groepen 0) (significant)
H0 proberen we te verwerpen met onze statistische toets. Als de H0 wordt verworpen wordt de
alternatieve H1 aangenomen.
Hypothesen gaan over de populatie en worden in symbolen geschreven; voor gemiddelde en
voor correlaties
Eenzijdige vs. tweezijdige hypothesen
Tweezijdig
- H0: 1 = 2
- H1: 1 2
Eenzijdig
- H0: 1 2
- H1: 1 < 2
Eenzijdige hypothese wordt gebruikt wanneer er duidelijk in de theorie/literatuur/andere resultaten
wordt aangegeven dat er al een bepaalde verwachting is.
,HC2
Maak altijd eerste spreidingsdiagram
- Checken lineair verband
- Wanneer je geen lineair verband hebt → spearman correlatie, maakt gebruikt van
rangscores
Voorbeeld Spearman vs. Pearson
- Output Spearman:
o Hoe hoger de
correlatiecoëfficiënt, hoe groter
het verband
- Bij het gebruiken van de Pearson correlatie,
zou je een veel lagere correlatiecoëfficiënt
krijgen
Output berekenen correlatie in R
Practicum opdracht 1.2: onderzoeken van de relatie tussen systolische en diastolische bloeddruk
- Stap 1: spreidingsdiagram maken om verdeling van data te zien
o Is er een lineair verband? Zo ja, dan pearson correlatiecoëfficiënt berekenen
- Stap 2: pearson correlatiecoëfficiënt berekenen
- H1: we verwachten een correlatie hoger dan 0
- H2: we verwachten een correlatie gelijk/lager dan 0
- Correlatie = 0.607
o Niet extreem hoog, maar wel significant
o H0 kan worden verworpen
Conclusie: er is een significatie positieve relatie tussen systolische en diastolische bloeddruk (r = 0.61,
p < 0.001, eenzijdig)
, Opdracht 1.3abc: is er verschil in balansvermogen van mannen en vrouwen?
- Onderzoeken hoe de waardes van de gegevens zijn verdeeld
- Hypothese toetsen: t-toets
o Veronderstellingen t-toets
▪ Meetniveau:
• Afhankelijke variabele: continue (ratio/interval)
• Onafhankelijke variabele: dichotoom
▪ Aselecte steekproef
▪ Data is normaal verdeeld
▪ Steekproef niet te klein
Onderzoeken verdeling
- Op basis van steekproefgegevens
- Door middel van beoordelen:
o Histogram
o Kengetallen
- Waarden van de kengetallen bij perfecte
normaalverdeling:
o Gemiddelde = mediaan = modus
o 99.7% van de waarnemingen ligt
binnen 3 SD’s van gemiddelde
o De skewness/kurtosis wijkt te veel af
als hij groter is dan 1 of kleiner dan -1
Non-parametrische alternatieven voor t-toets
- Gebruiken wanneer…:
o Afhankelijke variabele ordinaal
o Afhankelijke variabele interval/ratio, maar sterke afwijking van normaliteit
o Zeer kleine steekproef
- Toetsen:
o Onafhankelijke t-toets → Mann-Whitney toets
o Gepaarde t-toets → rangtekentoets van Wilcoxon
Verschillende soorten t-toetsen
- Onafhankelijke t-toets → verschil in gemiddelden tussen 2 onafhankelijke groepen
tijdens 1 meting
o De twee groepen hebben gelijke varianties
o De twee groepen hebben ongelijke varianties
- Afhankelijke t-toets → vergelijkingen binnen (proef)personen met twee metingen (paired
samples t-test). Vergelijken van gemiddelden.
- One sample t- toets → vergelijken gemiddelden van groep met een constante