Termen
Ratio = getallen, voorbeeld: gewicht, lengte.
Ordinaal = variabele met rangordening, voorbeeld: goud/zilver/brons.
Nominaal = variabele zonder volgorde, voorbeelden: drie verschillende voertypes.
Subcategorie binair = twee mogelijkheden, wel of niet.
Respons variabele = (mogelijke) gevolg. In R formule:
Verklarende variabele = (mogelijke) oorzaak. (Respons ~ Verklarende)
H0: geen significant verschil, onvoldoende reden om te concluderen dat iets is veranderd.
H1: wel significant verschil, voldoende reden om te concluderen dat veranderingen zijn opgetreden.
Respons variabelen
Stap 1 ratio, binair, nominaal of ordinaal
Ratio → Stap 2 Ordinaal of nominaal → Stap 6 binair of aantal → Stap 7
Stap 2 Ratio: normaal of niet normaal verdeeld
Respons variabelen is normaal of niet normaal verdeeld. Je kan bepalen welke het is met de Shapiro-Wilk toets. Geeft de toets
een p-waarde>0.05 dan is het normaal verdeeld. Als de p-waarde<0.05 dan is het niet normaal verdeeld. Als het niet normaal
verdeeld is doe je een log transformatie, herhaal de Shapiro-Wilk toets. Als het dan weer niet normaal verdeeld is beschouw je
het als ordinaal → Stap 6 Als het wel normaal verdeeld is (voor of na log transformatie) → Stap 3
Stap 3 Samenhang (correlatie)
Wel of geen samenhang. Samenhang wil zeggen dat het bij dezelfde onderzoekselementen is.
2 groepen: Wel samenhang → Gepaarde t-toets Geen samenhang → Stap 4
2+ groepen: Wel samenhang → Repeated measures ANOVA Geen samenhang → Stap 5
Stap 4 Onafhankelijke t-toets
2 groepen en geen samenhang betekend Onafhankelijke t-toets. Wel eerst de Bartlett toets uitvoeren om te kijken naar de mate
van spreiding (variantie) tussen de twee groepen.
- P-waarde>0.05 de variantie is gelijk, in R voeg je “var.equal=TRUE” toe aan de t-toets.
- P-waarde<0.05 de variantie niet gelijk, in R voeg je “var.equal-FALSE” toe aan de t-toets.
De t-toets is eenzijdig of tweezijdig:
Eenzijdig: H1: X > Y, “alternative = greater". of H1: X < Y, “alternative = less".
Tweezijdig: H1: X ≠ Y, “alternative two.sided”.
Stap 5 One-way ANOVA, Tukey toets
2+ groepen en geen samenhang betekend One-way ANOVA. Bij een p-waarde<0.05 doe de Tukey toets. Let op er is één
verklarende variabelen bij de One-way ANOVA en deze moet factor zijn.
Stap 6 Ordinaal of nominaal
Wel of geen samenhang. Samenhang wil zeggen dat het bij dezelfde onderzoekselementen is.
2 groepen: Wel samenhang → Wilcoxon Geen samenhang →Mann-Whitney toets
2+ groepen: Wel samenhang → Friedman Geen samenhang →Kruskal Wallis
Extra toelichting
- Voor Mann-Whitney wordt in R ook Wilcoxon gebruikt maar dan voeg je “paired = FALSE” toe.
- Als Kruskal Wallis significant is doe je een Mann-Whitney toets, kijken waar het verschil is.
- Als de Friedman significant is doe je de Wilcoxon om te kijken waar het verschil tussen ligt.
- Let op om de Friedman toets uit te voeren moet de data verticaal staan.
Stap 7 binair of aantal
- Als de respons variabelen binair is doe je de Logistische regressie.
- Als de respons een aantal is maar niet normaal verdeeld is doe je de Poisson regressie.
Chi-kwadraat
Als beide factor zijn dan doe je de Onafhankelijke Chi-kwadraat toets. Er hoeft niet per se sprake te zijn van verklarende
variabele en responsvariabele. De conclusie zegt alleen of er een verband is aangetoond.
Chi-kwadraat op aanpassing heeft één factor en één vast gegeven/verhouding.
Bij Chi-kwadraat wordt de vrijheidsgraden berekend: Df = (het aantal kolommen -1) * (het aantal rijen -1).
A
B
Verklarende variabelen
- Bij 2 of meer nominaal/ordinaal verklarende variabelen doe je de Meervoudige ANOVA.
- Bij een mix van verklarende variabelen (nominaal/ordinaal en ratio) doe je de ANCOVA.
- Als respons ratio is en beide verklarende variabelen ratio of binair zijn voer je een Meervoudige regressie uit.
- Als zowel je verklarende als respons variabelen ratio is doe je de Enkelvoudige (lineaire) regressie.
o Residu (e) is de afstand tussen de lijn en het werkelijke punt. Residu (e) = y – y^
o Y^= beginwaarde (A) + richtingscoëfficiënt (B) * x
o Determinatie coëfficiënt (R^2) is een maat de betrouwbaarheid 0 < R^2 < 1
o Formule is bruikbaar om te schatten als R^2 minstens 0,50 is.
Ratio = getallen, voorbeeld: gewicht, lengte.
Ordinaal = variabele met rangordening, voorbeeld: goud/zilver/brons.
Nominaal = variabele zonder volgorde, voorbeelden: drie verschillende voertypes.
Subcategorie binair = twee mogelijkheden, wel of niet.
Respons variabele = (mogelijke) gevolg. In R formule:
Verklarende variabele = (mogelijke) oorzaak. (Respons ~ Verklarende)
H0: geen significant verschil, onvoldoende reden om te concluderen dat iets is veranderd.
H1: wel significant verschil, voldoende reden om te concluderen dat veranderingen zijn opgetreden.
Respons variabelen
Stap 1 ratio, binair, nominaal of ordinaal
Ratio → Stap 2 Ordinaal of nominaal → Stap 6 binair of aantal → Stap 7
Stap 2 Ratio: normaal of niet normaal verdeeld
Respons variabelen is normaal of niet normaal verdeeld. Je kan bepalen welke het is met de Shapiro-Wilk toets. Geeft de toets
een p-waarde>0.05 dan is het normaal verdeeld. Als de p-waarde<0.05 dan is het niet normaal verdeeld. Als het niet normaal
verdeeld is doe je een log transformatie, herhaal de Shapiro-Wilk toets. Als het dan weer niet normaal verdeeld is beschouw je
het als ordinaal → Stap 6 Als het wel normaal verdeeld is (voor of na log transformatie) → Stap 3
Stap 3 Samenhang (correlatie)
Wel of geen samenhang. Samenhang wil zeggen dat het bij dezelfde onderzoekselementen is.
2 groepen: Wel samenhang → Gepaarde t-toets Geen samenhang → Stap 4
2+ groepen: Wel samenhang → Repeated measures ANOVA Geen samenhang → Stap 5
Stap 4 Onafhankelijke t-toets
2 groepen en geen samenhang betekend Onafhankelijke t-toets. Wel eerst de Bartlett toets uitvoeren om te kijken naar de mate
van spreiding (variantie) tussen de twee groepen.
- P-waarde>0.05 de variantie is gelijk, in R voeg je “var.equal=TRUE” toe aan de t-toets.
- P-waarde<0.05 de variantie niet gelijk, in R voeg je “var.equal-FALSE” toe aan de t-toets.
De t-toets is eenzijdig of tweezijdig:
Eenzijdig: H1: X > Y, “alternative = greater". of H1: X < Y, “alternative = less".
Tweezijdig: H1: X ≠ Y, “alternative two.sided”.
Stap 5 One-way ANOVA, Tukey toets
2+ groepen en geen samenhang betekend One-way ANOVA. Bij een p-waarde<0.05 doe de Tukey toets. Let op er is één
verklarende variabelen bij de One-way ANOVA en deze moet factor zijn.
Stap 6 Ordinaal of nominaal
Wel of geen samenhang. Samenhang wil zeggen dat het bij dezelfde onderzoekselementen is.
2 groepen: Wel samenhang → Wilcoxon Geen samenhang →Mann-Whitney toets
2+ groepen: Wel samenhang → Friedman Geen samenhang →Kruskal Wallis
Extra toelichting
- Voor Mann-Whitney wordt in R ook Wilcoxon gebruikt maar dan voeg je “paired = FALSE” toe.
- Als Kruskal Wallis significant is doe je een Mann-Whitney toets, kijken waar het verschil is.
- Als de Friedman significant is doe je de Wilcoxon om te kijken waar het verschil tussen ligt.
- Let op om de Friedman toets uit te voeren moet de data verticaal staan.
Stap 7 binair of aantal
- Als de respons variabelen binair is doe je de Logistische regressie.
- Als de respons een aantal is maar niet normaal verdeeld is doe je de Poisson regressie.
Chi-kwadraat
Als beide factor zijn dan doe je de Onafhankelijke Chi-kwadraat toets. Er hoeft niet per se sprake te zijn van verklarende
variabele en responsvariabele. De conclusie zegt alleen of er een verband is aangetoond.
Chi-kwadraat op aanpassing heeft één factor en één vast gegeven/verhouding.
Bij Chi-kwadraat wordt de vrijheidsgraden berekend: Df = (het aantal kolommen -1) * (het aantal rijen -1).
A
B
Verklarende variabelen
- Bij 2 of meer nominaal/ordinaal verklarende variabelen doe je de Meervoudige ANOVA.
- Bij een mix van verklarende variabelen (nominaal/ordinaal en ratio) doe je de ANCOVA.
- Als respons ratio is en beide verklarende variabelen ratio of binair zijn voer je een Meervoudige regressie uit.
- Als zowel je verklarende als respons variabelen ratio is doe je de Enkelvoudige (lineaire) regressie.
o Residu (e) is de afstand tussen de lijn en het werkelijke punt. Residu (e) = y – y^
o Y^= beginwaarde (A) + richtingscoëfficiënt (B) * x
o Determinatie coëfficiënt (R^2) is een maat de betrouwbaarheid 0 < R^2 < 1
o Formule is bruikbaar om te schatten als R^2 minstens 0,50 is.