INTRODUCTIE
De gedragswetenschappen => grotendeels empirisch.
- Empirische wetenschappen moeten vooruitgang boeken door de werkelijkheid zorgvuldig te manipuleren en het effect
ervan te meten of, als manipulatie onmogelijk blijkt
o door de relaties tussen variabelen zorgvuldig te observeren
- complicatie: krachtige drie-eenheid: onzekerheid, ruis, variatie.
o Ten eerste is er onzekerheid omdat menselijk gedrag beïnvloed wordt door verschrikkelijk veel factoren en
veel onbekend is voor ons.
o Ten tweede zijn onze meetinstrumenten verre van perfect en is het signaal dat we willen meten vaak erg zwak
in vergelijking met de meetruis.
o Ten derde variëren effecten en relaties in de gedragswetenschappen enorm.
▪ Er is variatie in situaties, in tijden en, heel belangrijk, er is een enorme variatie tussen mensen.
Helaas is redeneren met ruis, variatie en onzekerheid niet eenvoudig.
- Mensen in het algemeen (en dus ook onderzoekers) zijn onderhevig aan verschillende denkfouten bij het redeneren,
zoals confirmation bias
- Deze denkfouten worden versterkt in situaties met veel ruis en variatie.
o Als statistiek goed wordt toegepast, biedt het nuttige richtlijnen in situaties die geplaagd worden door
onzekerheid, ruis en variatie.
o De onderzoeker en de ruis waarmee ze wordt geconfronteerd, kan worden vergeleken met een kapitein (de
onderzoeker) die het schip door dichte mist (onzekerheid, ruis, variatie) stuurt om op de bestemming (een
goede conclusie) aan te komen.
o De rol van statistiek is als het gereedschap zoals kaarten, kompassen, etc. dat de kapitein gebruikt om de koers
van het schip te bepalen.
Alle methoden die in deze cursus worden besproken, kunnen worden gekenmerkt door het feit dat er
een variabele is y, de uitkomst-, criterium- of afhankelijke variabele (deze variabele is continu!), die
wordt verklaard door een of meer voorspellende of onafhankelijke variabelen (deze variabele is
categoriaal!), aangeduid met x.
Dit betekent dat wanneer je een rechthoekige gegevensmatrix hebt (meestal met personen als rijen en
variabelen als kolommen), één de variabele y is en de andere de rol van x heeft.
Deze modellen zijn de basisbouwstenen van andere, meer geavanceerde modellen, zoals multilevelmodellen en structurele
vergelijkingsmodellen. Als je deze meer ingewikkelde methoden op een doordachte manier wilt toepassen, moet je de basis
goed begrijpen.
IN R:
1
,HOOFDSTUK 1: THE GOOD OLD ONE-WAY ANOVA
1.1 DATA EXAMPLE: TREATMENT OF DEPRESSION
- meest gebruikte behandeling: ADM (anti-depressieva) en psychotherapie
- belangrijke studie:
o RCT om de efficacy van ADM en cognitieve therapie (CT) te testen met placebo
o Sample size: 240 patiënten met middelmatige tot ernstige MDD
▪ Random toegewezen naar 1 van de 3 groepen (60 placebo, 60 ADM en 60 CT)
o Outcomevariabele: totale score op de HDRS op week 8 van de behandeling
▪ Maar 32 drop out dus n=208
▪ Moeilijk om conclusie te maken obv figuur 1.1 door grote variatie in scores dus analyse van variatie
maken
• met significantie level van α = 0.05 zeggen we dat er een significant verschil is tussen de 3
groepen met een one-way analysis van de variantie F(2,205) = 3.67, p= 0.027)
• maar het aandeel van de behandeling in de variantie is klein ( ) met een 95%
betrouwbaarheidsinterval (van 0 tot 0.08)
figuur 1.1:
LIMITATIES
1) differentiële drop out → gemiste data
o meer patiënten drop out uit placebo en CT groep vgl met ADM groep
o kan doordat behandeling geen gewenst effect heeft → dan heeft de drop out invloed op de resultaten
2) de analyse van de variantie (door een F test) is niet zo informatief
2
, o het vertelt ons dat er een verschil is tussen de groepen maar niet welke groepen van elkaar differentiëren en
hoeveel
3) we gebruiken een lineair model met een normaalverdeling voor continue data maar dit is een benadering
o Onze waargenomen scores zijn gegroepeerd in de gehele getallen tussen 0 en 34 (we kunnen geen scores
buiten dit bereik waarnemen, noch niet-integer scores).
▪ Merk op dat we de kleine schending van de normaliteitshypothese niet vermelden omdat dit meestal
iets is waar we ons niet al te veel zorgen over maken. Daarnaast is er geen bewijs voor een schending
van de meer cruciale aannames: gelijke (fout)varianties en de onafhankelijkheidsaanname. Zie
hoofdstuk 3 voor een grondige inleiding in aannames.
1.2 DOELEN VAN DIT HOOFDSTUK
ANOVA uitleggen:
- ANOVA is een statistische methodologie om de gemiddelden van 2 of meer groepen te vergelijken
- Een van de meest gebruikte data analytische methoden in de psychologie en kan gezien worden als een generalisatie
van de onafhankelijke groepen t test
- Het is een basic methode om data van experimenten en RCTs te analyseren
1.3 EXPLORATIVE DATA ANALYSIS
Voordat je aan inferentiële statistiek doet (hypothesetests uitvoeren, waarden berekenen, enz. waarden, enz.), moet je altijd
eerst de gegevens op verschillende manieren bekijken.
- Vaak: beginnen onderzoekers meteen met een ingewikkelde analyse zonder eerst de gegevens te hebben
geïnspecteerd.
o Het visualiseren van gegevens kan helpen bij het opsporen van codeerfouten, extreme waarnemingen,
interessante patronen, enz.
o De meest directe manier is om gewoon naar de datamatrix te kijken, bijvoorbeeld door te kijken naar de
eerste 10 rijen van de MDD-dataset) zoals in Tabel 1.1.
3
, - Er zijn ook veel manieren om een grafiek van je gegevens te maken.
o Figuur 1.1 is één manier (met het voordeel dat de individuele gegevenspunten zichtbaar zijn), maar er zijn vele
andere manieren mogelijk (bijvoorbeeld histogrammen).
- Soms is het patroon in de gegevens zo duidelijk dat verdere statistische analyse niet nodig is.
o In zo'n geval wordt gezegd dat de gegevens de “interoculaire traumatest” hebben doorstaan: “je weet wat de
gegevens betekenen als de conclusie je tussen de ogen raakt”
▪ Uit figuur 1.1 blijkt dat dit zeker niet het geval is voor het MDD-voorbeeld.
▪ Er is zoveel variabiliteit binnen de drie condities dat het gevaarlijk is om een conclusie te trekken op
basis van de grafische weergave van de gegevens.
• In dit geval hebben we statistieken nodig om ons te helpen met de gevolgtrekking.
1.4 THE ANOVA MODEL: NOTATION AND INTERPRETATION
- yij : score van person i in conditie j (i = 1, … , mj en j = 1, … , a) => dus er zijn a condities en mj personen in conditie j
o waarom niet n of nj gebruiken? In gebalanceerde designs gebruiken we mj of
simpeler m want als we n of nj zouden gebruiken dan gebruiken we hetzelfde
symbool voor het aantal participanten in elke conditie en het totaal aantal
participanten in gebalanceerde designs (vermijden dus dat we eenzelfde
symbool gebruiken in 2 verschillende interpretaties)
- mj ’s zijn niet gelijk, het design is unbalanced balanced
- a condities (of groepen) wordt ook wel the levels of the factor genoemd
- totaal aantal participanten:
- dus is het gemiddelde van de sample in conditie j en
is het grote sample gemiddelde
- in het voorbeeld van MDD:
o a=3, m1 = 51, m2 = 107, m3 = 208
o gemiddelde van y is 13.4
o
1.5 STATISTICAL INFERENCE FOR THE ANOVA MODEL: IS THERE A DIFFERENCE BETWEEN THE CONDITIONS?
De vraag die we willen beantwoorden is of er een verschil is tussen de condities. Of, in een meer technische taal, we vragen ons
af of de populatiegemiddelden van de condities verschillen. De onderzoeksvraag zal beantwoord worden door een vergelijking
van twee (statistische) modellen: het volledige en het gereduceerde model. In wat volgt zullen we het statistische
inferentieproces in vier stappen uitleggen.
STEP 1: MODELS AND HYPOTHESES
4
,Het volledige model: waarbij → dit is vergelijking 1.1
- We nemen dus aan dat een waarneming kan worden onderverdeeld in een systematisch (of structureel of signaal) deel
(d.w.z. het populatiegemiddelde ) en een willekeurige afwijking (d.w.z. de stochastische of ruis).
- Het populatiegemiddelde draagt een index en dus mogen de populatiegemiddelden verschillen tussen condities; dit is
het kenmerk van het volledige model.
Het gereduceerde model is een speciaal geval van het volledige model: → dit is vergelijking 1.2
- door aan te nemen dat de a gemiddelden allemaal gelijk zijn aan elkaar:
- Het gereduceerde model is genest in het volledige model. Deze beperking is de nulhypothese die wordt getoetst:
en H1: minstens 1 groepgemiddelde verschilt van de andere groepgemiddeldes
Tabel 1.2 bevat de gemiddelden van de populatievoorwaarden voor beide modellen in het geval er drie groepen zijn.
De volledige en gereduceerde modellen in Vergelijking 1.1 en Vergelijking 1.2 zijn zogenaamde generatieve modellen omdat ze
volledig specificeren hoe de scores op de criteriumvariabele worden gegenereerd.
- Stel dat u de Schepper van de Wereld bent met volledige controle over uw schepping.
- Een depressieonderzoeker in jouw wereld voert een onderzoek uit en wacht dus op gegevens die door jou zijn
gecreëerd.
- Als Schepper bepaal je eerst de populatiegemiddelden (stel dat je ze verschillend neemt in de drie groepen: 17, 11, 13;
daarnaast σ=6
- Vervolgens maak je gegevens aan voor patiënt 101 (zie tabel 1.1). Aangezien dit een patiënt uit de ADM-groep is, neem
je het gemiddelde 11, trek je een willekeurig getal uit de normale verdeling met gemiddelde nul en standaardafwijking
6 (dit is , neem aan dat het 8 is) en voeg bij om de waargenomen score 19 te maken.
- Vervolgens gaat u naar patiënt 102 en herhaalt u het proces.
- Figuur 1.2 toont een grafische illustratie van het volledige en gereduceerde model samen met de gegenereerde
gegevens.
5
, 6