100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.2 TrustPilot
logo-home
Summary

SAMENVATTING Statistics 4: Data Analysis in Nederlands

Rating
3.5
(2)
Sold
10
Pages
159
Uploaded on
17-04-2025
Written in
2024/2025

Ben jij op zoek naar een duidelijke, volledige en gestructureerde samenvatting voor het vak Statistiek 4? Zoek niet verder! Deze Nederlandstalige samenvatting bevat alles wat je nodig hebt om dit vak met vertrouwen aan te pakken: Alle hoofdstukken (1 tem 9) overzichtelijk en gestructureerd uitgelegd in het Nederlands (vanuit de cursustekst): - Handige figuren en info uit de voorbije practica - Inclusief alle afbeeldingen uit de cursustekst - Perfect als voorbereiding op volgende lessen, toetsen of examens - Gestructureerd in bullet points en pijltjes en helder geschreven (ideaal om snel te leren en terug te vinden wat je nodig hebt) - Belangrijke termen ook met de Engelse vertaling erbij voor het examen

Show more Read less
Institution
Course













Whoops! We can’t load your doc right now. Try again or contact support.

Written for

Institution
Study
Course

Document information

Uploaded on
April 17, 2025
Number of pages
159
Written in
2024/2025
Type
Summary

Subjects

Content preview

STATISTIEK 4
INTRODUCTIE

De gedragswetenschappen => grotendeels empirisch.

- Empirische wetenschappen moeten vooruitgang boeken door de werkelijkheid zorgvuldig te manipuleren en het effect
ervan te meten of, als manipulatie onmogelijk blijkt
o door de relaties tussen variabelen zorgvuldig te observeren
- complicatie: krachtige drie-eenheid: onzekerheid, ruis, variatie.
o Ten eerste is er onzekerheid omdat menselijk gedrag beïnvloed wordt door verschrikkelijk veel factoren en
veel onbekend is voor ons.
o Ten tweede zijn onze meetinstrumenten verre van perfect en is het signaal dat we willen meten vaak erg zwak
in vergelijking met de meetruis.
o Ten derde variëren effecten en relaties in de gedragswetenschappen enorm.
▪ Er is variatie in situaties, in tijden en, heel belangrijk, er is een enorme variatie tussen mensen.

Helaas is redeneren met ruis, variatie en onzekerheid niet eenvoudig.

- Mensen in het algemeen (en dus ook onderzoekers) zijn onderhevig aan verschillende denkfouten bij het redeneren,
zoals confirmation bias
- Deze denkfouten worden versterkt in situaties met veel ruis en variatie.
o Als statistiek goed wordt toegepast, biedt het nuttige richtlijnen in situaties die geplaagd worden door
onzekerheid, ruis en variatie.
o De onderzoeker en de ruis waarmee ze wordt geconfronteerd, kan worden vergeleken met een kapitein (de
onderzoeker) die het schip door dichte mist (onzekerheid, ruis, variatie) stuurt om op de bestemming (een
goede conclusie) aan te komen.
o De rol van statistiek is als het gereedschap zoals kaarten, kompassen, etc. dat de kapitein gebruikt om de koers
van het schip te bepalen.

Alle methoden die in deze cursus worden besproken, kunnen worden gekenmerkt door het feit dat er
een variabele is y, de uitkomst-, criterium- of afhankelijke variabele (deze variabele is continu!), die
wordt verklaard door een of meer voorspellende of onafhankelijke variabelen (deze variabele is
categoriaal!), aangeduid met x.

Dit betekent dat wanneer je een rechthoekige gegevensmatrix hebt (meestal met personen als rijen en
variabelen als kolommen), één de variabele y is en de andere de rol van x heeft.

Deze modellen zijn de basisbouwstenen van andere, meer geavanceerde modellen, zoals multilevelmodellen en structurele
vergelijkingsmodellen. Als je deze meer ingewikkelde methoden op een doordachte manier wilt toepassen, moet je de basis
goed begrijpen.

IN R:




1

,HOOFDSTUK 1: THE GOOD OLD ONE-WAY ANOVA

1.1 DATA EXAMPLE: TREATMENT OF DEPRESSION

- meest gebruikte behandeling: ADM (anti-depressieva) en psychotherapie
- belangrijke studie:
o RCT om de efficacy van ADM en cognitieve therapie (CT) te testen met placebo
o Sample size: 240 patiënten met middelmatige tot ernstige MDD
▪ Random toegewezen naar 1 van de 3 groepen (60 placebo, 60 ADM en 60 CT)
o Outcomevariabele: totale score op de HDRS op week 8 van de behandeling
▪ Maar 32 drop out dus n=208
▪ Moeilijk om conclusie te maken obv figuur 1.1 door grote variatie in scores dus analyse van variatie
maken
• met significantie level van α = 0.05 zeggen we dat er een significant verschil is tussen de 3
groepen met een one-way analysis van de variantie F(2,205) = 3.67, p= 0.027)
• maar het aandeel van de behandeling in de variantie is klein ( ) met een 95%
betrouwbaarheidsinterval (van 0 tot 0.08)

figuur 1.1:




LIMITATIES
1) differentiële drop out → gemiste data
o meer patiënten drop out uit placebo en CT groep vgl met ADM groep
o kan doordat behandeling geen gewenst effect heeft → dan heeft de drop out invloed op de resultaten
2) de analyse van de variantie (door een F test) is niet zo informatief


2

, o het vertelt ons dat er een verschil is tussen de groepen maar niet welke groepen van elkaar differentiëren en
hoeveel
3) we gebruiken een lineair model met een normaalverdeling voor continue data maar dit is een benadering
o Onze waargenomen scores zijn gegroepeerd in de gehele getallen tussen 0 en 34 (we kunnen geen scores
buiten dit bereik waarnemen, noch niet-integer scores).
▪ Merk op dat we de kleine schending van de normaliteitshypothese niet vermelden omdat dit meestal
iets is waar we ons niet al te veel zorgen over maken. Daarnaast is er geen bewijs voor een schending
van de meer cruciale aannames: gelijke (fout)varianties en de onafhankelijkheidsaanname. Zie
hoofdstuk 3 voor een grondige inleiding in aannames.

1.2 DOELEN VAN DIT HOOFDSTUK

ANOVA uitleggen:

- ANOVA is een statistische methodologie om de gemiddelden van 2 of meer groepen te vergelijken
- Een van de meest gebruikte data analytische methoden in de psychologie en kan gezien worden als een generalisatie
van de onafhankelijke groepen t test
- Het is een basic methode om data van experimenten en RCTs te analyseren




1.3 EXPLORATIVE DATA ANALYSIS

Voordat je aan inferentiële statistiek doet (hypothesetests uitvoeren, waarden berekenen, enz. waarden, enz.), moet je altijd
eerst de gegevens op verschillende manieren bekijken.

- Vaak: beginnen onderzoekers meteen met een ingewikkelde analyse zonder eerst de gegevens te hebben
geïnspecteerd.
o Het visualiseren van gegevens kan helpen bij het opsporen van codeerfouten, extreme waarnemingen,
interessante patronen, enz.
o De meest directe manier is om gewoon naar de datamatrix te kijken, bijvoorbeeld door te kijken naar de
eerste 10 rijen van de MDD-dataset) zoals in Tabel 1.1.




3

, - Er zijn ook veel manieren om een grafiek van je gegevens te maken.
o Figuur 1.1 is één manier (met het voordeel dat de individuele gegevenspunten zichtbaar zijn), maar er zijn vele
andere manieren mogelijk (bijvoorbeeld histogrammen).
- Soms is het patroon in de gegevens zo duidelijk dat verdere statistische analyse niet nodig is.
o In zo'n geval wordt gezegd dat de gegevens de “interoculaire traumatest” hebben doorstaan: “je weet wat de
gegevens betekenen als de conclusie je tussen de ogen raakt”
▪ Uit figuur 1.1 blijkt dat dit zeker niet het geval is voor het MDD-voorbeeld.
▪ Er is zoveel variabiliteit binnen de drie condities dat het gevaarlijk is om een conclusie te trekken op
basis van de grafische weergave van de gegevens.
• In dit geval hebben we statistieken nodig om ons te helpen met de gevolgtrekking.

1.4 THE ANOVA MODEL: NOTATION AND INTERPRETATION

- yij : score van person i in conditie j (i = 1, … , mj en j = 1, … , a) => dus er zijn a condities en mj personen in conditie j
o waarom niet n of nj gebruiken? In gebalanceerde designs gebruiken we mj of
simpeler m want als we n of nj zouden gebruiken dan gebruiken we hetzelfde
symbool voor het aantal participanten in elke conditie en het totaal aantal
participanten in gebalanceerde designs (vermijden dus dat we eenzelfde
symbool gebruiken in 2 verschillende interpretaties)
- mj ’s zijn niet gelijk, het design is unbalanced  balanced
- a condities (of groepen) wordt ook wel the levels of the factor genoemd
- totaal aantal participanten:

- dus is het gemiddelde van de sample in conditie j en

is het grote sample gemiddelde
- in het voorbeeld van MDD:
o a=3, m1 = 51, m2 = 107, m3 = 208
o gemiddelde van y is 13.4
o

1.5 STATISTICAL INFERENCE FOR THE ANOVA MODEL: IS THERE A DIFFERENCE BETWEEN THE CONDITIONS?

De vraag die we willen beantwoorden is of er een verschil is tussen de condities. Of, in een meer technische taal, we vragen ons
af of de populatiegemiddelden van de condities verschillen. De onderzoeksvraag zal beantwoord worden door een vergelijking
van twee (statistische) modellen: het volledige en het gereduceerde model. In wat volgt zullen we het statistische
inferentieproces in vier stappen uitleggen.


STEP 1: MODELS AND HYPOTHESES



4

,Het volledige model: waarbij → dit is vergelijking 1.1

- We nemen dus aan dat een waarneming kan worden onderverdeeld in een systematisch (of structureel of signaal) deel
(d.w.z. het populatiegemiddelde ) en een willekeurige afwijking (d.w.z. de stochastische of ruis).
- Het populatiegemiddelde draagt een index en dus mogen de populatiegemiddelden verschillen tussen condities; dit is
het kenmerk van het volledige model.


Het gereduceerde model is een speciaal geval van het volledige model: → dit is vergelijking 1.2

- door aan te nemen dat de a gemiddelden allemaal gelijk zijn aan elkaar:
- Het gereduceerde model is genest in het volledige model. Deze beperking is de nulhypothese die wordt getoetst:
en H1: minstens 1 groepgemiddelde verschilt van de andere groepgemiddeldes

Tabel 1.2 bevat de gemiddelden van de populatievoorwaarden voor beide modellen in het geval er drie groepen zijn.




De volledige en gereduceerde modellen in Vergelijking 1.1 en Vergelijking 1.2 zijn zogenaamde generatieve modellen omdat ze
volledig specificeren hoe de scores op de criteriumvariabele worden gegenereerd.

- Stel dat u de Schepper van de Wereld bent met volledige controle over uw schepping.
- Een depressieonderzoeker in jouw wereld voert een onderzoek uit en wacht dus op gegevens die door jou zijn
gecreëerd.
- Als Schepper bepaal je eerst de populatiegemiddelden (stel dat je ze verschillend neemt in de drie groepen: 17, 11, 13;
daarnaast σ=6
- Vervolgens maak je gegevens aan voor patiënt 101 (zie tabel 1.1). Aangezien dit een patiënt uit de ADM-groep is, neem
je het gemiddelde 11, trek je een willekeurig getal uit de normale verdeling met gemiddelde nul en standaardafwijking
6 (dit is , neem aan dat het 8 is) en voeg bij om de waargenomen score 19 te maken.
- Vervolgens gaat u naar patiënt 102 en herhaalt u het proces.
- Figuur 1.2 toont een grafische illustratie van het volledige en gereduceerde model samen met de gegenereerde
gegevens.




5

, 6

Reviews from verified buyers

Showing all 2 reviews
4 months ago

7 months ago

3.5

2 reviews

5
0
4
1
3
1
2
0
1
0
Trustworthy reviews on Stuvia

All reviews are made by real Stuvia users after verified purchases.

Get to know the seller

Seller avatar
Reputation scores are based on the amount of documents a seller has sold for a fee and the reviews they have received for those documents. There are three levels: Bronze, Silver and Gold. The better the reputation, the more your can rely on the quality of the sellers work.
jolienwarnants Katholieke Universiteit Leuven
Follow You need to be logged in order to follow users or courses
Sold
13
Member since
2 year
Number of followers
1
Documents
3
Last sold
1 day ago

3.5

2 reviews

5
0
4
1
3
1
2
0
1
0

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions