Hoorcollege week 1 Inleiding en herhaling ANOVA ....................................................................2
Hoorcollege 2 week 1 ANOVA tussen factoriele designs .......................................................... 10
Hoorcollege week 2 ANOVA binnenproefpersoon.................................................................... 15
Hoorcollege week 3 Regressie deel 1 ...................................................................................... 24
Hoorcollege week 4 Regressie deel 2 ...................................................................................... 33
Hoorcollege week 5: Factoranalyse ........................................................................................ 44
Hoorcollege week 6: Best practices in dataverzameling en -analyse ........................................ 57
Hoorcollege week 7: Responsiecollege .................................................................................. 66
Besproken onderwerpen:
Hoorcollege 1: meetniveau’s, ANOVA, uitleg variantie
Werkcollege 1 (2): factorieel ontwerp, interactie, Rapportage twee-weg ANOVA, effectgrootte
Hoorcollege 2: Anova binnenpp (repeated measures), sfericiteit, mixed design
Hoorcollege 3: Lineaire regressie, Beta (hellingshoek) en b-coëfficiënt
Hoorcollege 4: Regressie (2), overlap tussen predictoren (OV), assumtpies regr., dummy’s, hierarchis
Hoorcollege 5: Factoranalyse, roteren, assumpties, rapporteren
Hoorcollege 6: Welke analyse, power, steekproefgrootte, effectgrootte, ethiek etc.
1
,Hoorcollege week 1 Inleiding en herhaling ANOVA
Statistiek boek hoofdstukken 12, 14, 15, 16, 9 en 18
Het tentamen bestaat uit drie delen: (1) algemene
vragen (2) SPSS-output interpreteren en rapporteren en (3) SPSS analyse uitvoeren.
Voorbeeld onderzoek productverpakkingen:
*Onderzoeksvraag: Willen mensen een product liever kopen als op de verpakking staat dat het heel
gezond is of dat het heel lekker is, vergeleken met geen extra tekst op de verpakking?
- Hoe gaan we dit onderzoeken?
o Design: Experiment met tussenproefpersoonsdesign.
- Wat zijn de variabelen in dit onderzoek?
o Onafhankelijk: Type verpakking (gezond/lekker/geen)
o Afhankelijk: Aankoopintentie
- Wat zijn daarvan de meetniveaus?
o Type verpakking (gezond/lekker/geen) → categorisch: nominaal
o Aankoopintentie →continue: (ratio → hangt af hoe je het meet)
Uitvoering: Experiment met drie groepen deelnemers
- Groep 1 ziet het product zonder extra tekst op de verpakking
- Groep 2 ziet het product met claim over gezondheid
- Groep 3 ziet het product met claim over smaak
➔ In elke groep stellen we de deelnemers een aantal vragen op een schaal van 1-7 over
hoe graag ze het product zouden willen kopen.
Type variabelen:
- Onafhankelijke variabele: de variabele die je manipuleert, waarvan je het effect wil weten. Bv.
type tekst op product.
- Afhankelijke variabele: de variabele die je meet. Bv: koopintentie
Meetniveaus
- Categorisch: variabele verdeelt de data in groepen
o Nominaal: Bij het nominale niveau worden gegevens ingedeeld in verschillende
categorieën zonder een specifieke volgorde of rangorde. De nummers hebben geen
betekenis, je kan geen gemiddelde nemen (bv. geslacht).
o Ordinaal: verdeel je ook in groepen, maar de groepen hebben een bepaalde volgorde. De
nummers hebben daadwerkelijk betekenis. Bij ordinale data is er een rangorde, maar de
afstanden tussen de categorieën zijn niet exact bekend en hoeven niet gelijk te zijn. Je
kan in principe geen echte gemiddelden berekenen, omdat de afstanden tussen de
categorieën niet vastliggen en daardoor niet gelijk zijn (bv. opleidingsniveau).
- Numeriek/continue: score kan elke waarde zijn op de gebruikte schaal
o Interval: de data kunnen worden gecategoriseerd, er is sprake van een rangorde en de
intervallen tussen de categorieën zijn gelijk (bijvoorbeeld steeds een stap van 10) (bv.
Temperatuur in Celsius) (geen nulpunt).
o Ratio: de data kunnen worden gecategoriseerd, er is sprake van een rangorde, de
intervallen tussen de categorieën zijn gelijk en er is een betekenisvol nulpunt (bv.
Leeftijd).
➔ Note: op een schaal invullen wat je ervan vindt. Bijvoorbeeld very unsatisfied tot very satisfied.
Altijd uitkijken met dit soort schalen, omdat het vaak als numeriek wordt beoordeeld, maar
technisch gezien is dit ordinaal (is bijvoorbeeld het verschil tussen de stappen wel even groot?
Kan je niet zulke betrouwbare uitspraken over doen).
2
,2 manieren om de note op te lossen en dus schalen meer richting numeriek te laten gaan:
1. Geen labels bij de tussenliggende punten zetten
Helemaal oneens ____________________ helemaal eens
2. Een concept meten met meerdere items
“betrouwbaarheid”
o Ik vertrouw de manager
o De manager lijkt betrouwbaar
o De manager lijkt eerlijk
→ zodat het verschil tussen de cijfers (de afstand) even groot is.
ANOVA
- De ANOVA kun je gebruiken om te toetsen of de gemiddelden van twee of meer
groepen gelijk zijn of niet.
- De ANOVA wordt gebruikt bij één of meer nominale onafhankelijke variabelen en
één numerieke afhankelijke variabele.
- De ANOVA werkt op basis van de vergelijking van varianties.
- De onderzoeker heeft controle over één of meer onafhankelijke variabelen
o Factoren of treatment variables
o Een factor heeft 2 of meer niveaus (levels) (in bovenstaand voorbeeld gezond/lekker/geen
tekst)
- Onderzoeker observeert een effect op afhankelijke variabele
o Respons op elk niveau van de onafhankelijke variabele
Wanneer gebruik je een variantie-analyse (ANOVA)?
- Bij twee groepen: t-toets of ANOVA
- Bij meer dan twee groepen: ANOVA
Wanneer gebruik je een ANOVA?
- Toetst of minstens 1 populatiegemiddelde verschilt van de andere populatiegemiddelden
- Van toepassing bij:
o Eén of meer nominale onafhankelijke variabele(n)
o Eén afhankelijke interval of ratio variabele
ANOVA is een statistische methode die wordt gebruikt om de gemiddelden van twee of meer groepen te
vergelijken. Het doel is om te bepalen of er statistisch significante verschillen zijn tussen de gemiddelden
van deze groepen.
• Bij een ANOVA heb je als onderzoeker controle over een of meer onafhankelijke variabelen. Dat
noemen we ook wel factoren of treatment variables.
- Een factor heeft dus twee of meer niveaus
De onderzoeker observeert een effect op de onafhankelijke variabele (die je manipuleert, waar je het
effect van wil weten). Je kan hem gebruiken als je twee groepen met elkaar vergelijkt (kan ook t-test), maar
als je meer dan twee groepen hebt dan gebruik je de Anova.
De Anova toetst of minstens 1 populatie gemiddelde verschilt van de andere populatiegemiddelden.
Dit is van toepassing bij:
- Een of meer nominale onafhankelijke variabele(n)
- Een afhankelijke interval-of ratio-variabele (numerieke schaal)
3
, VOORWAARDEN
• De onafhankelijke (wat je manipuleert, waar je het effect van meet) variabelen moeten
categorisch zijn (bijv. groepen of categorieën).
• De afhankelijke (wat je meet) variabelen moeten continu zijn (bijv. numerieke meetwaarden).
OEFENING: kun je hiervoor een ANOVA gebruiken?
(antwoord: het is niet altijd ja of nee, het hangt af van hoe je het meet)
1. Je onderzoekt de invloed van de hoogte van iemands inkomen op werkgeluk
o Nee → je vergelijkt geen groepen met elkaar. → is geen nominale variabele (hoogte van
inkomen = continue onafhankelijke variabele). Maar je zou het kunnen indelen in
schalen/groepen → laag/hoog inkomen en dan kan je wel een Anova gebruiken. Maar
met de kennis van nu geen ANOVA.
2. Je vergelijkt advertenties van drie typen goede doelen om te kijken of ze de lezer
aanspreken met u of jij.
o Nee → je hebt wel 3 groepen, maar je afhankelijke variabele is nominaal (u of jij) en die
moet continue zijn. Je kan hier wel chi-kwadraattoets gebruiken.
3. Je wil weten of mensen uit vier Europese landen advertenties met een collectief
en een individualistisch waardenappel verschillend waarderen
o Ja → de afhankelijke variabele (advertentiewaardering) is continue (kan je in schalen
meten, zorg ervoor dat die numeriek zijn). De onafhankelijke variabele is uit welk land
mensen komen en (tweede onafhankelijke variabele) of advertenties collectief of
individualistisch waardeappeal hebben (type waardeappeal).
4. Je wil weten of opleidingsniveau samenhangt met de tijd die iemand op social
media doorbrengt.
o Nee → opleidingsniveau is ordinale variabele en ANOVA wil continue. ANOVA zou opzich
wel kunnen, maar om je uiteindelijke doel te berekenen gaat ANOVA je niet helpen.
Een ANOVA verteld ons NIET welk gemiddelde verschilt van de anderen.
Een Anova maakt gebruik van variantie: als je de variantie gaat berekenen ga je voor elk datapunt kijken:
hoever zit dat van het gemiddelde, en dat doe je in het kwadraat (om allemaal positief te maken) en dan
deel je dat door N – 1
N= totaal aantal waarnemingen
Kwadratiesom = som van de gekwadrateerde afwijking (sum of squares). Als je variantie groter is, dan
zitten de punten verder weg van het gemiddelde. Wanneer het kleiner is, zitten ze dichterbij. Het is een
statistische maat die de variatie of spreiding van waarden in een dataset beschrijft.
SSM = Sum of Squares Model = Kwadratensom t.g.v. het model (de drie groepsgemiddelden)
Standaardafwijking/standaarddeviatie (SD): Bij ANOVA hebben we het over variantie, maar normaal
spreken we over de SD. De standaarddeviatie is de wortel van de variantie.
√(som van de gekwadrateerde afwijking / N – 1)
Standaardafwijking heeft dezelfde orde van grootte als de scores zelf. Liever 2 dan 16, daarom trekken we
de wortel. SD gebruiken we om aan te duiden hoeveel die data van het gemiddelde afzit. Is belangrijk om
erbij te noemen, want dat zegt wat over je dataset. Over het algemeen rapporteren we de
standaarddeviatie als spreidingsmaat.
4