Tilburg University 2019-2020
Femke van Leth
Inhoudsopgave
Hoorcollege 1 (27-8)....................................................................................................................................... 2
Inleiding en opfrissen statistiek............................................................................................................................2
Hoorcollege 2 (3-9)........................................................................................................................................ 4
Enkelvoudige lineaire regressieanalyse...............................................................................................................5
Hoorcollege 3 (10-9)....................................................................................................................................... 7
De gestandaardiseerde regressiecoëfficiënt........................................................................................................7
ANOVA..................................................................................................................................................................8
Hoorcollege 4 (17-9)....................................................................................................................................... 9
Multipele regressie deel 1....................................................................................................................................9
Hoorcollege 5 (24-9)..................................................................................................................................... 11
Multipele regressie deel 2..................................................................................................................................11
Hoorcollege 6 (1-10)..................................................................................................................................... 13
Multipele regressie deel 3..................................................................................................................................13
Hoorcollege 7 (8-10)..................................................................................................................................... 15
Multipele regressie deel 4..................................................................................................................................15
Geneste modellen: Theorie & Toepassingen......................................................................................................15
Hoorcollege 8 (29-10)................................................................................................................................... 17
Dummy variabelen.............................................................................................................................................17
Hoorcollege 9 (5-11)..................................................................................................................................... 19
Interactie-effecten..............................................................................................................................................19
Hoorcollege 10 (12-11)................................................................................................................................. 22
Interacties tussen continue variabelen..............................................................................................................22
Probing..............................................................................................................................23
Multicollineariteit..............................................................................................................23
Hoorcollege 11 (19-11)................................................................................................................................. 24
Binaire logistische regressie...............................................................................................................................25
Hoorcollege 12 (26-11)................................................................................................................................. 27
, Binaire logistische regressie deel 2....................................................................................................................27
Significantietoetsen bij logistische regressie......................................................................................................28
Hoorcollege 1 (27-8)
Inleiding en opfrissen statistiek
- Bij dit vak ga je variabelen zoeken die met de variabele waarin je geïnteresseerd bent
samenhangen -> voorbeeld: welke factoren zorgen ervoor dat je het tentamen haalt?
- Bij dit vak worden vaak de onderzoeksopzet en de gegevens uit de steekproef
gegeven, en vervolgens is het de bedoeling dat je hieruit een conclusie trekt
- Je neemt je steekproef uit een bepaalde populatie (groep mensen waar je iets over
wil weten) -> dit doe je omdat de hele populatie onderzoeken eigenlijk niet te doen is
o Simple random sampling: elk element in de populatie heeft dezelfde kans om
in de steekproef terecht te komen -> dit is de beste manier van sampling,
maar het is in de praktijk lastig (geen lijst van alle leden van de populatie?)
o Stratified sampling: de populatie wordt opgedeeld in strata (geslacht, leeftijd)
+ binnen elk stratum wordt een volledig aselecte steekproef getrokken
Dit gebeurt bijvoorbeeld als minderheden (kleinere groepen mensen)
uit de populatie ook moeten worden meegenomen -> generaliseren
o Convenience sampling: een steekproef van mensen die voorhanden zijn; dit
gebeurt vaak bij bijvoorbeeld studenten -> maar: is dit te generaliseren?
Er zijn nog vele andere vormen, maar in principe gaan we
tijdens dit vak uit van simple random sampling -> beste manier
- Kleinere steekproeven zijn lang niet altijd representatief voor de populatie
o Als hier wel vanuit wordt gegaan heet dit Belief in the Law of Small Numbers
o Je merkt vaak dat meerdere kleine steekproeven uit dezelfde populatie sterk
van elkaar verschillen, dus grotere steekproeven zijn beter (er is meer kans
dat de steekproef lijkt op de populatie + grotere power) -> meer dan N = 25
- De data in de steekproef kunnen op verschillende manieren worden beschreven:
o Centrummaten: gemiddelde (alle scores bij elkaar optellen, delen door het
aantal scores), mediaan (middelste antwoord) en modus (hoogste frequentie)
o Spreidingsmaten: variantie en standaarddeviatie (de wortel van de variantie)
Deze descriptive statistics worden vaak in SPSS gegeven (tabel)
Beschrijvende statistieken gaan dus over de steekproef
- Wanneer we resultaten willen generaliseren van steekproef naar populatie, zijn
beschrijvende statistieken niet genoeg -> inferentiële statistiek is nodig
o Null hypothesis significance testing (NHST)
Stap 1: het formuleren van H0 (geen effect) en H1 (wel een effect)
Stap 2: een beslisregel bedenken -> wat is je significantielevel ()?
Hierbij is vaak 0.05 -> als p kleiner is wordt H0 verworpen
Stap 3: de t-waarde, Z-waarde of p-waarde uit je data halen
Deze waardes zijn afhankelijk van je steekproef (het
gemiddelde, de standaarddeviatie en de grootte van N)
Stap 4: het wel of niet verwerpen van H0 + het trekken van conclusies
Je kan hierbij een 1-zijdige of een 2-zijdige test uitvoeren
o Bij een 2-zijdige test gebruik je de p-waarde die er
staat, bij een 1-zijdige test check je eerst of het
, gemiddelde klopt met de voorspelling, en als dit zo is,
kijk je vervolgens naar de p-waarde gedeeld door 2
o Betrouwbaarheidsinterval schatting (vaak een 95% interval -> bij = 0.05)
Wanneer we een experiment eindeloos vaak herhalen, bevat het 95%
betrouwbaarheidsinterval in 95% van de gevallen de echte waarde
Op basis van de gevonden data is dit dus de meest
waarschijnlijke range waarbinnen de echte waarde zal liggen
o Met 95% zekerheid kan je zeggen dat in het CI ligt
Betrouwbaarheidsintervallen geven onzekerheid rondom
puntschatters (het gemiddelde of de correlatie) weer
Bij een grotere N kan je preciezer meten -> CI wordt smaller
- Je hebt verschillende meetniveaus binnen de statistiek -> klassieke indeling:
o Nominaal en ordinaal (beide categorische variabelen) -> je valt in 1 categorie
o Interval en ratio (beide kwantitatieve variabelen) -> je kan elke score hebben
De verschillen tussen categorische en kwantitatieve variabelen zijn in
dit vak belangrijker dan de verschillen in nominaal, ordinaal, interval
en ratio -> dit zijn vaak namelijk minder duidelijke verschillen
- Je hebt ook verschillende vormen van onderzoeksdesign binnen de psychologie:
o Hierbij houdt probability sampling in: simple random sampling, stratified
sampling etc. -> elke vorm van sampling die niet convenience sampling is
Waarbij mensen dus een gelijke kans hebben om in de steekproef te
komen -> er is sprake van een vorm van willekeurige keuze
Probability Random “Actieve”
sampling* toewijzing aan Manipulatie
condities
Experiment JA JA JA
Quasi- JA NEE JA
Experiment
Correlationeel JA NEE NEE
- Pearson’s (poulatie) of r (steekproef) is een maat voor lineaire samenhang
o Het is een getal tussen -1 (perfecte negatieve samenhang) en +1 (perfecte
positieve samenhang) + het kan geen niet-lineaire samenhang laten zien
Daarom moet je eerst altijd de scatterplots bekijken voor je correlaties
gaat interpreteren -> het moet een lineair verband zijn voor conclusies
Bepaalde outliers (extreme scores) kunnen een correlationeel verband
versterken of verminderen -> ook hierom moet je scatterplots checken
o De correlatiecoëfficiënt kan worden getoetst met inferentiële statistiek
N −2
H0: = 0 tegen H1: ≠ 0
√
-> t-toets: t = r
1−r 2
SPSS geeft standaard de p-waarde van deze toets
met df = N – 2