100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4,6 TrustPilot
logo-home
College aantekeningen

Collegeaantekeningen Statistische modellen 2

Beoordeling
2,5
(2)
Verkocht
16
Pagina's
44
Geüpload op
09-06-2022
Geschreven in
2021/2022

Dit document bevat de collegeaantekeningen voor het vak Statistische Modellen 2 van de RUG. Ik heb dit vak afgerond met een 9,6. Succes met studeren!












Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Documentinformatie

Geüpload op
9 juni 2022
Aantal pagina's
44
Geschreven in
2021/2022
Type
College aantekeningen
Docent(en)
Dr. r. hoekstra ,dr. w.j. post
Bevat
Alle colleges

Onderwerpen

Voorbeeld van de inhoud

College 1 – 07-02-2022 ➔ Regressieanalyse

Overzicht Cursus
1. Regressieanalyse
2. Multivariate relaties
3. Variantieanalyse
4. Covariantieanalyse
5. Regressieanalyse met categorische predictoren
6. Logistische regressieanalyse
7. Repeated measures ANOVA

Soorten variabelen
- NOM: nominaal (“labels”)
- DUM: dummyvariabelen (bv. D = 1: experimenteel, D = 0: controle)
- INT: interval/kwantitatieve variabele

Verschillende modellen
Onafh. Afh.
X1 X2 Y Model
DUM INT t-toets voor onafhankelijke groepen
NOM INT éénwegvariantieanalyse (ANOVA)
NOM NOM INT tweewegvariantieanalyse (ANOVA)
INT INT enkelvoudige regressieanalyse
INT INT INT multipele regressieanalyse
INT NOM INT covariantieanalyse
INT DUM DUM logistische regressieanalyse

Afh.
Y1 Y2 Y3 Model
INT INT t-toets voor gepaarde waarnemingen
INT INT INT repeated measures ANOVA

Regressieanalyse = het voorspellen van een intervalvariabele uit een of meerdere andere variabelen


Lineaire relaties
In veel onderzoekssituaties zijn er intervalvariabelen (INT), zoals:
- Lengte, gewicht, leeftijd
- Schaalscores voor introversie, depressie, coping, attitude
- Vaardigheidsscores voor taal, rekenen
Vanuit een wetenschappelijke theorie hebben we vaak verwachtingen over hoe variabelen
gerelateerd zijn. Hoe kan je een relatie uitdrukken?

, Voorbeeld: Onderzoek naar depressie en coping (deel 1)

Steekproef van N = 84 random geselecteerde RUG-studenten
Twee variabelen:
- BDI (Beck Depression Inventory): 0-9 weinig, 10-18 mild, 19-29 matig, 30-63 zware depressie
- Coping score: 0 = geen coping, 10 = goed kunnen omgaan met tegenslag

Onderzoeksvraag: Is er een relatie tussen BDI en coping (in de populatie)?




→ Hogere scores op coping, lagere score op BDI
Veronderstel: relatie is lineair → toename in coping is proportioneel t.o.v. afname BDI

Een lineair model werkt goed in de praktijk, het blijkt dat veel relaties tussen twee intervalvariabelen
redelijk met een lineair verband zijn samen te vatten. Een lijn wordt beschreven door een helling, dit
getal (= parameter) geeft de richting van relatie weer en geeft een interpretatie aan de relatie.

Welke lijn moet je nemen? → Bereken alle residuen (= afstanden punten tot lijn), kwadrateer alle
residuen (want dan zijn positieve en negatieve waarden gelijk en je wordt gestraft voor punten die
ver weg liggen), tel alle gekwadrateerde residuen op en kies een lijn zodat deze som zo klein mogelijk
is. Kleinste kwadratensom van residuen is uniek en geeft een unieke lijn.

Intermezzo
- Nulhypothese: een populatiegrootheid heeft een bepaalde waarde
- Alternatieve hypothese: de populatie-grootheid heeft die waarde niet (groter, kleiner, ongelijk)
→ probeer de nulhypothese te verwerpen
vb. H0:  = 0 versus Ha:  ≠ 0 OF H0: ß1 = 0 versus Ha: ß1 > 0
>: rechtszijdig
<: linkszijdig
≠ : tweezijdig (welke van de drie blijkt uit de vraagstelling)
Hoe waarschijnlijk is het dat, uitgaande van de nulhypothese, de nulhypothese niet
waar is (en de alternatieve dus wel waar is)?
- Gebaseerd op een toetsingsgrootheid (test statistic):
Toetsingsgrootheid (z-waarde of t-waarde) is een noodzakelijke tussenstap
om van een statistic naar een bepaalde kans te komen.

,- p-waarde = “De kans om een uitkomst te vinden zo extreem of nog extremer dan het gevonden
effect, als H0 waar zou zijn.”
→ Hoe kleiner p des te sterker is het bewijs tegen de nulhypothese, d.w.z. hoe onwaarschijnlijker de
nulhypothese is. (Hoe klein is p? → vergelijk met significantieniveau )

- p < α : significant : “er lijkt bewijs tegen de nulhypothese” (dit hoeft niet per se sterk bewijs te zijn)
- p > α : niet significant : “geen idee of er een populatie-effect is” (en dus niet: “er is waarschijnlijk
geen populatie-effect”) → je neemt de nulhypothese niet aan, maar je
verwerpt hem niet → p-waarde is niet de kans dat de nulhypothese waar is
- NB: wees voorzichtig! Rigide interpretaties zijn zelden wenselijk
- Test statistic: “hoeveel standaardfouten ligt gevonden uitkomst van de waarde onder de H0 af”?
- P-waarde: wat is de kans op minstens de gevonden test statistic indien H0 waar zou zijn?



Voorbeeld: Onderzoek naar depressie en coping (deel 2)

Met kleinste kwadratenlijn kunnen we nu een aantal vragen beantwoorden

Onderzoeksvraag 1: Is er een lineaire relatie tussen BDI en coping in de populatie?
Pearson correlatie
- Maat voor sterkte lineaire relatie
- Nulhypothese bij t-toets → H0: r = 0 (geen relatie)
- p < 0.001 → significante relatie tussen BDI en coping
- Relatie negatief: meer coping gaat samen met minder depressie
- SPSS:




Onderzoeksvraag 2 Hoe sterk is de lineaire relatie tussen BDI en coping?
Pearson correlatie
- maat voor sterkte van een lineaire relatie
- kwadraat van de correlatie is de gemeenschappelijke variantie tussen variabelen
→ (–0.88)2 = 0.774 →BDI en coping hebben dus 77% variantie gemeenschappelijk

Onderzoeksvraag 3 (1 + 2): Kan BDI voorspeld worden door coping?
→ Enkelvoudige regressieanalyse (= regressieanalyse met één voorspeller)



Statistisch model
Relatie tussen variabelen in de populatie: yi = β0 + β1xi + i
- yi = score op afhankelijke variabele y voor persoon i
- xi = score onafhankelijke variabele x voor persoon i
- i = residu (error, afwijking)
- Regressiecoëfficiënten: - β0 = intercept
- β1 = helling (slope)
De regressiecoëfficiënten moeten geschat worden (uit de steekproef).

, Statistisch model heeft de vorm data = model + error
- data = yi
- model = β0 + β1xi (regressielijn)
- error = I (geeft aan hoeveel iemand boven of onder de regressielijn zijt; normaal verdeeld
met gemiddelde 0)

Coëfficiënten zijn niet direct observeerbaar (populatielijn):
- β0 = intercept
- β1 = helling (slope)
Ze moeten geschat worden, dit gebeurt met kleinste kwadratenmethode.
yˆ = b + b x
Geschatte regressielijn is dan i 0 1 i

- b0 = schatter van β0
- b1 = schatter van β1
- Voor gemak schrijven we: BDI = b0 + b1*coping

Vergelijking voor een lijn: y = ax +b
- b = intercept (waarde van y als x = 0) (snijpunt y-as)
- a = helling (slope) (geeft steilheid van de lijn)
BDI = b0 + b1*coping
- b0 = intercept (waarde van BDI als coping = 0)
- b1 = helling (slope) (geeft steilheid van de lijn) b1 = –5.2 (dalend)

Het is niet nodig dat alle punten op de regressielijn liggen.
Restrictie: homoscedasticiteit = verticale spreiding (van onder naar boven) is voor ongeveer alle
waarden van X gelijk

SPSS-analyse
Analyze/Regression/Linear
Coëfficiëntentabel:




Unstandardized coefficients:
- waarde van b0 (= 54.3) bij Constant
- waarde van b1 (= – 5.2) bij coping
- Invullen in BDI = b0 + b1*coping geeft de geschatte regressievergelijking: BDI = 54.3 – 5.2*coping

t-toets voor populatie-intercept
- H0: β0 = 0
- Toets of populatie-intercept ongelijk aan 0 is
- t = 30.3, p < 0.001 → intercept waarschijnlijk ongelijk aan 0 in populatie
- Als toets niet significant, niet een probleem (intercept is dan heel klein)

t-toets voor populatie regressiecoëfficiënt van coping
- H0: β1 = 0
- Toets of coping een voorspeller is van BDI in populatie
- t = –16.7, p < 0.001
- coping lijkt in de populatie een voorspeller van BDI

Beoordelingen van geverifieerde kopers

Alle 2 reviews worden weergegeven
2 jaar geleden

2 jaar geleden

2,5

2 beoordelingen

5
0
4
1
3
0
2
0
1
1
Betrouwbare reviews op Stuvia

Alle beoordelingen zijn geschreven door echte Stuvia-gebruikers na geverifieerde aankopen.

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
anneliewagenaar Rijksuniversiteit Groningen
Bekijk profiel
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
197
Lid sinds
4 jaar
Aantal volgers
142
Documenten
31
Laatst verkocht
1 week geleden
Pedagogische Wetenschappen: samenvattingen en collegeaantekeningen

Hoi! Ik ben Annelie, ik studeer Pedagogische Wetenschappen aan de RUG. Als je vragen hebt over een samenvatting of over collegeaantekeningen, stuur dan vooral een berichtje!

3,3

17 beoordelingen

5
1
4
9
3
4
2
0
1
3

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen