100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.2 TrustPilot
logo-home
Summary

Samenvatting - Multivariate data analyse Universiteit Leiden (6462PS009Y)

Rating
-
Sold
-
Pages
23
Uploaded on
01-04-2025
Written in
2023/2024

Complete samenvatting van alle stof voor MVDA. Ik heb hier zelf een 8 mee gehaald!

Institution
Module










Whoops! We can’t load your doc right now. Try again or contact support.

Written for

Institution
Study
Module

Document information

Uploaded on
April 1, 2025
Number of pages
23
Written in
2023/2024
Type
Summary

Subjects

Content preview

Stappenplan voor analysemethode:
1.​ Welke en hoeveel variabelen zijn er betrokken?
2.​ Hoe willen we onze variabelen toewijzen aan sets? Bestaat de evt tweede set dan uit één of juist uit
meerdere afhankelijke variabelen?
3.​ Wat is het meetniveau van de variabelen? (nominaal, ordinaal, interval)
4.​ Soms aanvullende vragen stellen.

Een between-subjects design stelt ons in staat om verschillende proefpersonen te gebruiken in elk van de
condities.
Een within-subjects design stelt ons in staat om alle proefpersonen in alle condities te gebruiken.

Eén variabele: univariate analyse. (In welke mate ervaren werkende mensen problemen in hun werk?
Twee variabelen: bivariate analyse. (Is er een verschil in de mate waarin mannen en vrouwen problemen ervaren
in hun werk?)
Drie of meer variabelen: multivariate data-analyse (MVDA). (In hoeverre kunnen lichamelijke klachten worden
voorspeld op basis van vijf soorten stress op de werkplek?)

Het uitvoeren van afzonderlijke analyses voor elk van de afhankelijke y variabelen, zou de kans op type 1 fout
(het onterecht verwerpen van de nulhypothese) kunnen vergroten.
Als de vraag niet gaat over voorspellen, maar gewoon over het bekijken van de relatie tussen een aantal
variabelen is er maar 1 set.

Mogelijkheden om onze variabelen toe te wijzen aan sets:
1.​ Alle variabelen worden toegewezen aan één set X. Alle variabelen zijn dan gelijk.
2.​ De variabelen worden verdeeld in twee sets X en Y, waarbij Y slechts één variabele bevat. We kiezen
hiervoor als we een enkele variabele zo nauwkeurig mogelijk willen voorspellen op basis van een
aantal andere variabelen.
3.​ De variabelen worden verdeeld in twee sets X en Y, waarbij Y twee of meer variabelen bevat. We
kiezen hiervoor als we meer dan één variabele zo nauwkeurig mogelijk willen voorspellen op basis van
een aantal andere variabelen.

Meetniveaus:
-​ Nominaal → je wijst nummers toe aan categorieën om ze te onderscheiden. Het ene nummer is niet
meer waard dan het andere nummer.
-​ Ordinaal → beschrijft een rangorde. We kunnen alleen nog niet zeggen wat de waarde is en hoe groot
het verschil tussen de waarden is.
-​ Interval → de verschillen tussen de getallen laten altijd even grote verschillen in de variabelen zien.
(Likertschaal-vragen (zoals: slecht, neutraal, mee eens, niet mee eens, sterk niet mee eens) ook als
interval).
-​ Binair → zo’n variabele heeft twee categorieën.




.



,Week 1

Bij meervoudige regressieanalyse (MRA) hebben we twee sets variabelen, Y en X, waarbij er slechts één
Y-variabele is en meerdere X-variabelen.

Als er twee of meer intervalvariabelen zijn, kunnen we de relatie daartussen weergeven door Pearson correlaties
te berekenen. Dit geeft ons twee soorten informatie over de correlatie:
-​ Teken →
Positieve correlatie: geeft aan dat gemiddeld de ene variabele toeneemt als de andere toeneemt.
Negatieve correlatie: geeft aan dat gemiddeld de ene variabele afneemt als de andere toeneemt.
-​ Sterkte →
Hoe meer een correlatie afwijkt van 0, hoe sterker de correlatie.
Hoe dichterbij -1 of +1 hoe sterker de relatie.
De gekwadrateerde correlatie geeft het aandeel van de gemeenschappelijke variantie van de twee
variabelen aan, wat de hoeveelheid variantie is die gedeeld wordt tussen een set items.

Het belangrijkste verschil tussen een eenvoudige regressieanalyse en een Pearson correlatie is dat een regressie
asymmetrisch is: het voorspellen van X uit Y levert een andere regressievergelijking op dan het voorspellen van
Y uit X.

(Niet voor dit tentamen, wel handig→ formule voor enkelvoudige regressie (ruw): Y = b0 + b1X + e
Y = afhankelijke variabele
X = onafhankelijke variabele
b0 = parameter die geschat moet worden (intercept/constante)
b1 = regressiegewicht, geeft ons informatie over richting en steilheid van de regressielijn
e = fout

Gestandaardiseerde enkelvoudige regressieanalyse: ZY = cZX = eZ met β = sx / sy *b1 = rxy
eZ = foutterm, maar nu in standaarddeviatie-eenheden
De voorspelde waarde van Y ligt altijd dichterbij het gemiddelde dan de waarde van X (tenzij β gelijk is aan 1 of
-1) → regressie naar het gemiddelde)

Bij MRA veronderstellen we ook een soort causaliteit, omdat we van X naar Y gaan. Een MRA geeft ons drie
belangrijke soorten aanvullende informatie:
1.​ Optimale voorspelling van Y uit een combinatie van X variabelen.
2.​ Hoe goed is onze algemene voorspelling?
3.​ Hoe goed is elke afzonderlijke voorspeller?

Meervoudige regressievergelijking: Y = b0 + b1X1 + b2X2 + b3X3 + … + bkXk + e
Y = onze afhankelijke variabele voorspeld door de X variabelen.
b0 = de constante/intercept. De uitkomst van Y als alle X variabelen 0 zijn. (dus waar de lijn de y-as snijdt)
bk = regressiegewicht per variabele, ook wel coëfficiënt.
e = de foutterm.
We kunnen de formule herschrijven als: Y = Y^ + e, waar Y^ = b0 + b1X1 + b2X2 + b3X3 + … + bkXk
Y^ = onze voorspelde waarde van Y. Door dit herschrijven kunnen we de Pearson correlatie definiëren tussen
de voorspelde en waargenomen waarden van Y: R = rYY^

Meervoudige regressie geeft ons een optimale voorspelling van Y. We kunnen het ook gebruiken om te zien hoe
goed onze X variabelen de Y variabele voorspellen.
De hoeveelheid variantie die wordt verklaard door één specifieke variabele, kan worden afgelezen van de
verklaarde variantie.

, Meervoudige correlatie R: geeft de correlatie aan tussen de voorspelde waarden van Y en de werkelijke
waarden van Y. De regressiegewichten worden zo gekozen dat de meervoudige correlatie (R) altijd tussen 0 en 1
ligt en nooit negatief kan zijn.

Proportie verklaarde variantie (VAF) = het aandeel gedeelde variantie tussen Y^ en Y, dit duiden we aan als
hoeveel variantie wordt verklaard door Y. De volgende formule berekent hoeveel variantie wordt verklaard:
R2 = VAF = SSregression / SStotal
=
R2 = VAF = r2Y.12 * (r2Y1 + r2Y2 - 2ry1rY2r - r212)
R2 = r2 (pearson r)
In de ‘Model Summary’ tabel staat ook de R2.
r2Y1 = waarde onder zero-order van de eerste predictor
r2Y21 = part correlations waarde van de tweede predictor
r2Y2 = waarde onder zero-order van de tweede predictor
r2Y12 = part correlations waarde van de eerste predictor

Hoe hoger de R2, hoe beter onze voorspelling als geheel is, dit is de waarde van de steekproef.
We gebruiken de adjusted R2 omdat de hoeveelheid gedeelde variantie in de populatie vaak wordt overschat,
deze waarde ligt dus dichter bij de werkelijke waarde van de populatie. Deze overschatting vindt plaats omdat
de verwachte waarde van R in de steekproef 0 is. De verwachte waarde van R in de populatie zal groter dan 0
zijn, omdat er geen negatieve waarden kunnen zijn.

De adjusted R2 kan ook worden gevonden in de tabel ‘model summary’ of berekend met:
R2adj = 1 - (N-1 / N - k - 1)* (1 - R2)
N = aantal mensen (steekproefgrootte)
k = aantal voorspellers

Regressiegewichten in de meervoudige regressie formule geven aan hoeveel de voorspelde waarde van Y
verandert als de X-variabele met 1 eenheid toeneemt.
Het verschil tussen de voorspelde waarde van Y en de werkelijke waarde van Y, wordt het residu genoemd.
De regressielijn wordt zo gekozen dat deze residuen zo klein mogelijk zijn, zodat we een zo nauwkeurig
mogelijke voorspelling van de populatie kunnen doen op basis van de steekproef: kleinste kwadranten
methode. Uit de volgende formule wil je dus een zo klein mogelijke waarde: ΣNi=1(Yi - Y^i)2 = ΣNi=1 * e2

Gestandaardiseerde regressiegewichten β: deze waarde geeft aan hoeveel standaardafwijkingen Y verandert
als X met 1 standaardafwijking toeneemt. Bij het standaardiseren verdwijnt de constante.
Het voordeel van β’s ten opzichte van b’s is dat deze wel direct met elkaar vergeleken kunnen worden. Bij b’s
zijn ze afhankelijk van de eenheid waarmee X gemeten wordt.
Het nadeel van β’s in plaats van b’s is dat ze afhankelijk zijn van de standaardafwijking van onze steekproef.
BDI = β1X1st + β2X2st

Je kan een regressievergelijking op stellen met behulp van de regressiegewichten uit SPSS uit de tabel
‘coefficients’.
Y^ = b0 + b1X1 + b2X2 + b3X3 + … + bkXk
→ dit wordt heel letterlijk uitgeschreven de volgende waardes:
Y^ = Gradepointaverage^
b0 = de constante onder ‘unstandardized B’
bkXk = per ding dat onder constante staat en dan de waarde onder ‘unstandardized B’

Semi-partiële correlatie: de correlatie tussen X en Y zonder de overlappende correlatie, je evalueert de
individuele voorspellers. Als we dit kwadrateren krijgen we de uniek verklaarde variantie van de voorspeller:

Get to know the seller

Seller avatar
Reputation scores are based on the amount of documents a seller has sold for a fee and the reviews they have received for those documents. There are three levels: Bronze, Silver and Gold. The better the reputation, the more your can rely on the quality of the sellers work.
VicWijk Universiteit Leiden
Follow You need to be logged in order to follow users or courses
Sold
18
Member since
2 year
Number of followers
4
Documents
37
Last sold
2 weeks ago

1.0

1 reviews

5
0
4
0
3
0
2
0
1
1

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their exams and reviewed by others who've used these revision notes.

Didn't get what you expected? Choose another document

No problem! You can straightaway pick a different document that better suits what you're after.

Pay as you like, start learning straight away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and smashed it. It really can be that simple.”

Alisha Student

Frequently asked questions