Samenvatting

Samenvatting - Multivariate data analyse Universiteit Leiden (6462PS009Y)

Beoordeling

Verkocht

Pagina's

Geüpload op

01-04-2025

Geschreven in

2023/2024

Complete samenvatting van alle stof voor MVDA. Ik heb hier zelf een 8 mee gehaald!

Instelling

Vak

Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Meld schending auteursrecht

Geschreven voor

Instelling: Universiteit Leiden (UL)
Studie: Psychologie
Vak: Multivariate data analyse (6462PS009Y)

Alle documenten voor dit vak (49)

Documentinformatie

Geüpload op: 1 april 2025
Aantal pagina's: 23
Geschreven in: 2023/2024
Type: Samenvatting

Onderwerpen

mvda
spss
samenvatting

Voorbeeld van de inhoud

Stappenplan voor analysemethode:
1. Welke en hoeveel variabelen zijn er betrokken?
2. Hoe willen we onze variabelen toewijzen aan sets? Bestaat de evt tweede set dan uit één of juist uit
meerdere afhankelijke variabelen?
3. Wat is het meetniveau van de variabelen? (nominaal, ordinaal, interval)
4. Soms aanvullende vragen stellen.

Een between-subjects design stelt ons in staat om verschillende proefpersonen te gebruiken in elk van de
condities.
Een within-subjects design stelt ons in staat om alle proefpersonen in alle condities te gebruiken.

Eén variabele: univariate analyse. (In welke mate ervaren werkende mensen problemen in hun werk?
Twee variabelen: bivariate analyse. (Is er een verschil in de mate waarin mannen en vrouwen problemen ervaren
in hun werk?)
Drie of meer variabelen: multivariate data-analyse (MVDA). (In hoeverre kunnen lichamelijke klachten worden
voorspeld op basis van vijf soorten stress op de werkplek?)

Het uitvoeren van afzonderlijke analyses voor elk van de afhankelijke y variabelen, zou de kans op type 1 fout
(het onterecht verwerpen van de nulhypothese) kunnen vergroten.
Als de vraag niet gaat over voorspellen, maar gewoon over het bekijken van de relatie tussen een aantal
variabelen is er maar 1 set.

Mogelijkheden om onze variabelen toe te wijzen aan sets:
1. Alle variabelen worden toegewezen aan één set X. Alle variabelen zijn dan gelijk.
2. De variabelen worden verdeeld in twee sets X en Y, waarbij Y slechts één variabele bevat. We kiezen
hiervoor als we een enkele variabele zo nauwkeurig mogelijk willen voorspellen op basis van een
aantal andere variabelen.
3. De variabelen worden verdeeld in twee sets X en Y, waarbij Y twee of meer variabelen bevat. We
kiezen hiervoor als we meer dan één variabele zo nauwkeurig mogelijk willen voorspellen op basis van
een aantal andere variabelen.

Meetniveaus:
- Nominaal → je wijst nummers toe aan categorieën om ze te onderscheiden. Het ene nummer is niet
meer waard dan het andere nummer.
- Ordinaal → beschrijft een rangorde. We kunnen alleen nog niet zeggen wat de waarde is en hoe groot
het verschil tussen de waarden is.
- Interval → de verschillen tussen de getallen laten altijd even grote verschillen in de variabelen zien.
(Likertschaal-vragen (zoals: slecht, neutraal, mee eens, niet mee eens, sterk niet mee eens) ook als
interval).
- Binair → zo’n variabele heeft twee categorieën.

.

,Week 1

Bij meervoudige regressieanalyse (MRA) hebben we twee sets variabelen, Y en X, waarbij er slechts één
Y-variabele is en meerdere X-variabelen.

Als er twee of meer intervalvariabelen zijn, kunnen we de relatie daartussen weergeven door Pearson correlaties
te berekenen. Dit geeft ons twee soorten informatie over de correlatie:
- Teken →
Positieve correlatie: geeft aan dat gemiddeld de ene variabele toeneemt als de andere toeneemt.
Negatieve correlatie: geeft aan dat gemiddeld de ene variabele afneemt als de andere toeneemt.
- Sterkte →
Hoe meer een correlatie afwijkt van 0, hoe sterker de correlatie.
Hoe dichterbij -1 of +1 hoe sterker de relatie.
De gekwadrateerde correlatie geeft het aandeel van de gemeenschappelijke variantie van de twee
variabelen aan, wat de hoeveelheid variantie is die gedeeld wordt tussen een set items.

Het belangrijkste verschil tussen een eenvoudige regressieanalyse en een Pearson correlatie is dat een regressie
asymmetrisch is: het voorspellen van X uit Y levert een andere regressievergelijking op dan het voorspellen van
Y uit X.

(Niet voor dit tentamen, wel handig→ formule voor enkelvoudige regressie (ruw): Y = b0 + b1X + e
Y = afhankelijke variabele
X = onafhankelijke variabele
b0 = parameter die geschat moet worden (intercept/constante)
b1 = regressiegewicht, geeft ons informatie over richting en steilheid van de regressielijn
e = fout

Gestandaardiseerde enkelvoudige regressieanalyse: ZY = cZX = eZ met β = sx / sy *b1 = rxy
eZ = foutterm, maar nu in standaarddeviatie-eenheden
De voorspelde waarde van Y ligt altijd dichterbij het gemiddelde dan de waarde van X (tenzij β gelijk is aan 1 of
-1) → regressie naar het gemiddelde)

Bij MRA veronderstellen we ook een soort causaliteit, omdat we van X naar Y gaan. Een MRA geeft ons drie
belangrijke soorten aanvullende informatie:
1. Optimale voorspelling van Y uit een combinatie van X variabelen.
2. Hoe goed is onze algemene voorspelling?
3. Hoe goed is elke afzonderlijke voorspeller?

Meervoudige regressievergelijking: Y = b0 + b1X1 + b2X2 + b3X3 + … + bkXk + e
Y = onze afhankelijke variabele voorspeld door de X variabelen.
b0 = de constante/intercept. De uitkomst van Y als alle X variabelen 0 zijn. (dus waar de lijn de y-as snijdt)
bk = regressiegewicht per variabele, ook wel coëfficiënt.
e = de foutterm.
We kunnen de formule herschrijven als: Y = Y^ + e, waar Y^ = b0 + b1X1 + b2X2 + b3X3 + … + bkXk
Y^ = onze voorspelde waarde van Y. Door dit herschrijven kunnen we de Pearson correlatie definiëren tussen
de voorspelde en waargenomen waarden van Y: R = rYY^

Meervoudige regressie geeft ons een optimale voorspelling van Y. We kunnen het ook gebruiken om te zien hoe
goed onze X variabelen de Y variabele voorspellen.
De hoeveelheid variantie die wordt verklaard door één specifieke variabele, kan worden afgelezen van de
verklaarde variantie.

, Meervoudige correlatie R: geeft de correlatie aan tussen de voorspelde waarden van Y en de werkelijke
waarden van Y. De regressiegewichten worden zo gekozen dat de meervoudige correlatie (R) altijd tussen 0 en 1
ligt en nooit negatief kan zijn.

Proportie verklaarde variantie (VAF) = het aandeel gedeelde variantie tussen Y^ en Y, dit duiden we aan als
hoeveel variantie wordt verklaard door Y. De volgende formule berekent hoeveel variantie wordt verklaard:
R2 = VAF = SSregression / SStotal
=
R2 = VAF = r2Y.12 * (r2Y1 + r2Y2 - 2ry1rY2r - r212)
R2 = r2 (pearson r)
In de ‘Model Summary’ tabel staat ook de R2.
r2Y1 = waarde onder zero-order van de eerste predictor
r2Y21 = part correlations waarde van de tweede predictor
r2Y2 = waarde onder zero-order van de tweede predictor
r2Y12 = part correlations waarde van de eerste predictor

Hoe hoger de R2, hoe beter onze voorspelling als geheel is, dit is de waarde van de steekproef.
We gebruiken de adjusted R2 omdat de hoeveelheid gedeelde variantie in de populatie vaak wordt overschat,
deze waarde ligt dus dichter bij de werkelijke waarde van de populatie. Deze overschatting vindt plaats omdat
de verwachte waarde van R in de steekproef 0 is. De verwachte waarde van R in de populatie zal groter dan 0
zijn, omdat er geen negatieve waarden kunnen zijn.

De adjusted R2 kan ook worden gevonden in de tabel ‘model summary’ of berekend met:
R2adj = 1 - (N-1 / N - k - 1)* (1 - R2)
N = aantal mensen (steekproefgrootte)
k = aantal voorspellers

Regressiegewichten in de meervoudige regressie formule geven aan hoeveel de voorspelde waarde van Y
verandert als de X-variabele met 1 eenheid toeneemt.
Het verschil tussen de voorspelde waarde van Y en de werkelijke waarde van Y, wordt het residu genoemd.
De regressielijn wordt zo gekozen dat deze residuen zo klein mogelijk zijn, zodat we een zo nauwkeurig
mogelijke voorspelling van de populatie kunnen doen op basis van de steekproef: kleinste kwadranten
methode. Uit de volgende formule wil je dus een zo klein mogelijke waarde: ΣNi=1(Yi - Y^i)2 = ΣNi=1 * e2

Gestandaardiseerde regressiegewichten β: deze waarde geeft aan hoeveel standaardafwijkingen Y verandert
als X met 1 standaardafwijking toeneemt. Bij het standaardiseren verdwijnt de constante.
Het voordeel van β’s ten opzichte van b’s is dat deze wel direct met elkaar vergeleken kunnen worden. Bij b’s
zijn ze afhankelijk van de eenheid waarmee X gemeten wordt.
Het nadeel van β’s in plaats van b’s is dat ze afhankelijk zijn van de standaardafwijking van onze steekproef.
BDI = β1X1st + β2X2st

Je kan een regressievergelijking op stellen met behulp van de regressiegewichten uit SPSS uit de tabel
‘coefficients’.
Y^ = b0 + b1X1 + b2X2 + b3X3 + … + bkXk
→ dit wordt heel letterlijk uitgeschreven de volgende waardes:
Y^ = Gradepointaverage^
b0 = de constante onder ‘unstandardized B’
bkXk = per ding dat onder constante staat en dan de waarde onder ‘unstandardized B’

Semi-partiële correlatie: de correlatie tussen X en Y zonder de overlappende correlatie, je evalueert de
individuele voorspellers. Als we dit kwadrateren krijgen we de uniek verklaarde variantie van de voorspeller:

€9,16

Krijg toegang tot het volledige document:

100% tevredenheidsgarantie

Direct beschikbaar na je betaling

Lees online óf als PDF

Geen vaste maandelijkse kosten

Maak kennis met de verkoper

VicWijk

1,0

(1)

Maak kennis met de verkoper

VicWijk Universiteit Leiden

Bekijk profiel

Volgen

Verkocht

Lid sinds

2 jaar

Aantal volgers

Documenten

Laatst verkocht

2 weken geleden

1,0

1 beoordelingen

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper VicWijk. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €9,16. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews) Afgelopen 30 dagen zijn er 43040 samenvattingen verkocht Opgericht in 2010, al 15 jaar dé plek om samenvattingen te kopen

Samenvatting - Multivariate data analyse Universiteit Leiden (6462PS009Y)

Geschreven voor

Documentinformatie

Onderwerpen

Voorbeeld van de inhoud

Meer vakken binnen Universiteit Leiden (UL) > Psychologie

Maak kennis met de verkoper

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Niet tevreden? Kies een ander document

Betaal zoals je wilt, start meteen met leren

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Tevredenheidsgarantie: hoe werkt dat?

Van wie koop ik deze samenvatting?

Zit ik meteen vast aan een abonnement?

Is Stuvia te vertrouwen?