100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
Samenvatting

Samenvatting - Multivariate data analyse Universiteit Leiden (6462PS009Y)

Beoordeling
-
Verkocht
-
Pagina's
23
Geüpload op
01-04-2025
Geschreven in
2023/2024

Complete samenvatting van alle stof voor MVDA. Ik heb hier zelf een 8 mee gehaald!











Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Documentinformatie

Geüpload op
1 april 2025
Aantal pagina's
23
Geschreven in
2023/2024
Type
Samenvatting

Onderwerpen

Voorbeeld van de inhoud

Stappenplan voor analysemethode:
1.​ Welke en hoeveel variabelen zijn er betrokken?
2.​ Hoe willen we onze variabelen toewijzen aan sets? Bestaat de evt tweede set dan uit één of juist uit
meerdere afhankelijke variabelen?
3.​ Wat is het meetniveau van de variabelen? (nominaal, ordinaal, interval)
4.​ Soms aanvullende vragen stellen.

Een between-subjects design stelt ons in staat om verschillende proefpersonen te gebruiken in elk van de
condities.
Een within-subjects design stelt ons in staat om alle proefpersonen in alle condities te gebruiken.

Eén variabele: univariate analyse. (In welke mate ervaren werkende mensen problemen in hun werk?
Twee variabelen: bivariate analyse. (Is er een verschil in de mate waarin mannen en vrouwen problemen ervaren
in hun werk?)
Drie of meer variabelen: multivariate data-analyse (MVDA). (In hoeverre kunnen lichamelijke klachten worden
voorspeld op basis van vijf soorten stress op de werkplek?)

Het uitvoeren van afzonderlijke analyses voor elk van de afhankelijke y variabelen, zou de kans op type 1 fout
(het onterecht verwerpen van de nulhypothese) kunnen vergroten.
Als de vraag niet gaat over voorspellen, maar gewoon over het bekijken van de relatie tussen een aantal
variabelen is er maar 1 set.

Mogelijkheden om onze variabelen toe te wijzen aan sets:
1.​ Alle variabelen worden toegewezen aan één set X. Alle variabelen zijn dan gelijk.
2.​ De variabelen worden verdeeld in twee sets X en Y, waarbij Y slechts één variabele bevat. We kiezen
hiervoor als we een enkele variabele zo nauwkeurig mogelijk willen voorspellen op basis van een
aantal andere variabelen.
3.​ De variabelen worden verdeeld in twee sets X en Y, waarbij Y twee of meer variabelen bevat. We
kiezen hiervoor als we meer dan één variabele zo nauwkeurig mogelijk willen voorspellen op basis van
een aantal andere variabelen.

Meetniveaus:
-​ Nominaal → je wijst nummers toe aan categorieën om ze te onderscheiden. Het ene nummer is niet
meer waard dan het andere nummer.
-​ Ordinaal → beschrijft een rangorde. We kunnen alleen nog niet zeggen wat de waarde is en hoe groot
het verschil tussen de waarden is.
-​ Interval → de verschillen tussen de getallen laten altijd even grote verschillen in de variabelen zien.
(Likertschaal-vragen (zoals: slecht, neutraal, mee eens, niet mee eens, sterk niet mee eens) ook als
interval).
-​ Binair → zo’n variabele heeft twee categorieën.




.



,Week 1

Bij meervoudige regressieanalyse (MRA) hebben we twee sets variabelen, Y en X, waarbij er slechts één
Y-variabele is en meerdere X-variabelen.

Als er twee of meer intervalvariabelen zijn, kunnen we de relatie daartussen weergeven door Pearson correlaties
te berekenen. Dit geeft ons twee soorten informatie over de correlatie:
-​ Teken →
Positieve correlatie: geeft aan dat gemiddeld de ene variabele toeneemt als de andere toeneemt.
Negatieve correlatie: geeft aan dat gemiddeld de ene variabele afneemt als de andere toeneemt.
-​ Sterkte →
Hoe meer een correlatie afwijkt van 0, hoe sterker de correlatie.
Hoe dichterbij -1 of +1 hoe sterker de relatie.
De gekwadrateerde correlatie geeft het aandeel van de gemeenschappelijke variantie van de twee
variabelen aan, wat de hoeveelheid variantie is die gedeeld wordt tussen een set items.

Het belangrijkste verschil tussen een eenvoudige regressieanalyse en een Pearson correlatie is dat een regressie
asymmetrisch is: het voorspellen van X uit Y levert een andere regressievergelijking op dan het voorspellen van
Y uit X.

(Niet voor dit tentamen, wel handig→ formule voor enkelvoudige regressie (ruw): Y = b0 + b1X + e
Y = afhankelijke variabele
X = onafhankelijke variabele
b0 = parameter die geschat moet worden (intercept/constante)
b1 = regressiegewicht, geeft ons informatie over richting en steilheid van de regressielijn
e = fout

Gestandaardiseerde enkelvoudige regressieanalyse: ZY = cZX = eZ met β = sx / sy *b1 = rxy
eZ = foutterm, maar nu in standaarddeviatie-eenheden
De voorspelde waarde van Y ligt altijd dichterbij het gemiddelde dan de waarde van X (tenzij β gelijk is aan 1 of
-1) → regressie naar het gemiddelde)

Bij MRA veronderstellen we ook een soort causaliteit, omdat we van X naar Y gaan. Een MRA geeft ons drie
belangrijke soorten aanvullende informatie:
1.​ Optimale voorspelling van Y uit een combinatie van X variabelen.
2.​ Hoe goed is onze algemene voorspelling?
3.​ Hoe goed is elke afzonderlijke voorspeller?

Meervoudige regressievergelijking: Y = b0 + b1X1 + b2X2 + b3X3 + … + bkXk + e
Y = onze afhankelijke variabele voorspeld door de X variabelen.
b0 = de constante/intercept. De uitkomst van Y als alle X variabelen 0 zijn. (dus waar de lijn de y-as snijdt)
bk = regressiegewicht per variabele, ook wel coëfficiënt.
e = de foutterm.
We kunnen de formule herschrijven als: Y = Y^ + e, waar Y^ = b0 + b1X1 + b2X2 + b3X3 + … + bkXk
Y^ = onze voorspelde waarde van Y. Door dit herschrijven kunnen we de Pearson correlatie definiëren tussen
de voorspelde en waargenomen waarden van Y: R = rYY^

Meervoudige regressie geeft ons een optimale voorspelling van Y. We kunnen het ook gebruiken om te zien hoe
goed onze X variabelen de Y variabele voorspellen.
De hoeveelheid variantie die wordt verklaard door één specifieke variabele, kan worden afgelezen van de
verklaarde variantie.

, Meervoudige correlatie R: geeft de correlatie aan tussen de voorspelde waarden van Y en de werkelijke
waarden van Y. De regressiegewichten worden zo gekozen dat de meervoudige correlatie (R) altijd tussen 0 en 1
ligt en nooit negatief kan zijn.

Proportie verklaarde variantie (VAF) = het aandeel gedeelde variantie tussen Y^ en Y, dit duiden we aan als
hoeveel variantie wordt verklaard door Y. De volgende formule berekent hoeveel variantie wordt verklaard:
R2 = VAF = SSregression / SStotal
=
R2 = VAF = r2Y.12 * (r2Y1 + r2Y2 - 2ry1rY2r - r212)
R2 = r2 (pearson r)
In de ‘Model Summary’ tabel staat ook de R2.
r2Y1 = waarde onder zero-order van de eerste predictor
r2Y21 = part correlations waarde van de tweede predictor
r2Y2 = waarde onder zero-order van de tweede predictor
r2Y12 = part correlations waarde van de eerste predictor

Hoe hoger de R2, hoe beter onze voorspelling als geheel is, dit is de waarde van de steekproef.
We gebruiken de adjusted R2 omdat de hoeveelheid gedeelde variantie in de populatie vaak wordt overschat,
deze waarde ligt dus dichter bij de werkelijke waarde van de populatie. Deze overschatting vindt plaats omdat
de verwachte waarde van R in de steekproef 0 is. De verwachte waarde van R in de populatie zal groter dan 0
zijn, omdat er geen negatieve waarden kunnen zijn.

De adjusted R2 kan ook worden gevonden in de tabel ‘model summary’ of berekend met:
R2adj = 1 - (N-1 / N - k - 1)* (1 - R2)
N = aantal mensen (steekproefgrootte)
k = aantal voorspellers

Regressiegewichten in de meervoudige regressie formule geven aan hoeveel de voorspelde waarde van Y
verandert als de X-variabele met 1 eenheid toeneemt.
Het verschil tussen de voorspelde waarde van Y en de werkelijke waarde van Y, wordt het residu genoemd.
De regressielijn wordt zo gekozen dat deze residuen zo klein mogelijk zijn, zodat we een zo nauwkeurig
mogelijke voorspelling van de populatie kunnen doen op basis van de steekproef: kleinste kwadranten
methode. Uit de volgende formule wil je dus een zo klein mogelijke waarde: ΣNi=1(Yi - Y^i)2 = ΣNi=1 * e2

Gestandaardiseerde regressiegewichten β: deze waarde geeft aan hoeveel standaardafwijkingen Y verandert
als X met 1 standaardafwijking toeneemt. Bij het standaardiseren verdwijnt de constante.
Het voordeel van β’s ten opzichte van b’s is dat deze wel direct met elkaar vergeleken kunnen worden. Bij b’s
zijn ze afhankelijk van de eenheid waarmee X gemeten wordt.
Het nadeel van β’s in plaats van b’s is dat ze afhankelijk zijn van de standaardafwijking van onze steekproef.
BDI = β1X1st + β2X2st

Je kan een regressievergelijking op stellen met behulp van de regressiegewichten uit SPSS uit de tabel
‘coefficients’.
Y^ = b0 + b1X1 + b2X2 + b3X3 + … + bkXk
→ dit wordt heel letterlijk uitgeschreven de volgende waardes:
Y^ = Gradepointaverage^
b0 = de constante onder ‘unstandardized B’
bkXk = per ding dat onder constante staat en dan de waarde onder ‘unstandardized B’

Semi-partiële correlatie: de correlatie tussen X en Y zonder de overlappende correlatie, je evalueert de
individuele voorspellers. Als we dit kwadrateren krijgen we de uniek verklaarde variantie van de voorspeller:

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
VicWijk Universiteit Leiden
Bekijk profiel
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
18
Lid sinds
2 jaar
Aantal volgers
4
Documenten
37
Laatst verkocht
2 weken geleden

1,0

1 beoordelingen

5
0
4
0
3
0
2
0
1
1

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen