Samenvatting tentamen OEI
BELANGRIJK IN R
? FUNCTIE
<TAB> FUNCTIE
→ hiermee kan je de argumenten van de functies opzoeken en de helpfile in R
(?functie)
Oefenvragen introductie:
1. De standaarddeviatie is de gemiddelde afwijking van het gemiddelde.
2. Het betrouwbaarheidsinterval voor een schatter wordt breder naarmate de
standaardfout toenoeemt. Het betrouwbaarheidsinterval wordt smaller
naarmate de betrouwbaarheid van een schatter toeneemt.
Samenvatting tentamen OEI 1
, 3. De standaardfout geeft een indicatie van de precisie van een schatting
4. Een dummy variabele is een dichotome variabele met 0/1 codering
5. In een meervoudige lineaire regressieanalysem wat is de range van
waardes die de verklaarde variantie (R^2) kan aannemen: Deze varieert
tussen 0 en 1: hoe dichter bij de 1, hoe meer verklaard wordt.
6: Verschillende variabelen
intervening variabele (mediator): een variabele die het mechanisme
beschrijft waardoor een onafhankelijke variabele (X) invloed heeft op een
afhankelijke variabele (Y). Het is een tussenstap in het causaal pad van X
naar Y. Stel dat opleiding (X) invloed heeft op inkomen (Y), maar dit effect
wordt gemedieerd door vaardigheden (de interveniërende variabele). Dus,
opleiding beïnvloedt vaardigheden, en vaardigheden beïnvloeden
vervolgens het inkomen.
confounding variabele (verstorend): Een confounding variabele is een
externe variabele die zowel de onafhankelijke als de afhankelijke variabele
beïnvloedt. Deze variabele kan een vertekend verband veroorzaken tussen
de onafhankelijke en afhankelijke variabelen. Stel dat je onderzoekt of
roken (X) het risico op longziekten (Y) verhoogt, maar er is een leeftijd (Z)
die zowel roken als longziekten beïnvloedt.
moderator variabele: Een moderator is een variabele die de sterkte of
richting van het effect van de onafhankelijke variabele op de afhankelijke
variabele verandert. Een moderator geeft aan wanneer of voor wie de
relatie tussen twee variabelen sterker of zwakker is. Het is dus een
veranderende factor. In het verband tussen werkstress (X) en gezondheid
(Y), kan de ondersteuning van collega's (Z) als een moderator fungeren. Als
je veel steun hebt, kan de negatieve invloed van werkstress op gezondheid
kleiner zijn dan voor mensen zonder veel steun.
lurking variabele: Een lurking variabele is een variabele die de relatie
tussen twee andere variabelen beïnvloedt, maar die niet gemeten of
geobserveerd wordt. Het is vaak een verborgen of niet-inbegrepen
variabele die de schijnbare relatie tussen twee variabelen veroorzaakt. Dit
wordt soms gezien als een soort "verborgen confounder". Stel dat je een
positieve correlatie vindt tussen aantal brandweermannen en de grootte
van een brand. De lurking variabele zou de ernst van de brand kunnen zijn,
Samenvatting tentamen OEI 2
, aangezien grotere branden zowel meer brandweermannen vereisen als
groter zijn, maar de grootte van de brand is niet gemeten.
In het kort:
Intervening: verklaart hoe of waarom een relatie tussen twee andere variabelen
bestaat (mediator)
Condounding variabele: een externe factor die zowel de onafhankelijke als
afhankelijke variabele beinvloedt en de resultaten vertekent
Moderator variabele: verandert de sterkte of richting van het effect van de
onafhankelijke variabele op de afhankelijke variabele.
Lurking variabele: een niet-gemeten variabele die de relatie tussen twee andere
variabelen beinvloedt en vaak verborgen is voor de onderzoeker
7. Als aan een lineaire regressie van y op X1 een tweede predictor X2 wordt
toegevoegd die niet correleert met X1, dan zal de regressiecoefficient van
X1 kleiner worden
8. Hieronder is de formule van een multiple regressie van Y weergegeven met
twee onafhankelijke variabelen (X1 en X2). y = a + b1x1 + b2x2 Stel, je wilt
weten of X1 een significante invloed heeft op Y, gecontroleerd voor het
effect van X2 op Y (“X2 wordt constant gehouden”). Wat moet je dan in dit
geval toetsen? Je moet dan als onderzoeker toetsen of de waarde van B1
significant afwijkt van 0
9. Hieronder staat de formule van een enkelvoudig regressiemodel van Y.
Y = a + b1 * X1 Wat betekent de “a” in de formule? En welke waarde neemt
deze aan?
Dit is het intercept, dit is de waarde van Y als X1 gelijk is aan 0
10. Stel je hebt in R een dataframe dat df heeft, wat doet het volgende script
dan? df[2:5,] ← NA —> Het geeft rijen 2 tot en met 5 allemaal missende
waardes
11. Wat doet de functie str() in R? Het geeft veel informatie over een object,
bijvoorbeeld het type en mogelijke attributen
12. Stel dat we het een hypothese over de invloed van X op Y zo streng
mogelijk zouden willen toetsen (de kans zo klein mogelijk willen maken dat
Samenvatting tentamen OEI 3
BELANGRIJK IN R
? FUNCTIE
<TAB> FUNCTIE
→ hiermee kan je de argumenten van de functies opzoeken en de helpfile in R
(?functie)
Oefenvragen introductie:
1. De standaarddeviatie is de gemiddelde afwijking van het gemiddelde.
2. Het betrouwbaarheidsinterval voor een schatter wordt breder naarmate de
standaardfout toenoeemt. Het betrouwbaarheidsinterval wordt smaller
naarmate de betrouwbaarheid van een schatter toeneemt.
Samenvatting tentamen OEI 1
, 3. De standaardfout geeft een indicatie van de precisie van een schatting
4. Een dummy variabele is een dichotome variabele met 0/1 codering
5. In een meervoudige lineaire regressieanalysem wat is de range van
waardes die de verklaarde variantie (R^2) kan aannemen: Deze varieert
tussen 0 en 1: hoe dichter bij de 1, hoe meer verklaard wordt.
6: Verschillende variabelen
intervening variabele (mediator): een variabele die het mechanisme
beschrijft waardoor een onafhankelijke variabele (X) invloed heeft op een
afhankelijke variabele (Y). Het is een tussenstap in het causaal pad van X
naar Y. Stel dat opleiding (X) invloed heeft op inkomen (Y), maar dit effect
wordt gemedieerd door vaardigheden (de interveniërende variabele). Dus,
opleiding beïnvloedt vaardigheden, en vaardigheden beïnvloeden
vervolgens het inkomen.
confounding variabele (verstorend): Een confounding variabele is een
externe variabele die zowel de onafhankelijke als de afhankelijke variabele
beïnvloedt. Deze variabele kan een vertekend verband veroorzaken tussen
de onafhankelijke en afhankelijke variabelen. Stel dat je onderzoekt of
roken (X) het risico op longziekten (Y) verhoogt, maar er is een leeftijd (Z)
die zowel roken als longziekten beïnvloedt.
moderator variabele: Een moderator is een variabele die de sterkte of
richting van het effect van de onafhankelijke variabele op de afhankelijke
variabele verandert. Een moderator geeft aan wanneer of voor wie de
relatie tussen twee variabelen sterker of zwakker is. Het is dus een
veranderende factor. In het verband tussen werkstress (X) en gezondheid
(Y), kan de ondersteuning van collega's (Z) als een moderator fungeren. Als
je veel steun hebt, kan de negatieve invloed van werkstress op gezondheid
kleiner zijn dan voor mensen zonder veel steun.
lurking variabele: Een lurking variabele is een variabele die de relatie
tussen twee andere variabelen beïnvloedt, maar die niet gemeten of
geobserveerd wordt. Het is vaak een verborgen of niet-inbegrepen
variabele die de schijnbare relatie tussen twee variabelen veroorzaakt. Dit
wordt soms gezien als een soort "verborgen confounder". Stel dat je een
positieve correlatie vindt tussen aantal brandweermannen en de grootte
van een brand. De lurking variabele zou de ernst van de brand kunnen zijn,
Samenvatting tentamen OEI 2
, aangezien grotere branden zowel meer brandweermannen vereisen als
groter zijn, maar de grootte van de brand is niet gemeten.
In het kort:
Intervening: verklaart hoe of waarom een relatie tussen twee andere variabelen
bestaat (mediator)
Condounding variabele: een externe factor die zowel de onafhankelijke als
afhankelijke variabele beinvloedt en de resultaten vertekent
Moderator variabele: verandert de sterkte of richting van het effect van de
onafhankelijke variabele op de afhankelijke variabele.
Lurking variabele: een niet-gemeten variabele die de relatie tussen twee andere
variabelen beinvloedt en vaak verborgen is voor de onderzoeker
7. Als aan een lineaire regressie van y op X1 een tweede predictor X2 wordt
toegevoegd die niet correleert met X1, dan zal de regressiecoefficient van
X1 kleiner worden
8. Hieronder is de formule van een multiple regressie van Y weergegeven met
twee onafhankelijke variabelen (X1 en X2). y = a + b1x1 + b2x2 Stel, je wilt
weten of X1 een significante invloed heeft op Y, gecontroleerd voor het
effect van X2 op Y (“X2 wordt constant gehouden”). Wat moet je dan in dit
geval toetsen? Je moet dan als onderzoeker toetsen of de waarde van B1
significant afwijkt van 0
9. Hieronder staat de formule van een enkelvoudig regressiemodel van Y.
Y = a + b1 * X1 Wat betekent de “a” in de formule? En welke waarde neemt
deze aan?
Dit is het intercept, dit is de waarde van Y als X1 gelijk is aan 0
10. Stel je hebt in R een dataframe dat df heeft, wat doet het volgende script
dan? df[2:5,] ← NA —> Het geeft rijen 2 tot en met 5 allemaal missende
waardes
11. Wat doet de functie str() in R? Het geeft veel informatie over een object,
bijvoorbeeld het type en mogelijke attributen
12. Stel dat we het een hypothese over de invloed van X op Y zo streng
mogelijk zouden willen toetsen (de kans zo klein mogelijk willen maken dat
Samenvatting tentamen OEI 3