100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.2 TrustPilot
logo-home
Class notes

Statistiek III - College 4

Rating
-
Sold
-
Pages
16
Uploaded on
18-03-2021
Written in
2020/2021

Aantekeningen College 4 Statistiek 3 (bachelor psychologie Groningen)

Institution
Course










Whoops! We can’t load your doc right now. Try again or contact support.

Written for

Institution
Study
Course

Document information

Uploaded on
March 18, 2021
Number of pages
16
Written in
2020/2021
Type
Class notes
Professor(s)
Edith van krimpen
Contains
College 4

Subjects

Content preview

College 4

Logistische regressie




In een lineair regressiemodel zijn de onafhankelijke variabelen continue variabelen of
codevariabelen. Maar de afhankelijke variabele y moet een continue variabele zijn.
Wat als we een niet-continue variabele willen voorspellen?

Dichotome y:



Voorbeelden:
- Het effect van studietijd op het wel of niet halen van een tentamen
- Het effect van het roken van een aantal sigaretten op het wel of niet krijgen van kanker
- De relatie tussen het aantal rijlessen en het wel of niet halen van het rij-examen
1 = het gebeurt wel, 0 = het gebeurt niet
Dit kan allemaal ook in de context van meerdere onafhankelijke variabelen.

Vraag: als je een codevariabele hebt (met waarde 0 of 1), welke van de onderstaande opties is
correct?
a) Multipele lineaire regressie is niet mogelijk
b) Logistische regressie moet altijd gebruikt worden
c) Multipele lineaire regressie kan gebruikt worden als de DV (y) een codevariabele is
d) Multipele lineaire regressie kan gebruikt worden als de IV (x) een codevariabele is

Voorbeeld: tentamenresultaten
252 psychologiestudenten namen deel aan de eerste tentamenkansen van statistiek 1a en statistiek
1b. Kunnen we het wel/niet halen van stat1B voorspellen met de score op stat1A?
Onafhankelijke variabele = cijfer op stat1A
Afhankelijke variabele = wel/niet stat1B voldoende

,De data:




Dus van de studenten die een 6 hebben gehaald op stat1A, zijn er 22 die stat1B niet halen en 39 die
stat1B wel halen.
Er lijkt een relatie te zijn:




Als we hier een scatterplot van maken:




De onafhankelijke variabele staat op de horizontale as, de afhankelijke variabele staat op de verticale
as. De punten liggen op 0 of 1, want er zijn maar twee mogelijke uitkomsten van de y-variabele.
Punten die dikker zijn komen vaker voor. Maar dit plaatje zegt verder niet zo veel.

Maar hoe moeten we dit modelleren?
Een lineair regressiemodel is niet geschikt.
geeft de volgende resultaten:

, Problemen:


Hoe moeten we dit interpreteren?
Je zou kunnen zeggen dat we de kans voorspellen, dus als iemand een 6 haalt op stat1A is de kans op
het halen van stat1B 66%. Maar zoals je ziet werkt dat niet voor als iemand een 10 heeft gehaald, je
kan geen kans van 111% hebben.




Dus als Y dichotoom is, is het gemiddelde van variabele Y de kans op succes. Want als je kijkt naar
dichotome data en je heb het over gemiddelde, dan heb je het eigenlijk over proporties of kansen.
Dus: de gemiddelde waarde Y is de kans op succes.
Wat we dus eigenlijk doen is kansen voorspellen.




Als je het hebt over kansen moet er een waarde uitkomen tussen 0 en 1. Dus het blijft nog steeds
problematisch.
Zie het spreidingsdiagram:




Er is sprake van ernstige schending van de assumpties. De verdeling is niet-lineair en de residuen zijn
duidelijk niet willekeurig verdeeld (ze zijn niet onafhankelijk van x) en de variantie is niet gelijk
gespreid (geen homoscedasticiteit).




Het lineaire regressiemodel is ongeschikt als Y dichotoom is (0-1 scoring), want er wordt niet voldaan
aan de assumpties van homoscedasticiteit en normaliteit van residuen. De onafhankelijkheid van de
waarnemingen kan kloppen maar de onafhankelijkheid van de residuen is geschonden.
$3.61
Get access to the full document:

100% satisfaction guarantee
Immediately available after payment
Both online and in PDF
No strings attached


Also available in package deal

Get to know the seller

Seller avatar
Reputation scores are based on the amount of documents a seller has sold for a fee and the reviews they have received for those documents. There are three levels: Bronze, Silver and Gold. The better the reputation, the more your can rely on the quality of the sellers work.
femkebvanrijn Rijksuniversiteit Groningen
Follow You need to be logged in order to follow users or courses
Sold
173
Member since
6 year
Number of followers
127
Documents
75
Last sold
2 weeks ago

4.2

22 reviews

5
9
4
11
3
1
2
0
1
1

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions