100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.2 TrustPilot
logo-home
Summary

Samenvatting voorkennis + Lineaire regressie

Rating
-
Sold
-
Pages
35
Uploaded on
15-04-2023
Written in
2022/2023

Dit is een samenvatting aan de hand van lesnotities van 2023 en de theorieslides (lesopname voorkennisclip en les herbekeken). Les gegeven door D. Fierens - Van der Elst (en in lesopname ook N. Struyf).

Institution
Course















Whoops! We can’t load your doc right now. Try again or contact support.

Written for

Institution
Study
Course

Document information

Uploaded on
April 15, 2023
File latest updated on
April 17, 2023
Number of pages
35
Written in
2022/2023
Type
Summary

Subjects

Content preview

Onderzoeksmethodologie en statistiek 3:
Samenvatting: Onderdeel statistiek
2. Lineaire regressie

, Lineaire regressie
Voorkennis opfrissen:

Voorkennis correlatie:
Uitleg aan de hand van observationeel, prospectief cohort onderzoek:


Gegevens:
- populatie: 100 personen
- studie: correlatie tussen cholesterol en een aantal determinanten zoals leeftijd,
geslacht, alcoholgebruik…


Berekening aan de hand van SPSS:
We berekenen de correlatie tussen de variabele ‘leeftijd’ en ‘cholesterolgehalte’.
→ Dit doen we met behulp van een correlatiecoëfficiënt.

Parametrisch testen? = gebruik maken van de correlatiecoëfficiënt van Pearson.
- Pearson: geschikt voor normaal verdeelde variabelen op ratio niveau
- gebruikt de meetwaarden

Niet-parametrisch testen? = gebruik maken van de correlatiecoëfficiënt van Spearman.
- Spearman: geschikt voor niet-normaal verdeelde variabelen op ratio en ordinaal
niveau
- gebruikt de rangvolgorde (rangnummers)

Input scherm: Databank SPSS:
analyze → correlate → bivariate

2 variabelen selecteren + aanduiden welke
correlatiecoëfficiënt er moet berekend
worden.
- Je kan best zowel Pearson als
Spearman aanduiden.

We gaan tweezijdig testen.

‘Flag significant correlations’ is standaard
aangevinkt. De significante correlaties
Ingevuld:
worden in de output dan aangegeven met
een sterretje.
- 1 sterretje geeft weer dat de waarde
significant is op 5%
significantieniveau
- 2 sterretjes geven weer dat de
waarde significant is op 1%
significantieniveau

, Wanneer je bij het vorige scherm op OK hebt
gedrukt, verkrijg je een outcome.

Je krijgt een uitkomst voor de Pearson en de
Spearman correlatiecoëfficiënt.

H0: correlatiecoëfficiënt r = 0
⇒ Er is geen correlatie (lineair verband)
tussen beide variabelen.

Vermits de p-waarde bij zowel Spearman als
bij Pearson kleiner is dan 0,05.
→ (Indien p > 0,05: r = 0 dus geen
correlatie)
→ (Indien p ≤ 0,05 kan de waarde van r
geïnterpreteerd worden)
- wanneer je dubbelklikt op de dit getal
krijg je de specifieke waarde met 6
decimalen
Merk op dat wanneer SPSS Pearson of
Spearman correlatie uitvoert, de info Pearson correlatiecoëfficiënt interpreteren:
altijd dubbel wordt weergegeven. = 0,372 = zwakke correlatie




Spearman correlatiecoëfficiënt interpreteren:
= 0,395 = zwakke correlatie




Omdat we de optie ‘flag significant
correlations’ hebben aangevinkt krijgen we
onder de outcome-tabellen een opmerking.
Er staan 2 sterretjes bij, wat dus wilt zeggen
dat de p-waarde kleiner is dan 1%.
We gaan ervan uit dat de cholesterolconcentratie normaal verdeeld is, want we hebben
voldoende metingen van 100 proefpersonen. Hierdoor gaan we de pearson
correlatiecoëfficiënt verkiezen.
⇒ verkies altijd de parametrische test over de niet-parametrische test
= testen met meer Power
- (= vermogen van toets om effect op te sporen als het effect ook werkelijk bestaat)
- (= de kans dat het zal leiden tot een terechte verwerping van de nulhypothese)

,Voorkennis spreidingsdiagram en inleiding tot lineaire regressie
Wanneer de Pearson correlatiecoëfficiënt aangeeft dat er een significante correlatie is en we
kunnen spreken over een lineair verband tussen beide variabelen, kunnen we dit verband
voorspellen.

We kunnen het verband voorspellen met een lineaire regressie.
We kunnen de lineaire regressie en eventueel de correlatie visueel weergeven in een
spreidingsdiagram.


Berekening aan de hand van SPSS:

Databank SPSS:
Graphs → chartbuilder → scatter
(spreidingsdiagram) → dubbelklik op
simple scatter

Assen:
- Op de X-as: leeftijd (in jaren) =
onafhankelijke variabele
- Op de Y-as: cholesterol (in
mmol/liter) = afhankelijke variabele




Outcome: grafiek
→ lineair verband is nog niet goed
waarneembaar, want we hebben een
brede puntenwolk

Statistisch gezien (kijk voorkennisclip
hierboven waarbij p-waarde kleiner is dan
1%) hebben we een significant lineair
verband. Dit wel op basis van een zwakke,
positieve correlatie.


→ dubbelklikken op de grafiek en ‘add fit
line at total’

, Je kan een rechte trekken door de punten:
Vervolgens krijg je een rechte die door de
puntenwolk loopt en het bijhorende
functievoorschrift.

Aan de hand van het functievoorschrift kan
je de cholesterolconcentratie voor een
nieuw proefpersoon voorspellen.
→ je geeft 1 ontbrekende waarde (vb:
leeftijd) in in het functievoorschrift en
bekomt vervolgens de andere variabele
(vb: cholesterolconcentratie)
Naast de grafiek wordt een
determinatiecoëfficiënt weergegeven.
- We kunnen dat de
richtingscoëfficiënt 0,02 aflezen
→ positief getal wilt zeggen dat het
een stijgende rechte is en een
positieve correlatie

Interpretatie: voor ieder
leeftijdsverschil van 1 jaar (= per
jaar dat je ouder wordt) verschilt de
cholesterolconcentratie 0,02
mmol/liter.

- De constante 3,86 in het snijpunt
met de Y-as = dit zou de verwachte
cholesterolconcentratie zijn bij een
leeftijd van 0 jaar

- De determinatiecoëfficiënt R² wordt
naast de grafiek weergegeven.
→ dit is in de statistiek een maat
voor het deel van de variabiliteit dat
wordt verklaard door het statistisch
model
→ er bestaan verschillende
definities, maar in het geval van
lineaire regressie is er een
eenduidige definitie: bij
enkelvoudige lineaire regressie is
de determinatiecoëfficiënt R² gelijk
aan het kwadraat van de
correlatiecoëfficiënt, deze
determinatiecoëfficiënt geeft aan
welk gedeelte van de variatie in de
ene variabele door de andere
wordt verklaard = verklaarde
variantie

,Meer informatie omtrent de
determinatiecoëfficiënt:




→ de correlatiecoëfficiënt van Pearson
kan variëren tussen min 1 en 1
→ de determinatiecoëfficiënt kan variëren
tussen 0 en 1
- Hoe groter de
determinatiecoëfficiënt, dus hoe
dichter bij 1, hoe krachtiger het
verband tussen de variabelen

In het voorbeeld is de R² = 0,138 = 13,8%
= zwak verband tussen leeftijd en
cholesterol

,Regressie

Testen
- Correlatie (Herhaling)
→ Bestaat er een verband tussen 2 dingen → onderzoeken (minstens ordinaal)
- vb: heeft studiejaar iets te maken met lengte
→ outcome: er is wel/ geen verband
- Voorbeeld 1: enkelvoudige lineaire regressie
- Voorbeeld 2: meervoudige lineaire regressie
- Voorbeeld 3: meervoudige lineaire regressie met dummy variabelen
- Voorbeeld 4: meervoudige lineaire regressie (method enter)
- Voorbeeld 5: (meervoudige) lineaire regressie (method stepwise)

Correlatie of Regressie?
- Correlatie: lineair verband tussen 2 variabelen
→ Is er een verband?
→ Grootte van verband
- Regressie: voorspelling lineair verband tussen 2 variabelen
→ Voorspelling afhankelijke variabele o.b.v. onafhankelijke variabele(n)
- Correlatieberekening voorafgaand aan regressie-analyse om te bepalen welke
variabelen je meeneemt in het regressiemodel.

, Voorbeeld 1:
Correlatie
- Database ‘Voorbeeld 1 Cholesterol’
- Observationeel prospectief cohortonderzoek bij 100 personen
- Bij honderd personen is de relatie onderzocht tussen cholesterol en een aantal
determinanten zoals de leeftijd

Probleemstelling: Welke lineaire relatie bestaat er tussen 2 variabelen?

Onderzoeksvraag: Wat is de lineaire relatie tussen de uitkomstvariabele cholesterol en de
determinant leeftijd?

Parametrisch testen?
- Aantal metingen = 100 (≥ 30) → Parametrisch testen
- Pearson-correlatiecoëfficiënt bepalen
→ Indien niet-parametrisch: Spearman-correlatiecoëfficiënt

Kleinste kwadratenmethode: de best passende lijn wordt gedefinieerd als de lijn waarvoor
geldt dat de gekwadrateerde (verticale) afstand van de individuele observaties tot de lijn zo
klein mogelijk is
$3.86
Get access to the full document:

100% satisfaction guarantee
Immediately available after payment
Both online and in PDF
No strings attached


Also available in package deal

Get to know the seller

Seller avatar
Reputation scores are based on the amount of documents a seller has sold for a fee and the reviews they have received for those documents. There are three levels: Bronze, Silver and Gold. The better the reputation, the more your can rely on the quality of the sellers work.
MyrtheMattheeusen Universiteit Antwerpen
Follow You need to be logged in order to follow users or courses
Sold
107
Member since
2 year
Number of followers
29
Documents
89
Last sold
3 weeks ago

3.3

6 reviews

5
1
4
1
3
3
2
1
1
0

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions