Garantie de satisfaction à 100% Disponible immédiatement après paiement En ligne et en PDF Tu n'es attaché à rien 4.2 TrustPilot
logo-home
Notes de cours

H11 Regressie en Correlatie methoden

Note
-
Vendu
-
Pages
22
Publié le
19-02-2023
Écrit en
2022/2023

Dit zijn mijn aantekeningen bij hoofdstuk 11. Heel handig om zelf een samenvatting van te maken!









Oups ! Impossible de charger votre document. Réessayez ou contactez le support.

Infos sur le Document

Publié le
19 février 2023
Nombre de pages
22
Écrit en
2022/2023
Type
Notes de cours
Professeur(s)
Vercauteren
Contient
Hoofdstuk 11

Sujets

Aperçu du contenu

Hoofdstuk 11: Regressie en Correlatie methoden
11.1 Introductie
In dit hoofdstuk gaan we verbanden zoeken tussen variabelen en we gaan kijken of deze verbanden
er zijn door toeval of dat het authentieke verbanden zijn, ook wel significante verbanden genoemd.
Ook gaan we een multiple regressie doen, waarbij we het verband onderzoeken tussen meer dan
twee variabelen. We werken met lineaire regressie, wat betekent dat onze x-variabelen nooit in een
exponent wordt gezet (y = ax + b). De x-variabele wordt ook wel de predictor variabele genoemd.
Deze kan continue zijn (bijvoorbeeld lichaamsgewicht, er bestaat een oneindig aantal mogelijkheden
en/of oplossingen voor), of deze kan categorisch zijn (gegevens die volgens de categorie zo zijn,
bijvoorbeeld de oogkleur van iemand). De y-variabele zal altijd continue zijn.

11.2 General concepts
We gaan werken met een voorbeeld uit de verloskunde: We volgen 31 zwangere vrouwen op die
bijna aan het einde van hun zwangerschap
zijn. Het hormoon niveau van oestriol wordt
bepaald per 24 uur (= x-variabele). Dit
hormoonniveau wordt in verband gebracht
met het geboortegewicht (= y-variabele)
van de baby. We gaan zoeken naar een
correlatie tussen deze twee. Met andere
woorden: Het geboortegewicht willen we
graag voorspellen op basis van het
hormoonniveau. Wanneer we deze
metingen uitzetten in een scatterplot met
op de x-as de hormoonniveaus en op de y-
as het geboortegewicht, zien we een
puntenwolk. We willen hierdoor een rechte trekken, de regressielijn: y=α + βx , waarbij:
  is de intercept, de hoogte waarop de rechte lijn de y-as snijdt
  is de slope, ofwel de richtingscoëfficiënt, ofwel de hellingsgraad
 x is de independent variabele (de onafhankelijke variabele) ofwel de predictor variabele. Dit
meet je en is onafhankelijk bepaald
 y is de dependent variabele (de afhankelijke variabele), omdat y afhangt van x
Met deze regressielijn willen we voorspellingen doen van het geboortegewicht. Wanneer je kijkt in
de grafiek bij 12 mg/24hr oestriol zien we een geboortegewicht van 27 gram. Echter, de regressielijn
voorspelt een hoger gewicht! Dit zal een kleine fout zijn. Dus, de meting bij de moeder en de
voorspelling van de lijn is niet altijd hetzelfde! De regressielijn klopt dus niet per se voor iedere
moeder. Daarom moeten we een ‘error’ (e) toevoegen aan de formule: y=α + βx +e . Zoals je kan
zien in het figuur rechts, kunnen er voor iedere x-waarde meerdere punten
zijn. Dit komt omdat er verschillende moeders kunnen zijn met hetzelfde
hormoonniveau, maar dat de baby’s een ander geboortegewicht hebben.
Dit zijn de zwarte puntjes in de grafiek. Al deze zwarte puntjes wijken af
van de lineaire regressielijn, deze afwijking is de error (e) in de formule. De
fout e is normaal verdeeld (dus heeft een normale distributie) met een
gemiddelde en een variantie (2, zie curve links van de zwarte puntjes). Dit
is de verdeling die we bekomen voor de fout. De fouten voor de x-waarden
zijn allemaal fouten van de lineaire regressielijn. Echter, symmetrisch
gezien zal boven/onder de regressielijn dezelfde fout zitten, dit leidt dus tot de normale verdeling.
Maar, dit moeten we gaan checken, voordat we verder mogen gaan met de regressie. Ook moeten
we nagaan of de spreiding van de normale verdelingen even breed zijn, ofwel dat ze een constante
variantie hebben, dit noemen we homostedasticiteit. Wanneer er geen constante variantie aanwezig
is, spreken we van heterostedasticiteit.


Pagina 1 van 22

Faites connaissance avec le vendeur

Seller avatar
Les scores de réputation sont basés sur le nombre de documents qu'un vendeur a vendus contre paiement ainsi que sur les avis qu'il a reçu pour ces documents. Il y a trois niveaux: Bronze, Argent et Or. Plus la réputation est bonne, plus vous pouvez faire confiance sur la qualité du travail des vendeurs.
lisaankersmit Katholieke Universiteit Leuven
Voir profil
S'abonner Vous devez être connecté afin de suivre les étudiants ou les cours
Vendu
55
Membre depuis
4 année
Nombre de followers
18
Documents
169
Dernière vente
1 mois de cela

5,0

14 revues

5
14
4
0
3
0
2
0
1
0

Pourquoi les étudiants choisissent Stuvia

Créé par d'autres étudiants, vérifié par les avis

Une qualité sur laquelle compter : rédigé par des étudiants qui ont réussi et évalué par d'autres qui ont utilisé ce document.

Le document ne convient pas ? Choisis un autre document

Aucun souci ! Tu peux sélectionner directement un autre document qui correspond mieux à ce que tu cherches.

Paye comme tu veux, apprends aussitôt

Aucun abonnement, aucun engagement. Paye selon tes habitudes par carte de crédit et télécharge ton document PDF instantanément.

Student with book image

“Acheté, téléchargé et réussi. C'est aussi simple que ça.”

Alisha Student

Foire aux questions