100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.2 TrustPilot
logo-home
Summary

Samenvatting Toegepaste Biostatistiek

Rating
-
Sold
-
Pages
17
Uploaded on
11-12-2025
Written in
2025/2026

Dit document is een uitgebreide samenvatting van belangrijke statistische methoden die gebruikt worden in de biostatistiek. Het behandelt onder meer regressie- en correlatieanalyse (zowel eenvoudig als meervoudig), multisample-interferentie zoals ANOVA, epidemiologische studie­opzetten en maten van associatie, logistische regressie, analyse van longitudinale data en methoden voor het analyseren van persoon-tijd data en survivalanalyses. Formules, hypothesetesten, interpretaties en toepassingsvoorwaarden worden bondig en systematisch besproken. (Bijna) Alle testen & formules in deze samenvatting staan in het formularium!

Show more Read less
Institution
Course










Whoops! We can’t load your doc right now. Try again or contact support.

Written for

Institution
Study
Course

Document information

Uploaded on
December 11, 2025
Number of pages
17
Written in
2025/2026
Type
Summary

Subjects

Content preview

Toegepaste biostatistiek
ALLE FORMULES EN TESTEN STAAN IN HET FORMULARIUM


1.​ Regressie & correlatie methoden
Introductie
Eenvoudige regressie = 2 verschillende variabelen in dezelfde sample zijn gerelateerd
Meervoudige regressie = de relatie tussen meer dan 2 variabelen worden tegelijk in rekening gebracht

Algemene concepten
x = oorzaak
→ we willen de waarde van y voorspellen op basis van de gekende waarde voor x

E(y|x) = α + βx
→ α = intercept = y-waarde als x=0
→ β = hellingsgraad = rico
→ x = onafhankelijke variabele
→ y = afhankelijke variabele
→ hieruit komt een rechte die het best overeenkomt met alle punten van de dataset
​ → kan al vanaf 3 punten

y = α + βx zal niet juist zijn voor elk datapunt
⇒ foutenterm e = verschil tussen de voorspelde waarde & de werkelijke waarde
⇒ y = α + βx + e
→ we veronderstellen dat e normaal verdeeld is met gemiddelde = 0 & een variantie σ²
​ → gemiddelde = 0 ⇒ de top bevindt zich op de y-as = we maken even veel positieve als negatieve
fouten
​ → σ² = gemiddelde afwijking van de foutentermen ten opzichte van de werkelijke waarden
​ ​ → zegt hoe goed het model werkt: hoe lager de variantie, hoe beter het model

Method of least squares
Least-square line = rechte die y = α + βx die de som van de gekwadratiseerde afstanden van de werkelijke
waarden tot de rechte minimaliseerd
𝑛
→ S = ∑ di²
𝑖=1

Lxx = de gecorrigeerde som van kwadraten voor x
𝑛
→ ∑ (𝑥𝑖 − 𝑥)²
𝑖=1


Lyy = de gecorrigeerde som van kwadraten voor y
𝑛
→ ∑ (𝑦𝑖 − 𝑦)²
𝑖=1


Lxy = de gecorrigeerde som van het kruisproduct

, 𝑛
→ ∑ (𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦)
𝑖=1


We maken een schatting van de least-square line door a & b uit y= a + bx uit te rekenen
→ b= Lxy/Lxx
→ a = 𝑦 − 𝑏𝑥

y = a + bx wordt ook de geschatte regressierechte of regressierechte genoemd

Interferenties over parameters van regressierechten
Residuele component = error component = e = het verschil tussen het punt op de rechte & de werkelijke
waarde
Regressie component = het verschil tussen het punt op de rechte & de gemiddelde waarde voor de variabele

We willen de regressie component zo
groot mogelijk & de residuele
component zo klein mogelijk
⇒ significant resultaat




Total SS = de som van de regressie & de residuele component
𝑛
→ Lyy = ∑ (𝑦𝑖 − 𝑦)² = Reg SS + Res SS
𝑖−1
Reg SS = de som van alle regressie componenten
𝑛
→ ∑ (𝑦𝑖 − 𝑦)² = L²xy/Lxx
𝑖=1
Res SS = de som van alle residuele componenten
𝑛
→ ∑ (𝑦𝑖 − 𝑦𝑖)² = Lyy - L²xy/Lyy
𝑖=1


F-test voor simpele lineaire regressie
Reg MS = Reg SS/k
→ k = aantal predictor variabelen = vrijheidsgraad
Res MS = Res SS/(n-k-1)
→ n = steekproefgrootte

F-test maakt gebruik van de F-verderling

, H0: β = 0: er is geen statistisch significant effect
H1: β ≠ 0: er is een statistisch significant effect
𝑛
∑ (𝑦𝑖−𝑦)²
𝑖=1
𝑅𝑒𝑔 𝑀𝑆 𝑅𝑒𝑔 𝑆𝑆/𝑘 𝑘
F = 𝑅𝑒𝑠 𝑀𝑆 = 𝑅𝑒𝑠 𝑠𝑠/ (𝑛−𝑘−1)
= 𝑛
∑ (𝑦𝑖−𝑦𝑖)²
𝑖=1
𝑛−𝑘−1


→ f = reg ms/res ms (per punt)

Als f > F dan verwerpen we H0
Als f ⩽ F dan accepteren we H0

OF we gebruiken de p-waarde
→ statistisch significant als p < 0,05

Grafiek voor k = 1




Samenvattende resultaten in statistische output:




R² = R-squared = samenvattende meting van de goedheid van het model
= Reg SS/Total SS
= proportie van de variantie van y dat door het model, dus door de predictor variabelen in het model,
verklaard wordt
R146,17
Get access to the full document:

100% satisfaction guarantee
Immediately available after payment
Both online and in PDF
No strings attached

Get to know the seller
Seller avatar
biomeds
4,0
(1)

Get to know the seller

Seller avatar
biomeds Universiteit Gent
Follow You need to be logged in order to follow users or courses
Sold
8
Member since
6 months
Number of followers
0
Documents
13
Last sold
1 month ago

4,0

1 reviews

5
0
4
1
3
0
2
0
1
0

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their exams and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can immediately select a different document that better matches what you need.

Pay how you prefer, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card or EFT and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions