100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.2 TrustPilot
logo-home
Summary

Samenvatting Aantekeningen voortgezette biostatistiek 2020

Rating
4.0
(1)
Sold
4
Pages
69
Uploaded on
31-03-2020
Written in
2019/2020

Uitgebreide aantekeningen van het vak 'Voortgezette Biostatistiek' (X_) uit het studiejaar 2019/2020 van de bachelor 'Medische natuurwetenschappen'.

Institution
Course











Whoops! We can’t load your doc right now. Try again or contact support.

Written for

Institution
Study
Course

Document information

Uploaded on
March 31, 2020
Number of pages
69
Written in
2019/2020
Type
Summary

Subjects

Content preview

Hoorcollege aantekeningen – Biostatistiek

Inhoudsopgave
HC1 - Stochastic processes and Markov chains (part I) ..................................................................................... 3
Markov proces .................................................................................................................................................... 3
Maximum likelihood estimation ......................................................................................................................... 5
Parameter estimation ........................................................................................................................................ 6
Example – Sequence discrimination ................................................................................................................... 7

HC2 - Stochastic processes and Markov chains (part II) .................................................................................... 8
Example – evolution of cancer............................................................................................................................ 8
Stationary distribution ........................................................................................................................................ 9
Processes back in time ...................................................................................................................................... 11

HC3 – Reconstruction of phylogenetic trees ................................................................................................... 12
Intermezzo on graphs ....................................................................................................................................... 12
A model for DNA evolution ............................................................................................................................... 13
The likelihood: a simple example...................................................................................................................... 16
The Pully principle............................................................................................................................................. 19
Example – Laurasiatherians ............................................................................................................................. 19
Assumptions ..................................................................................................................................................... 20

HC4 – Hidden Markov models ........................................................................................................................ 22
Likelihood ......................................................................................................................................................... 24
HMM vs. Markov Chain .................................................................................................................................... 25
Canonical HMM problems ................................................................................................................................ 26
The Viterbi algorithm ....................................................................................................................................... 28
The Baum-Welch algorithm.............................................................................................................................. 29
Example – Sequence alignment ........................................................................................................................ 29
Example – Array CGH ....................................................................................................................................... 30
Hidden semi-Markov model ............................................................................................................................. 31
Example: array CGH (revisited)......................................................................................................................... 32

HC5 – Undirected network reconstruction – part 1 ........................................................................................ 33
(Conditional) independence graph (CIG) .......................................................................................................... 34
Covariance and correlation .............................................................................................................................. 38
Multivariate normal distribution ...................................................................................................................... 40

HC6 – Undirected network reconstruction – part 2 ........................................................................................ 45

, Two-gene pathway ........................................................................................................................................... 45
Regression ........................................................................................................................................................ 48
Regression – Parameter estimation ................................................................................................................. 50
Multi-gene pathway & regression .................................................................................................................... 54

HC7 – Undirected network reconstruction – part 3 ........................................................................................ 57
Partial correlation............................................................................................................................................. 58
Partial correlation vs. regression ...................................................................................................................... 63
All nice … but to what end? .............................................................................................................................. 65
Interpretation pitfall revisited (or: the case for integration) ............................................................................ 67
Further topics ................................................................................................................................................... 69




2

,HC1 - Stochastic processes and Markov chains (part I)
Stochastische processen – voorbeelden:
• Intensiteit van de zon
o Xt (dagen), met 0  t  T
o Xt geeft waarde R+ (alleen positieve waarden)
• DNA sequenties
o A, C, G of T
o Xi met i = 1, …, 11 (gegeven uit voorbeeld)
• Hartslag van patiënt
o Gemeten op continu interval [0, T]
o Xt = 0 (no heartbeat) en 1 (heartbeat)
• Hersenactiviteit bij experimenten
o Gemeten op continu interval [0, T]
o Xt geeft waarde R

State space S = collectie van waarden die een random variabele van een stochastisch proces kan
aannemen.
• Als S = {E1, E2, …, Es}, dan is Xt een discreet stochastische variabele
• Als S = [0, ), dan is Xt een continu stochastische variabele
• Tijd kan zowel discreet als continu zijn

Voorbeeld:




• First passage time van een bepaalde state Ei in S is de tijd t waarbij Xt = Ei voor de eerste keer
sinds de start van het proces.
• Absorbing state is de state Ei waarbij geldt: zodra Xt = Ei, dan geldt Xs = Ei voor alle s  t. Het
proces verlaat de state Ei niet meer.
• Time of absorption van een absorbing state is de first passage time van die state.
• Een stochastisch proces wordt beschreven door een collectie van tijdpunten, de state space
en de verdeling van de variabelen Xt en hun afhankelijkheid
o Poisson proces: alle variabelen zijn identiek en onafhankelijk verdeeld
o Markov proces: de variabelen zijn afhankelijk op een makkelijke manier

Markov proces
• 1e orde Markov proces: hangt alleen af van de vorige variabele,
o 𝑃(𝑋𝑡+1 = 𝑥𝑡+1 |𝑋𝑡 = 𝑥𝑡 , … , 𝑋1 = 𝑥1 ) = 𝑃(𝑋𝑡+1 = 𝑥𝑡+1 |𝑋𝑡 = 𝑥𝑡 )


3

, o Betekent niet onafhankelijkheid tussen Xt-1 en Xt+1
• 0e orde Markov proces: variabelen zijn onafhankelijk van elkaar
o 𝑃(𝑋𝑡+1 = 𝑥𝑡+1 |𝑋𝑡 = 𝑥𝑡 , … , 𝑋1 = 𝑥1 ) = 𝑃(𝑋𝑡+1 = 𝑥𝑡+1 )
o 𝑃(𝑋𝑡+1 = 𝑥𝑡+1 , 𝑋𝑡 = 𝑥𝑡 ) = 𝑃(𝑋𝑡+1 = 𝑥𝑡+1 ) ∗ 𝑃(𝑋𝑡 = 𝑥𝑡)
o Voorbeelden: kop-of-munt en een dobbelsteen
• m-orde Markov proces: hangt af van het aantal m voor de bepalende variabele
o m=9? De verdeling van de t+1e base hangt af van de 9 voorafgaande basen.
• een Markov proces heet een Markov chain als de state space S discreet is.
• een Markov proces heeft tijd homogeen als de transitie kansen onafhankelijk zijn van t.
• Gebruik een transitiematrix P (voorbeeld van DNA basen): let op – hierbij tellen alle kansen
op de rijen op tot 1.




• Initial distribution  = (1, …, s) geeft de probabilities van de initiële state. Ook deze initiële
kansen tellen samen op tot 1.
• De initial distribution en de transitiematrix P bepalen de kansverdeling van het Markov
proces.
• Gebruik de total probability law:
𝑃(𝐴, 𝐵)
𝑃(𝐴, 𝐵) = × 𝑃(𝐵) = 𝑃(𝐴|𝐵) × 𝑃(𝐵)
𝑃(𝐵)
• Hoe bepalen (, P) de probability distribution (transition probabilities) bij tijdsstappen groter
dan 1?
o P(n) = Pn: de transitie matrix voor n-stappen is de 1-staps transitie matrix tot de macht
‘n’.
o Kolmogorov-Chapman vergelijking: (𝑃𝑛+𝑚 )𝑖𝑗 = ∑𝑆𝑘=1(𝑃𝑛 )𝑖𝑘 (𝑃𝑚 )𝑘𝑗




4

Reviews from verified buyers

Showing all reviews
5 year ago

4.0

1 reviews

5
0
4
1
3
0
2
0
1
0
Trustworthy reviews on Stuvia

All reviews are made by real Stuvia users after verified purchases.

Get to know the seller

Seller avatar
Reputation scores are based on the amount of documents a seller has sold for a fee and the reviews they have received for those documents. There are three levels: Bronze, Silver and Gold. The better the reputation, the more your can rely on the quality of the sellers work.
wjj96 Vrije Universiteit Amsterdam
Follow You need to be logged in order to follow users or courses
Sold
58
Member since
7 year
Number of followers
32
Documents
43
Last sold
9 months ago
Medische Natuurwetenschappen - Samenvattingen en hoorcollege aantekeningen!

3.3

19 reviews

5
4
4
6
3
4
2
2
1
3

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions