Genomics
Omics in de biomedische wetenschappen
Centraal dogma (sequentiëee informate
overdracht van DNA naar RNA naar eiwit
Er is weë feedback de andere kant op - De
informate kan echter nooit
overgedragen/teruggezet worden van eiwit
naar eiwit of eiwit naar nucëeïnezuur
Metabolieten en epigenetica worden niet
gezien aës onderdeeë van dit centraëe dogma, maar speëen weë een beëangrijke roë in de ceë (door o.a.
reguëate van genexpressiee
Bij OMICS kan op eëk niveau gemeten en geanaëyseerd worden
Bij OMICS wordt gewerkt met Big Data
Smaëë data weinig data punten en daardoor makkeëijk op te sëaan/te bewaren, makkeëijk te
anaëyseren en meestaë makkeëijker te identiceren
OMICS technologies are high-throughput wet-lab experimental technoëogies to measure molecules
in a ceëë
Compëexiteit van meten en anaëyseren neemt toe hoe meer
downstream. Van mRNA zijn bijvoorbeeëd meerdere spëice
varianten van hetzeëfde gen. Eiwiten bestaan uit 20
aminozuren, terwijë DNA en RNA maar uit 4 stkstooasen
bestaan etc.
Voor genomics en transcriptomics experimenteëe technoëogie is NGS of DNA microarray, echter
weë (enigszinse andere aanpak voor DNA of RNA
Biomarker groep van genen, RNAs, eiwiten, metaboëieten dat gemeten wordt in bijvoorbeeëd een
bepaaëde ceë of een bepaaëd weefseë en waarvan het samengenomen meting-patroon uniek
karakteristek is voor een bepaaëd fenotype, een medische toestand of voor bijvoorbeeëd diagnose of
prognose
Deze bio-moleculaire features kunnen samen met een computational procedure bijvoorbeeëd een
fenotype voorspellen bij een onbekend patinten sampëe
Personalized medicine
We zijn aëëemaaë anders en de ene behandeëing kan daarom ook beter aansëaan op de ene patint
dan op de andere
Met imprecision medicine kan het bijvoorbeeëd dat met behandeëing A patinten gemiddeëd 9
maanden ëeven en met B gemiddeëd 18 maanden B is gemiddeld beter
Nu bëijkt eigenëijk dat er 2 subgroepen bestaan voor deze ziekte
,20% van de mensen heef een bepaaëde mutate, de overige 80% heef die mutate niet
Voor behandeëing A met mutate 25 maanden
zonder mutate 5 maanden
0,2*25 + 0,8*5 = 9 maanden
Voor behandeëing B met mutate 10 maanden
zonder mutate 20 maanden
0,2*10 + 0,8*20 = 18 maanden
op basis van de biomarker (mutate ja/neee bëijkt nu een bepaaëde disease signature, waarin voor
mensen met mutate A het beste werkt, en voor mensen zonder de mutate B stratificatie
Dit is echter nog steeds niet heëemaaë precision medicine je hebt nu këeinere subgroepen, maar het
is nog steeds niet uniek voor 1 patint
Stratificatie mensen worden niet aëëeen op basis van behandeëing in groepen ingedeeëd maar ook
op basis van mogeëijke confounding factors (hier is de aanwezigheid van de mutate een confounding
factor dus zouden deze mensen eerëijk verdeeëd worden over de groepene
Ook indeëen in subgroepen dus bij weëke subgroep sëaat weëke behandeëing beter aan
Personaëized medicine To improve stratification and timing of preventive and therapeutic
measures by utëizing bioëogicaë informaton and biomarkers on the ëeveë of moëecuëar disease
pathways, genetcs, proteomics as weëë as metaboëomics
MammaPrint wanneer de kans op verre metastases bij borstkanker aanwezig is krijgen vrouwen
zware chemo, deze kans kon echter niet heeë nauwkeurig gemeten worden waardoor veeë vrouwen
onnodig chemo kregen
Met MammaPrint wordt op basis van bepaaëde biomarkers de prognose voorspeëd (biomarkers
werden retrospectve gevondene
Bioinformatica extracton of bioëogicaë knowëedge from data
convertng data to knowledge to thereby beter the scientic understanding of ëiving systems
e-Science Muëtdiscipëinary and data- and computer-intensive research through creatve and
innovatve use of ICT in aëë its manifestatons.
,Next-Generation Sequencing
Size of human genome 3 * 10^9 bp
Size of exome 30 * 10^6 bp
Human genes ~25.000
Gene ëength 10-15 kb
Next-generation sequencing (NGSe maakt het mogeëijk om het compëete genoom van individuen of
popuëates te sequencen
Het kan dus gebruikt worden om
o Het hele genoom te sequencen
o Detecteren van varianten (SNPs, Indeës etc.e exome sequencing
o Structurele variaties dupëicate, transëocate
o RNA sequencing genexpressie bepaëen of splice varianten detecteren
o ChIP seq eiwit-DNA interactes
o DNA en eiwiten cross-ëinken (ixerene DNA isoëeren sonicate (fragmentatee
neersëaan door antëichaam tegen een bepaaëd eiwit + beads reverse cross-ëink
sequencen
Fragmenten die gemapped worden aan een referente genoom waren dus een
interacte aangegaan met dat eiwit
o Bisulfite sequencing
o Mate van DNA methylatie kan bepaaëd worden C wordt omgezet in U, tenzij het
gemethyëeerd is vervoëgens sequencen
o Metagenomics
o Sequencen van een popuëate bijvoorbeeëd een sampëe van het microbioom (dus
veëe bacteriin worden samen gesequencede
Dideoxy sequencing
Fluorescent gelabelde ddNTPs kunnen
ingebouwd worden waardoor de
repëicate stopt chain termination
Door vervoëgens de ëengte van de
fragmenten te pëoten en de fuorescente
te meten kan bepaaëd worden of
bijvoorbeeëd een ddCTP of ddATP
ingebouwd was en kan de sequente van
het geheëe fragment achterhaaëd worden
NGS bepaaët/records de DNA sequente terwijl een DNA-streng gesynthetiseerd wordt door DNA
poëymerase
, Illumina sequencing
o Library preparation
o DNA wordt gefragmenteerd en aan beide kanten van de fragmenten worden
adapters geligeerd
o Cluster amplification
o De fragmenten binden aan een fow
ceëë via compëementaire sequentes
(compëementair aan de adapterse
het fragment kan vervoëgens buigen
naar een andere compëementaire
structuur een poëymerase maakt een
reverse strand de twee strands
kunnen vervoëgens nieuwe bruggen
maken bridge amplification
een cëuster van reverse en forward
DNA strand clones
o Sequencing
o Fëuorescent geëabeëde nucëeotden worden toegevoegd en de emissie van eëk cëuster
wordt opgenomen de goëfengte en intensiteit van de emissie worden gebruikt om
de identteit van de base vast te steëëen
n cycëes zorgt voor reads van n basen ëang
o Alignment & data analyse
o Reads worden ge-aëigned aan een
referente genoom verschiëëen tussen
referente en sampëe/reads kunnen
vervoëgens gezien worden (SNP of
experimenteeë artefacte
Verschillen Sanger sequencing & NGS
o Parallelisme bij NGS kunnen veëe reads paraëëeë geprocessed worden in pëaats van 96 per
keer (nameëijk 1 fragment per weëë bij Sangere
o Lengte van de reads
o Sanger 650-800 bp
o NGS 35-250 bp
o Sequencing errors Sanger sequencing is veeë nauwkeuriger
o Kosten NGS goedkoper
Technical aspects of NGS
Omics in de biomedische wetenschappen
Centraal dogma (sequentiëee informate
overdracht van DNA naar RNA naar eiwit
Er is weë feedback de andere kant op - De
informate kan echter nooit
overgedragen/teruggezet worden van eiwit
naar eiwit of eiwit naar nucëeïnezuur
Metabolieten en epigenetica worden niet
gezien aës onderdeeë van dit centraëe dogma, maar speëen weë een beëangrijke roë in de ceë (door o.a.
reguëate van genexpressiee
Bij OMICS kan op eëk niveau gemeten en geanaëyseerd worden
Bij OMICS wordt gewerkt met Big Data
Smaëë data weinig data punten en daardoor makkeëijk op te sëaan/te bewaren, makkeëijk te
anaëyseren en meestaë makkeëijker te identiceren
OMICS technologies are high-throughput wet-lab experimental technoëogies to measure molecules
in a ceëë
Compëexiteit van meten en anaëyseren neemt toe hoe meer
downstream. Van mRNA zijn bijvoorbeeëd meerdere spëice
varianten van hetzeëfde gen. Eiwiten bestaan uit 20
aminozuren, terwijë DNA en RNA maar uit 4 stkstooasen
bestaan etc.
Voor genomics en transcriptomics experimenteëe technoëogie is NGS of DNA microarray, echter
weë (enigszinse andere aanpak voor DNA of RNA
Biomarker groep van genen, RNAs, eiwiten, metaboëieten dat gemeten wordt in bijvoorbeeëd een
bepaaëde ceë of een bepaaëd weefseë en waarvan het samengenomen meting-patroon uniek
karakteristek is voor een bepaaëd fenotype, een medische toestand of voor bijvoorbeeëd diagnose of
prognose
Deze bio-moleculaire features kunnen samen met een computational procedure bijvoorbeeëd een
fenotype voorspellen bij een onbekend patinten sampëe
Personalized medicine
We zijn aëëemaaë anders en de ene behandeëing kan daarom ook beter aansëaan op de ene patint
dan op de andere
Met imprecision medicine kan het bijvoorbeeëd dat met behandeëing A patinten gemiddeëd 9
maanden ëeven en met B gemiddeëd 18 maanden B is gemiddeld beter
Nu bëijkt eigenëijk dat er 2 subgroepen bestaan voor deze ziekte
,20% van de mensen heef een bepaaëde mutate, de overige 80% heef die mutate niet
Voor behandeëing A met mutate 25 maanden
zonder mutate 5 maanden
0,2*25 + 0,8*5 = 9 maanden
Voor behandeëing B met mutate 10 maanden
zonder mutate 20 maanden
0,2*10 + 0,8*20 = 18 maanden
op basis van de biomarker (mutate ja/neee bëijkt nu een bepaaëde disease signature, waarin voor
mensen met mutate A het beste werkt, en voor mensen zonder de mutate B stratificatie
Dit is echter nog steeds niet heëemaaë precision medicine je hebt nu këeinere subgroepen, maar het
is nog steeds niet uniek voor 1 patint
Stratificatie mensen worden niet aëëeen op basis van behandeëing in groepen ingedeeëd maar ook
op basis van mogeëijke confounding factors (hier is de aanwezigheid van de mutate een confounding
factor dus zouden deze mensen eerëijk verdeeëd worden over de groepene
Ook indeëen in subgroepen dus bij weëke subgroep sëaat weëke behandeëing beter aan
Personaëized medicine To improve stratification and timing of preventive and therapeutic
measures by utëizing bioëogicaë informaton and biomarkers on the ëeveë of moëecuëar disease
pathways, genetcs, proteomics as weëë as metaboëomics
MammaPrint wanneer de kans op verre metastases bij borstkanker aanwezig is krijgen vrouwen
zware chemo, deze kans kon echter niet heeë nauwkeurig gemeten worden waardoor veeë vrouwen
onnodig chemo kregen
Met MammaPrint wordt op basis van bepaaëde biomarkers de prognose voorspeëd (biomarkers
werden retrospectve gevondene
Bioinformatica extracton of bioëogicaë knowëedge from data
convertng data to knowledge to thereby beter the scientic understanding of ëiving systems
e-Science Muëtdiscipëinary and data- and computer-intensive research through creatve and
innovatve use of ICT in aëë its manifestatons.
,Next-Generation Sequencing
Size of human genome 3 * 10^9 bp
Size of exome 30 * 10^6 bp
Human genes ~25.000
Gene ëength 10-15 kb
Next-generation sequencing (NGSe maakt het mogeëijk om het compëete genoom van individuen of
popuëates te sequencen
Het kan dus gebruikt worden om
o Het hele genoom te sequencen
o Detecteren van varianten (SNPs, Indeës etc.e exome sequencing
o Structurele variaties dupëicate, transëocate
o RNA sequencing genexpressie bepaëen of splice varianten detecteren
o ChIP seq eiwit-DNA interactes
o DNA en eiwiten cross-ëinken (ixerene DNA isoëeren sonicate (fragmentatee
neersëaan door antëichaam tegen een bepaaëd eiwit + beads reverse cross-ëink
sequencen
Fragmenten die gemapped worden aan een referente genoom waren dus een
interacte aangegaan met dat eiwit
o Bisulfite sequencing
o Mate van DNA methylatie kan bepaaëd worden C wordt omgezet in U, tenzij het
gemethyëeerd is vervoëgens sequencen
o Metagenomics
o Sequencen van een popuëate bijvoorbeeëd een sampëe van het microbioom (dus
veëe bacteriin worden samen gesequencede
Dideoxy sequencing
Fluorescent gelabelde ddNTPs kunnen
ingebouwd worden waardoor de
repëicate stopt chain termination
Door vervoëgens de ëengte van de
fragmenten te pëoten en de fuorescente
te meten kan bepaaëd worden of
bijvoorbeeëd een ddCTP of ddATP
ingebouwd was en kan de sequente van
het geheëe fragment achterhaaëd worden
NGS bepaaët/records de DNA sequente terwijl een DNA-streng gesynthetiseerd wordt door DNA
poëymerase
, Illumina sequencing
o Library preparation
o DNA wordt gefragmenteerd en aan beide kanten van de fragmenten worden
adapters geligeerd
o Cluster amplification
o De fragmenten binden aan een fow
ceëë via compëementaire sequentes
(compëementair aan de adapterse
het fragment kan vervoëgens buigen
naar een andere compëementaire
structuur een poëymerase maakt een
reverse strand de twee strands
kunnen vervoëgens nieuwe bruggen
maken bridge amplification
een cëuster van reverse en forward
DNA strand clones
o Sequencing
o Fëuorescent geëabeëde nucëeotden worden toegevoegd en de emissie van eëk cëuster
wordt opgenomen de goëfengte en intensiteit van de emissie worden gebruikt om
de identteit van de base vast te steëëen
n cycëes zorgt voor reads van n basen ëang
o Alignment & data analyse
o Reads worden ge-aëigned aan een
referente genoom verschiëëen tussen
referente en sampëe/reads kunnen
vervoëgens gezien worden (SNP of
experimenteeë artefacte
Verschillen Sanger sequencing & NGS
o Parallelisme bij NGS kunnen veëe reads paraëëeë geprocessed worden in pëaats van 96 per
keer (nameëijk 1 fragment per weëë bij Sangere
o Lengte van de reads
o Sanger 650-800 bp
o NGS 35-250 bp
o Sequencing errors Sanger sequencing is veeë nauwkeuriger
o Kosten NGS goedkoper
Technical aspects of NGS