100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.2 TrustPilot
logo-home
Summary

Samenvatting - Keystone Project Big Data (5042KPIB6Y)

Rating
-
Sold
1
Pages
43
Uploaded on
15-01-2024
Written in
2021/2022

Keystone Project III: Big Data 6 EC Semester 2, periode 4 samenvatting

Institution
Course











Whoops! We can’t load your doc right now. Try again or contact support.

Written for

Institution
Study
Course

Document information

Uploaded on
January 15, 2024
Number of pages
43
Written in
2021/2022
Type
Summary

Subjects

Content preview

Big data
1: Introduction to biological databases

Voor het begrijpen en voorspellen.



Bijvoorbeeld in de ecologie, verbanden tussen grote datasets visualiseren zoals een relatie tussen
fytoplankton en waterkwaliteit. Dit kan bijvoorbeeld met een PCA (principal component analysis).

Big data = data die je niet makkelijk op een computer kan zetten door de grote omvang.

Moderne biologie gaat over data die je wil verklaren → vertelt je wat je als volgende experiment
moet doen.

Data integratie = descriptieve biologie → via netwerk exploratie → omzetten naar predictive biologie
(machine learning).

Alles kan een data set zijn: het weer, de temperatuur, moleculen.

Het gaat vaak over een link tussen fenotype en genotype.



Enkele programma’s die worden gebruikt:

BEAST → voor het bestuderen van de evolutie van biologische systemen.

NCBI BLAST → sequentie analyse van eiwitten.

Etc.



Genomics → DNA

Je analyseert genomen om “key” genen te identificeren.

Als je hele genomen analyseert kun je de evolutie van structuur en functie volgen.



Metagenomics → microbioom

Je identificeert soorten microben in complexe biologische monsters (bodem, water, voeding, hele
organismen).

Je krijgt inzicht in de veranderingen in een microbiële community.

,Humaan microbioom: koppeling tussen gezondheid en darm microbioom.

Bv identificeren van microben in poep → transplantaties.



Ecologische data: hier zitten vooral de grote data sets.

- Satelliet observaties
- Biodiversiteit surveys
- Soil data
- Water kwaliteit
- Fytoplankton
- Vogel migratie
- Vis migratie

Belangrijk voor begrip & voorspellend vermogen bij impact van klimaatverandering, landgebruik &
invaderende soorten.



Transcriptomics → RNA

Functionele biologie: je analyseert de genexpressie om genen te identificeren die betrokken zijn bij
een biologisch proces. Je vergelijkt individuen, weefsels, behandelingen.

Je kijkt welke genen aanstaan via identificatie van RNA.

Analyse bijvoorbeeld in een volcano plot of heat map.



Metabolomics → metabolieten

Hoe kunnen genetische verschillen tot veranderingen in biochemische processen leiden?

,2: OMICs technologies and bio informatics

Hoe ga je om met de enorme hoeveelheid data uit bv DNA sequencing, RNA expressie, eiwit patronen,
metaboliet inhoud en digitale fenotypes.



In experimenten begin je vaak juist met een
fenotype en probeer je achter de genen te
komen. Als je weet welk gen bij welk
fenotype hoort dan kan je met het gen
werken ipv met het fenotype.

Bij phenomics beschrijf je iets wat je kan
zien op een digitale manier.




DNA sequencing →
Wat kun je allemaal uit een genoom (alle erfelijke informatie) halen.


• Er is geen correlatie tussen de grootte van een genoom en de complexiteit van een
organisme. Amoebe hebben bijvoorbeeld een groter genoom dan mensen. Bij bacteriën is
genomics makkelijker omdat ze een kleiner genoom hebben.
• Een groter genoom betekent niet per se meer genen, want er is ook junk DNA. Genoom
grootte betekent aantal nucleotide paren. Prokaryote hebben minder genen nodig, daarna
gist (unicellulair) en daarna multicellulair. Mensen hebben vaak meerdere versies van 1 gen
(duplicatie).
• Maar 2 procent van het humane genoom codeert voor eiwitten. De rest is transposons en
repetitief DNA, en introns.
• SINE = short interspersed nuclear element (13%)
• LINE = long interspersed nuclear element (21%)
• Annotatie:
Het grootste deel van
het genoom zijn
repetitieve
sequenties,
transposons. Alleen
een klein deel is echt
het coderende gen.

, • Chromosomen bevatten veel gedupliceerde segmenten : intra- en interchromosomale
duplicaties.

De rode lijnen zijn genen die zowel op chromosoom 7 als
22 zitten. De paarse lijnen zijn in het chromosoom zelf
gedupliceerd.




• Tussen herhalende elementen in het genoom vindt recombinatie plaats. Dit zorgt voor grote
veranderingen. Als die verandering positief is kan het vaker voorkomen. Repetitieve
sequenties zorgen dus voor veranderingen in een genoom.
o Deletie → een stukje van het genoom is verloren.
o Deletie en duplicatie → een stukje van het genoom gaat weg uit het ene
chromosoom en voegt toe aan de ander waardoor het daar dubbel is.
o Inversie → Genen 2 en 3 zijn nu erin als 3 en 2.
o Translocatie → Een deel uit het ene chromosoom wisselt met een deel uit het
andere chromosoom waardoor ze nu allebei anders zijn.
o Deze gebeurtenissen kunnen door breakage and rejoining (DNA kan breken) , dus
dat er een breuk is in het chromosoom of via crossing over.




• Wat heb je nodig bij genomics?:
o DNA sequentie analyse genoom fragmenten
o DNA database (NCBI, Genbank, EMBL)
o DNA markers (SNPs bv)

Get to know the seller

Seller avatar
Reputation scores are based on the amount of documents a seller has sold for a fee and the reviews they have received for those documents. There are three levels: Bronze, Silver and Gold. The better the reputation, the more your can rely on the quality of the sellers work.
corrinafleck Universiteit van Amsterdam
Follow You need to be logged in order to follow users or courses
Sold
15
Member since
3 year
Number of followers
6
Documents
9
Last sold
6 months ago

3.0

1 reviews

5
0
4
0
3
1
2
0
1
0

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions