100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.2 TrustPilot
logo-home
Summary

Bio-informatica1 Samenvatting

Rating
-
Sold
-
Pages
31
Uploaded on
29-12-2021
Written in
2020/2021

Samenvatting van Bio-informatica 1 van de opleiding bio-informatica op de Hanze hogeschool.

Institution
Course











Whoops! We can’t load your doc right now. Try again or contact support.

Connected book

Written for

Institution
Study
Course

Document information

Summarized whole book?
No
Which chapters are summarized?
Hoofdstuk 1, 3, 4, 5, 9
Uploaded on
December 29, 2021
Number of pages
31
Written in
2020/2021
Type
Summary

Subjects

Content preview

H1: Introduction
Bio-informatica wordt vaak op verschillende manieren gedefinieerd
 Het boek: Bio-informatica is het gebruik van computerdatabases en
computeralgoritmen om eiwitten, genen en de volledige verzameling
desoxyribonucleïnezuur (DNA) te analyseren dat een organisme omvat
(het genoom)
 National Institutes of Health (NIH): Bio-informatica is het onderzoek, de
ontwikkeling of de toepassing van computationele hulpmiddelen en
benaderingen voor het uitbreiden van het gebruik van biologische,
medische, gedrags- of gezondheidsgegevens, inclusief gegevens om
dergelijke gegevens te verwerven, op te slaan, te organiseren, te
analyseren of te visualiseren'.

Bio-informatics: The Bigger Picture
Bio-informatica kan worden onderverdeeld in drie
perspectieven:
1. De cel
 Bio-informatici richt zich op de verzameling
van DNA (genoom), RNA (transcriptosoom) en
eiwit sequenties (proteoom)
 Centrale dogma = DNA wordt
getranscribeerd in RNA en vervolgens vertaald
naar eiwit

2. Individuele organismes
 Elk organisme verandert over verschillende
stadia van ontwikkeling en (voor meercellige organismen) in verschillende
regio's van het lichaam.
 Genen zijn niet statisch (zoals de meest denken), maar dynamisch. Ze
worden gereguleerd afhankelijk van de tijd, gebied en fysiologische staat
(bijvoorbeeld ziekte)

3. ‘Tree of life’
 Het groeperen van alle organisme in drie groepen: bacteriën, archaea
en eukaryoten

A Consistent Example: Globins
Gedurende het boek wordt telkens de globine genen als voorbeeld gebruikt.
 Globines zijn één van de best gekarakteriseerde genen in de biologie


Waarom zoveel bekend over globines:
1. Hemoglobine  één van de eerst onderzochte eiwitten
2. Myoglobine  eerste eiwit waarvan de structuur was bepaald
3. Globine gen  het globine gen van de mens was één van de eerste
waarvan de sequentie bekend was geanalyseerd werd.
4. Globines komen voor in alle groepen van de ‘tree of life’

,Bioinformatics software
Web-based or Command line (often Linux)
Twee type benadering van bio-informatica: graphical user interface (GUI)


1. Web-based tools (of ‘point-and-click’) Biopython,
 Vereisen geen kennis over programmeren Central resources
(NCBI,
Python, BioPerl, R:
manipulate data files

en zijn direct toegankelijk EBI,)


2. Command-line tools
 Lastigere/steilere leercurve, maar GUI software
Data analysis
software: sequences,
bieden meer opties voor zowel grote en Genome browsers
(UCSC, Ensembl)
(Partek, MEGA,
RStudio,
proteins, genomes


kleine datasets BioMart,
IGV)

Next generation
Galaxy
sequencing tools
(web access
to NGS tools,
browser data)




Web-based Software
Vier belangrijkste databases/websites:
1. National Center for Biotechnolgy Information (NCBI)
2. European Bioinformatics Institute (EBI)
3. Ensembl
4. University of California at Santa Cruz (UCSC)


Command-line Software
Belangrijkste eigenschappen comand-line software
1. Het operating systeem is vaan Linux
2. Het gebruik van programeer talen
3. Bash (de default shell Linux en Mac)

,H3: Pairwise Sequence Alignment
Protein alignment
Drie reden waarom eiwit alignment beter is dan DNA alignment:
1. Verandering in DNA sequentie zorgt niet altijd voor verandering in eiwit
sequentie
2. Bepaalde aminozuren hebben dezelfde biochemische eigenschappen.
 Om deze reden is verandering van aminozuur niet altijd even erg
3. Eiwit sequenties kunnen homologe sequenties identificeren

Definitions: Homology, Similarity, Identity
Homoloog = het delen van een gemeenschappelijke voorouder
 Er is geen graad in homologie, iets is wel of niet homoloog
 Iets kan homoloog zijn zonder dat het statistische significantie
aminozuur of nucleotide
overeenkomsten deelt

2 type homologie:
1. Ortholoog = verschillende
eiwitten/genen door speciatie
(soortvorming)
2. Paraloog = verschillende
eiwitten/genen in eenzelfde soort door
gen-duplicatie

Pairwise alignment = het naast elkaar houden van twee sequenties, waarbij
het doel is om een zo’n hoog mogelijke overeenkomst te verkrijgen
 Met BLASTP (protein) en BLASTN (nucleotiden)

BLAST op NCBI:
1. Kies tussen BLASTP en BLASTN
2. Geef de sequenties
3. Kies de paramters:
- Scoring matrix (PAM/BLOSUM)
- Gap penalties
- Word size, expect value etc.
4. Klik op algin :

,  De tussenliggende lijn geeft de overeenkomsten weer tussen de twee
sequenties

Conservatieve substitutie = overeenkomsten in alignments door
vergelijkbare aminzouren (in de alignment weergegeven met een + teken)
 Aminozuren die vergelijkbaar zijn: (K R H) – (D E) - (S T) – (W F Y L I V
MA)

Vergelijkbaarheid percentage = identieke aminozuren + vergelijkbare
aminozuren
Gaps
Drie meest voorkomende mutaties
1. Substitutie
2. Insertie
3. Deletie

Substituties kunnen leiden tot de verandering van aminozuur, en dus de
alignment van twee niet identieke aminozuren

Inserties en deleties kunnen zorgen voor gaps bij één van de twee sequenties
tijdens pairwise sequence alignment

Het toevoegen van gaps kan zorgen voor een beter alignment
 Het gebruiken van gaps geeft een penalty en dus verlaging van de
scoring

Twee type gap penalties:
1. Gap open
2. Gap verlenging
 Gap verlenging penalty is lager dan een gap open penalty, omdat een
insertie/deletie kan zorgen voor gap groter dan 1 aminozuur

Scoring matrices
Dayhoff model = scoringsysteem wat de basis is voor eiwit-alignment scoring
 Opgesteld in 7 stappen

Dayhoff stap 1: Accepted Point Mutations (PAM)
De verandering van een aminozuur in een eiwit die geaccepteerd is door de
natuurlijke selectie.
 het is pas geaccepteerd als het nieuwe eiwit met de mutatie het
meest voorkomende eiwit is
$6.59
Get access to the full document:

100% satisfaction guarantee
Immediately available after payment
Both online and in PDF
No strings attached

Get to know the seller
Seller avatar
bioinformaticastudent
4.0
(2)

Get to know the seller

Seller avatar
bioinformaticastudent Hanzehogeschool Groningen
Follow You need to be logged in order to follow users or courses
Sold
2
Member since
3 year
Number of followers
2
Documents
6
Last sold
3 year ago

4.0

2 reviews

5
1
4
0
3
1
2
0
1
0

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions