100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.2 TrustPilot
logo-home
Summary

Samenvatting theorie practica

Rating
-
Sold
2
Pages
10
Uploaded on
24-10-2022
Written in
2021/2022

Samenvatting van verschillende testen gebruikt tijdens practica. Makkelijk te gebruiken voor het examen

Institution
Course









Whoops! We can’t load your doc right now. Try again or contact support.

Written for

Institution
Study
Course

Document information

Uploaded on
October 24, 2022
Number of pages
10
Written in
2021/2022
Type
Summary

Subjects

Content preview

PRACTICUM 1

PRACTICUM 1
DATABANKS
- NCBI databases
= is a US-based organisation that maintains several reference databases for biological and
molecular data 
a. Soorten:
o gene databank (by navigating to Genes & Expression and then Gene)
o DNA sequence (instead of “gene” select nucleotide)
=Nucleotide database is a collection of sequences from several sources, including
GenBank, RefSeq and PDB
 Genbank provides you with the most crucial information in a very simple
text format
o All databases
Bevat extra informatie zoals literatuur, gene, proteïne, genomes, chemicaliën,…
o dbSNP
= world’s largest database for nucleotide variations, and is part of the National
Center for Biotechnology Information (NCBI)
 bestaat uit:
 grote cluster van soortspecifieke databanken die meer dan 12
miljoen niet-redundante sequentievariaties bevatten
 enkelvoudige nucleotide
polymorfismen, inserties/deleties, en korte tandem herhalingen
 meer dan 1 miljard individuele genotypes
<afkomstig van HapMap en andere grootschalige
genotyperingsactiviteiten
b. Werking:
1. Gene database
i. Find molecular components  under “interactions”
ii. Associated problems  under “phenotypes” & “associated”
iii. Gene ontology  under “general gene information”
 has 3 classes:
 Cellular component
 Molecular function
 Biological process
2. Genbank
i. Accession number
=een unieke identificatiecode die aan een databankrecord wordt gegeven.
Het is van cruciaal belang om dit te vermelden wanneer u de
overeenkomstige database-informatie gebruikt.
Bijvoorbeeld,
er kunnen verschillende versies van genen bestaan, of ze kunnen in de loop
van de tijd worden bijgewerkt. Daarom,
als je een artikel schrijft en je vermeldt iets over bijvoorbeeld positie 50 in
een specifiek

, gen, is het van cruciaal belang om ook het toetredingsnummer te vermelden,
anders zou positie 50 kunnen verwijzen
naar een andere plaats in de sequentie dan je bedoelde
ii. Fasta file
= is een eenvoudig tekstbestand met de volgende eigenschappen: De eerste
regel voor elk gen bevat "> NAAM_ VAN DE_ENTITEIT (SPATIE+OPTIONELE
BESCHRIJVING)" en wordt gevolgd door (op een nieuwe regel!) de
nucleotiden voor een gen of transcript, en de aminozuren
aminozuren voor een eiwit (beide in afkortingen van 1 symbool). De
nucleotide-sequentie kan verspreid worden over verschillende (of
honderden) lijnen.
- Uniprot
= protein databank; een van de belangrijkste eiwitdatabanken en is een combinatie van de
vroegere Swiss-Prot en TrEMBL (Translated EMBL Nucleotide Sequence Data Library)
databanken.
HINT : UniProt has a separate section for human diseases in the main uniport search box
under “supporting data”.
o Swiss-Prot = CURATED
 Bevatten handmatig gecureerde gegevens van zeer hoge kwaliteit
 was het onmogelijk om met de high throughput methodes zoals whole
genome sequencing en proteomics.
o TrEMBL = NON-CURATED
 Bevatten geautomatiseerde (lagere kwaliteit) eiwitannotatie

PAIRWISE ALIGNMENT
1. Dot plots
= grafische representatie van sequentie identiteit (i.e. similarity).
o Alle mogelijke vergelijkingen die gemaakt kunnen worden tussen twee reeksen
 Door :
i. over elkaar schuiven
ii. controleren of twee tekens (of meerdere tekens voor woordgroottes > 1)
overeenkomen
 resultaat:
a. a match (een hit)
b. a dot
o word size
 bepaalt: hoe lang een identieke reeks aminozuren of nucleotiden moet zijn
om een punt op het diagram te genereren.
 langere perfecte overeenkomsten = zeldzamer dan korte,
MAAR korte overeenkomsten kunnen ook gewoon ruis zijn
 Woordgrootte 10 laat duidelijk zien dat de sequenties zeer overeenkomsten
vertonen, omdat er veel overeenkomsten zijn. De meeste gebieden zijn zeer
geconserveerd met enkele zeer lokale uitzonderingen (waar de lijn wordt
onderbroken). Deze worden mismatches genoemd.
 Het verkleinen van de woordgrootte maakt de gegevens meer ruisachtig,
omdat sommige aminozuurcombinaties heel vaak lijken voor te komen in de
genen
o Beschrijvingen/lezen dot plot zie practicum 1
$8.38
Get access to the full document:

100% satisfaction guarantee
Immediately available after payment
Both online and in PDF
No strings attached

Get to know the seller
Seller avatar
julieae

Get to know the seller

Seller avatar
julieae Universiteit Antwerpen
Follow You need to be logged in order to follow users or courses
Sold
10
Member since
6 year
Number of followers
5
Documents
14
Last sold
10 months ago

0.0

0 reviews

5
0
4
0
3
0
2
0
1
0

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their exams and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can immediately select a different document that better matches what you need.

Pay how you prefer, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card or EFT and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions