Bio-informatica is de toepassing van computer technologie van het managen en analyseren van
biologische data.
menselijk genoom:
- 3.1 miljoen basenparen
Databases
-Pubmed, KEGG, Brenda, BioCyc, STRING, NCBI, Uniprot.
elke datatbase heeft eigen formaat maar sommige elementen zijn karakteristisch voor elke database:
* Accession codes
* Data tables
* Meta data data over data.
Aanvullende belangrijke informatie:
* wanneer is data toegevoegd aan database.
* naam van de persoon die data erop heeft gezet
* literatuurreferenties
Nucleotide sequence database
e.g. GenBanl (NCBI), ENA, (EBI)
variatie:
* echt genomisch DNA, bevattende niet-coderende, coderende, repeats..
* cDNAs: een heel profiel mRNAs in een bepaalde sample, dus wat er op een bepaald moment in een
sample allemaal tot expressie is gekomen.
* ESTs: delen cDNAs
eiwitdatabases
UniProtKB
* swissprot database geïntegreerd. Alles van swissprot staat in UniProt, maar niet alles van Uniprot
staat in siwsprot. Swissprot experimenteel bewezen. UniProt voorspellingen.
*NCBI eiwit
Eiwit familie/domein databases : domein functie
* Pfam, prosite, interpro
1
,Bio informatica 2
Refseq:
model transcript en eiwit
Je vindt alleen unieke info
formaat is consequent, dus alles is op dezelfde manier opgebouwd.
doorlinking
up-to-date
WGS: whole genome sequencing
Wanneer, waar en hoe is een eiwit biologisch actief?
Ookal heb je een gen en dat wordt vertaald naar een eiwit, in een eiwit kan na translatie altijd nog
verandering plaatsvinden. Kleine stukjes kunnen afgeknipt worden.
eiwitfunctie;
locatie in de cel wanneer is het eiwit waar?
biologische processen waarbij is het eiwit betrokken
moleculaire functie eigenschappen van het eiwit
2
, Bio informatica 2
Bio informatica blok 2 les 2
Gene Ontology (GO)
Zorgt voor gecontroleerde woordenschat die genen en gen-geassocieerde informatie in een
hiërarchische manier beschrijft (ouder-kind relatie).
Wat dit inhoudt, is dat er 1 woordenschat is waarin iedereen schrijft waardoor ieder elkaars tekst
begrijpt. Niet dat bijvoorbeeld iedereen dadelijk een ander woord voor ‘eiwit’ gaat gebruiken.
Delen van woordenschat zoals GO tussen databases is een stap verder in eenwording van databases.
GO komt voor bij: Cellulaire componenten, Biologische processen en Moleculaire functies.
Hier boven zie je een voorbeeld van het Ouder-Kind principe van GO. Je ziet Biological process (links
boven), dit is de ouder (met eigen GO nummer). Hieronder staat Metabolic process (ook met eigen
GO nummer), dit is het kind. Je kunt dus zeggen dat het metabolische proces kind is van het
biologische proces.
Als je dan nog een vakje omlaag gaat is het metabolische proces de ouder en is het primair
metabolische proces het kind.
Je gaat dus van steeds globaler (ouder) naar steeds specifieker (kind)
Dit ouder-kind principe heb je bij Cellulaire componenten, Biologische processen en Moleculaire
functies.
3