SAMENVATTING: BIOLOGISCHE DATABESES
HOOFDSTUK 1: THE LEGEND OF AMELX AND AMELY
CORE TASKES: LEARN TO USE NCBI AND BLAST
THE NATIONAL CENTER FOR BIOTECHNOLOGY INFORMATION
The National Center for Biotechnology Information (NCBI) is created in 1988 as a part of the National Library of
Medicine at NIH
- Establish public databases
- Research in computational biology
- Develop software tools for sequence analysis
- Disseminate biomedical information
-
- Gegevens van NCBI zijn door mensen samengesteld, elke dag worden er 11.000 sequencies
toegevoegd.
THE CENTRAL DOGMA & BIOLOGICAL DATA
,REFSEQ
RefSeq is een vrij toegankelijke databank waarin geannoteerde nucleotidesequenties en bijbehorende
eiwitproducten zijn geïndexeerd. Het wordt beheerd door NCBI. In tegenstelling tot GenBank is elk
macromolecuul slechts 1 keer in de database opgenomen. RefSeq is dus niet-redundant, waardoor het een
relatief kleine zoekruimte heeft.
- Non-redundancy
- Updates to reflect current sequence
- Data validation
- Format consistency
- Distinct accession series
- Stewardship by NCBI staff and collaborators
STRUCTUUR VAN DE DATALINK
,BASIC LOCAL ALLIGNMENT SEARCH TOOL: BLAST
BLAST helps you to find homologous genes and
proteins
Homologous genes/proteins
- have a common ancestor (they’re related)
- have similar structures
- have similar functions
CRITERIA OM TWEE SEQUENTIES ALS HOMOLOOG TE BESCHOUWEN
Eiwitten zijn homoloog als: hun aminozuursequencties minstens 25% identiek zijn
DNA-sequenties zijn homoloog als: zijn minstens 70% identiek
Merk op dat reeksen groter moeten zijn dan 100 a.a. (of bp), wanneer een aminozuursequentie korter
is dan 35 aa, noemen we dat meestal een peptide maar geen eiwit, omdat het te kort is om de functie
als eiwit uit te voeren.
Het is beter om eiwitten te vergelijken dan DNA-sequenties
BLAST VERGELIJKT SEQUENTIES
- BLAST neemt een query sequentie
- Vergelijkt het met miljoenen sequenties in de GenBank databeses: door local allignments te
contrueren
- Geeft een lijst weer die hetzelfde lijken als de query sequentie: de hitlijst
- Vertelt waarom hij denkt dat ze homologen zijn: BLAST maakt suggesties; jijzelf maakt de conclusies
BLAST HEEFT VERSCHILLENDE SOORTEN BLASTS; DE BELANGRIJKSTE:
- Protein BLAST (BLASTp)
Vergelijkt een eiwit query met sequenties in GenBank protein databese.
- Nucleotide BLAST (BLASTn)
, Vergelijkt nucleotide query met sequenties in GenBank nucleotide databese
Ook kunnen er 2 sequenties met elkaar vergeleken worden. Voeg de eerste sequentie in de bovenste search
vorm. Voeg de 2e sequentie in de onderste search vorm. Om 2 sequenties met elkaar te vergelijken wordt
BLASTN gebruikt.
HOE INTERPRETEER JE DE RESULTATEN VAN EEN BLAST SEARCH?
SEQUENCE ALIGNMENT – DEFINITION
Sequence alignment is an arrangement of two or more sequences, highlighting their similarity
The sequences are padded with gaps (streepjes) so that wherever possible, columns contain identical
characters from the sequences involved.
HOOFDSTUK 1: THE LEGEND OF AMELX AND AMELY
CORE TASKES: LEARN TO USE NCBI AND BLAST
THE NATIONAL CENTER FOR BIOTECHNOLOGY INFORMATION
The National Center for Biotechnology Information (NCBI) is created in 1988 as a part of the National Library of
Medicine at NIH
- Establish public databases
- Research in computational biology
- Develop software tools for sequence analysis
- Disseminate biomedical information
-
- Gegevens van NCBI zijn door mensen samengesteld, elke dag worden er 11.000 sequencies
toegevoegd.
THE CENTRAL DOGMA & BIOLOGICAL DATA
,REFSEQ
RefSeq is een vrij toegankelijke databank waarin geannoteerde nucleotidesequenties en bijbehorende
eiwitproducten zijn geïndexeerd. Het wordt beheerd door NCBI. In tegenstelling tot GenBank is elk
macromolecuul slechts 1 keer in de database opgenomen. RefSeq is dus niet-redundant, waardoor het een
relatief kleine zoekruimte heeft.
- Non-redundancy
- Updates to reflect current sequence
- Data validation
- Format consistency
- Distinct accession series
- Stewardship by NCBI staff and collaborators
STRUCTUUR VAN DE DATALINK
,BASIC LOCAL ALLIGNMENT SEARCH TOOL: BLAST
BLAST helps you to find homologous genes and
proteins
Homologous genes/proteins
- have a common ancestor (they’re related)
- have similar structures
- have similar functions
CRITERIA OM TWEE SEQUENTIES ALS HOMOLOOG TE BESCHOUWEN
Eiwitten zijn homoloog als: hun aminozuursequencties minstens 25% identiek zijn
DNA-sequenties zijn homoloog als: zijn minstens 70% identiek
Merk op dat reeksen groter moeten zijn dan 100 a.a. (of bp), wanneer een aminozuursequentie korter
is dan 35 aa, noemen we dat meestal een peptide maar geen eiwit, omdat het te kort is om de functie
als eiwit uit te voeren.
Het is beter om eiwitten te vergelijken dan DNA-sequenties
BLAST VERGELIJKT SEQUENTIES
- BLAST neemt een query sequentie
- Vergelijkt het met miljoenen sequenties in de GenBank databeses: door local allignments te
contrueren
- Geeft een lijst weer die hetzelfde lijken als de query sequentie: de hitlijst
- Vertelt waarom hij denkt dat ze homologen zijn: BLAST maakt suggesties; jijzelf maakt de conclusies
BLAST HEEFT VERSCHILLENDE SOORTEN BLASTS; DE BELANGRIJKSTE:
- Protein BLAST (BLASTp)
Vergelijkt een eiwit query met sequenties in GenBank protein databese.
- Nucleotide BLAST (BLASTn)
, Vergelijkt nucleotide query met sequenties in GenBank nucleotide databese
Ook kunnen er 2 sequenties met elkaar vergeleken worden. Voeg de eerste sequentie in de bovenste search
vorm. Voeg de 2e sequentie in de onderste search vorm. Om 2 sequenties met elkaar te vergelijken wordt
BLASTN gebruikt.
HOE INTERPRETEER JE DE RESULTATEN VAN EEN BLAST SEARCH?
SEQUENCE ALIGNMENT – DEFINITION
Sequence alignment is an arrangement of two or more sequences, highlighting their similarity
The sequences are padded with gaps (streepjes) so that wherever possible, columns contain identical
characters from the sequences involved.