Leerdoelen DT2 - Bioinformatica
Describe the ‘omics: (meta-)genomics, (meta-)transcriptomics, (meta-)proteomics, metabolomics, etc.
Genomics: Sequence all of the DNA of one organism
Transcriptomics: Sequence all of the mRNA in an organism/tissue/cell
Proteomics: Sequence all of the proteins in an organism/tissue/cell
Metagenomics: Sequence the DNA of all organisms in a sample
Metatranscriptomics: Sequence the mRNA of all organisms in a sample
Metaproteomics: Sequence the proteins of all organisms in a sample
Explain the biology behind the ‘omics revolution: reduce bias by measuring all of a thing
-omics worden gebruikt om biases te verminderen. Mensen zijn erg geïnteresseerd in henzelf waardoor er
biases ontstaan. Door het gebruik van -omics worden deze verminderd.
Compare the two ways a bioinformatician exploits existing data to make new discoveries
Explain what a sequence alignment is and the difference between a global and local sequence
alignment
Een sequence alignment is een manier van het regelen van de sequentie van DNA, RNA of eiwit om
homologe regio’s te identificeren.
- Local sequence alignment: Dit zijn deels homologe sequenties, deze vindt de optimale sub-
alignment tussen twee sequenties.
- Global sequence alignment: Dit zijn geheel homologe seuqenties, die van begin tot eind hetzelfde
zijn. Vaak komt dit voor bij genduplicatie.
Explain the BLAST algorithm in detail and in the right order
1. Identifies all words (length W) in the query
a. Default lengths: W = 3 voor eiwit en W = 11 voor DNA.
b. Based on substitution scores.
2. Quickly finds similar words in the database:
a. Similar words are defined by using the substitution matrix.
b. The index quickly locates all potential hit sequences.
3. Extends seeds in both directions to find HSPs between query and hit.
a. HSP: region that can be aligned with a score above a certain threshold.
List the factors including heuristics that make BLAST fast
1. Het gebruik van k-mer search zorgt voor het snel vinden van potentiële hits.
2. Het gebruik van heuristics: dit is een praktische methode die niet gerandeerd op het optimale
resultaat maar sufficiënt is voor de gestelde eisen.
Define homology, similarity, and identity
Homology: Property of two sequences that have a shared ancestor. Homology is true or false: either you
are family or you are not.
Identity: percentage of identical residues in an alignment. Used for amino acids or nucleotides.
Similarity: percentage of amino acid residue in an alignment with a positive substitution score. Not used
for DNA.
Describe the ‘omics: (meta-)genomics, (meta-)transcriptomics, (meta-)proteomics, metabolomics, etc.
Genomics: Sequence all of the DNA of one organism
Transcriptomics: Sequence all of the mRNA in an organism/tissue/cell
Proteomics: Sequence all of the proteins in an organism/tissue/cell
Metagenomics: Sequence the DNA of all organisms in a sample
Metatranscriptomics: Sequence the mRNA of all organisms in a sample
Metaproteomics: Sequence the proteins of all organisms in a sample
Explain the biology behind the ‘omics revolution: reduce bias by measuring all of a thing
-omics worden gebruikt om biases te verminderen. Mensen zijn erg geïnteresseerd in henzelf waardoor er
biases ontstaan. Door het gebruik van -omics worden deze verminderd.
Compare the two ways a bioinformatician exploits existing data to make new discoveries
Explain what a sequence alignment is and the difference between a global and local sequence
alignment
Een sequence alignment is een manier van het regelen van de sequentie van DNA, RNA of eiwit om
homologe regio’s te identificeren.
- Local sequence alignment: Dit zijn deels homologe sequenties, deze vindt de optimale sub-
alignment tussen twee sequenties.
- Global sequence alignment: Dit zijn geheel homologe seuqenties, die van begin tot eind hetzelfde
zijn. Vaak komt dit voor bij genduplicatie.
Explain the BLAST algorithm in detail and in the right order
1. Identifies all words (length W) in the query
a. Default lengths: W = 3 voor eiwit en W = 11 voor DNA.
b. Based on substitution scores.
2. Quickly finds similar words in the database:
a. Similar words are defined by using the substitution matrix.
b. The index quickly locates all potential hit sequences.
3. Extends seeds in both directions to find HSPs between query and hit.
a. HSP: region that can be aligned with a score above a certain threshold.
List the factors including heuristics that make BLAST fast
1. Het gebruik van k-mer search zorgt voor het snel vinden van potentiële hits.
2. Het gebruik van heuristics: dit is een praktische methode die niet gerandeerd op het optimale
resultaat maar sufficiënt is voor de gestelde eisen.
Define homology, similarity, and identity
Homology: Property of two sequences that have a shared ancestor. Homology is true or false: either you
are family or you are not.
Identity: percentage of identical residues in an alignment. Used for amino acids or nucleotides.
Similarity: percentage of amino acid residue in an alignment with a positive substitution score. Not used
for DNA.