https://www.ncbi.nlm.nih.gov/gene/7157
NM nr = transcript van een bep gen (NM_xxx.y -> xxx = ID en .y = versie)
NP nr = protein
Gelinkt aan elkaar
Tekst editor: BBEdit 15 (programma op computer)
Van https://www.ncbi.nlm.nih.gov/gene/7157
1. Send to
2. Complete record
3. File
4. Format: gene bank/FASTA/… (afh van wat je nodig hebt)
5. Create new file
1. https://www.ncbi.nlm.nih.gov/gene/7157
2. pubmed + nr ingeven (29764999)
3. related information: gene (E2F)
4. mRNA en Protein(s): hier vind je transcript (NM_005225.3) –> op klikken
5. download and open in tekst editor
6. graphic
7. https://www.ebi.ac.uk/Tools/dbfetch/dbfetch?db=refseqn;id=NM_005225;format=default&style=raw
https://www.uniprot.org/
- geeft alle info over proteinen
- mog om GFF te downloaden = tekst file om features te beschrijven
1. zoek human hemoglobin alfa in uniprot
2. download –> entry + FASTA
3. accession number: P69905
4. download –> entry/features only + GFF
, 1. zoek in ncbi bij pubmed: The DCC gene has a role in cellular differentiation and colorectal tumorigenesis (Hedrick
et al. 1994 Genes Dev)
2. pubmed ID: 7926722
3. pubmed ID zoeken in uniprot
4. PTM/Processing –> features –> signal: AZ 1-25 en seq = MENSLRCVWVPKLAFVLFGASLFSA
3D structuur bekijken: ncbi –> structure + naam gen
swissprot = uniprot
1. SOX2
2. mRNA and Protein(s): 1 mRNA transcript: NM_003106.4
3. transcriptie factor
4. FASTA: zie eerder
5. Structuur is beschikbaar
6. Uniport: human PAX6 zoeken –> ‘family & domains’ –> scroll naar beneden –> ‘view protein in InterPro’ –> alle
sonder ‘domain’ zijn geannoteerde domeinen
Les 2
Ontologies
= formele presentatie van concepten binnen een domein en de relatie binnen die concepten (het helpt computers te
begrijpen welke dingen bestaan en hoe ze met elkaar verbonden zijn).
Gen ontologie (GO): structuur
- Moleculaire functie: wat doet het genproduct?
- Celullaire component: waar en waneer is het actief?
- Biologische processen: in welke processen doet het mee?
, 1. Ga naar uniprot: zoek ‘PAX6’ –> klink aan op mens
2. Go annotation: via deze link naar QuickGO
Onduidelijk waarom gedaan (organisme zou mens moeten zijn)
3. Zoek: cardiac development –> all –> heart development (= correct GO term)
4. Kies bij taxon (links boven) ‘homo sapiens’: 2956 genen
5. Kies bij taxon ‘mus musculus’ (muis): 2827 genen
6. Zoek opnieuw ‘cardiac development’
7. Klinkt op term nr bij ‘heart devolpment’
8. Ga naar ‘child terms’: 28
9. Download association –> export
10. Wijzig bestand van naam: voeg ‘.txt’ toe
11. Open met excel –> gegevens –> tekst naar kolom –> gescheiden –> tab –> voltooien
12. Gen naam selecten (3e kolom) –> kopieren naar niet tabblad –> gegevens –> geavanceerd –> alleen unieke records
13. Links vanonder (naast gereed): 703 unieke gen symbolen
Open biomedical ontologies (OBO)
= opslagplaats voor ontologieën met gedefiniëerde sets van standaarden en regels (GO is deel van OBO)
http://obofoundry.org
https://www.ebi.ac.uk/ols4/ontologies
1. Zoek ‘oligodendrocyte’
2. Ga naar ‘class relations’ –> develops from (RO) oligodendrocyte precursor cell –> klik hier op
3. Develops from glioblast
4. Defenitie = An early neural cell developing from the early ependymal cell of the neural tube
5. Ga naar ‘class relations’ –> ‘related from’: macroglial cell, perineural satellite cell en oligodendrocyte precursor cell
(= other cell types that are derived from this cell type)
, Gene expression
https://www.gtexportal.org/home/index.html
Entrez = ncbi
Expressie in Entrez Expressie in GTEx (betrouwbaarder)
Nee, deze genen komen al
tot expressie in de embryo
en niet in volwassenen.
Gene expression omnibus (GEO)
Zoeken tussen alle datasets
Profile neighbours: zoeken binnen een dataset
https://www.ncbi.nlm.nih.gov/gds/
Human Cell Atlas
= referentie map maken van alle humane cellen die bestaan (kijken hoe cellen zich gedragen in gezonde en zieke
omstandigheden)
https://www.humancellatlas.org
1. Ga naar ‘data’ –> ‘heart’ –> ‘HCA Heart Datasets’ –> ‘Cells of the adult human heart’ en klik hierop
2. Ga naar ‘CZ CELLxGENE’ (we zitten nu in CellXGene, Chan-Zuckerberg Initiative)
3. Zoek rechts vanboven naar ‘MESP1’ –> druppeltje aanzetten: je ziet geen expressie
4. Zoek rechts vanboven naar ‘MYH11’ –> druppeltje aanzetten: je ziet een beetje expressie
5. Links ‘all cell_types’ druppeltje terug aanzetten om te kijken in welk celtype dit gen tot expressie komt: smooth
musle cell
6. Klik op ‘gene expression’ –> filter links bij ‘tissue’ op heart –> klik op ‘smooth muscle cell’
7. Marker genes –> lijst met alle marker genen
8. Klik op ‘+ Add to dot plot’ om de plot te genereren