100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4,6 TrustPilot
logo-home
Samenvatting

Bio-informatica Samenvatting/ College aantekeningen

Beoordeling
-
Verkocht
1
Pagina's
60
Geüpload op
10-08-2023
Geschreven in
2022/2023

Bio-informatica samenvatting/ college aantrekkingen. In dit document staan alle oefeningen die in de les zijn gemaakt duidelijk uitgeschreven. Dit is ook een goed document om bij je examen te gebruiken aangezien hier alle oefeningen in staan en op het examen worden gelijke oefeningen gevraagd. Let op in dit document staan enkel de lessen van Stein Aerts en dus Bash. Zelf dit document geschreven en gestudeerd en door met 16/20 eerste zit.

Meer zien Lees minder
Instelling
Vak











Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Geschreven voor

Instelling
Studie
Vak

Documentinformatie

Geüpload op
10 augustus 2023
Aantal pagina's
60
Geschreven in
2022/2023
Type
Samenvatting

Onderwerpen

Voorbeeld van de inhoud

Bio-informatica
Bash

, Bio-informatica
Les 1:


Part I Databases:


ENTREZ GENE: is een databank die informatie geeft over een gen.
• Te vinden door https://www.ncbi.nlm.nih.gov/gene/ te zoeken
• Vaak is de bovenste optie het gen. De opties die verder nog worden gegeven zijn op basis van textsearch.
• Hier is als voorbeeld het gen Tp53 gebruikt. Let goed op want p53 is het proteïne en Tp53 het gen.




• Onder het kopje ‘Genomic regions, transcripts and products’ staat informatie over de verschillende regio’s van het gen.




• Aan de rechterkant staan links naar Genome Browsers en andere data bases.

UCSC, Ensembl, PubMed, Nucleotide, OMIM.


Potentiële examenvraag:

Hoeveel mRNA vormen bij een bepaald gen? Nu bijvoorbeeld Tp53?
= 15 afschriften.

,• Tp53 is een van de bekendste genen.
• Elke lijn is een isovorm van een transcript door verschillende promotoren en alternatieve splicing.
• Elke lijn heeft een unieke RefSeq indentifier NM_identifier. Deze NM transcripten hebben ook een unieke NP_protein entry.
• Onderaan de Gene pagina staat de NCBI Reference Sequence (RefSeq) met daarin informatie over deze NM/NP’s.




FLATFILE in ‘GeneBank format’

• Entrez Nucleotide bevat alle nucleotiden sequences.
• Opzoeken via NM_
• Na een punt (NM_000564.6) is het versie nummer. Header



REFSEQ: Een secundaire databank. Hier staan meer sequences in dan in GenBank.
• Hierin staat een entry per mRNA.



FLATFILE in ‘GeneBank format’ (.GB)
• Nucleotide ENTREZ
• Je maakt gebruik van een accession number bijvoorbeeld U54469.
• Deze flatfile bestaat uit een header, features en een sequence.

Features

FLATFILE in ‘FASTA FORMAT’ (.FASTA)
• >U54469.1 is de sequence identifier
• Kan in een nucleotide sequence weergegeven worden (>U) en in een
protein sequence (>P).



FLATFILE is een platte database en in wezen een eenvoudige tabel.

Sequence

, Deze FLATFILE’s kan je editten en openen in een text editor. In een text editor kan je ook codes schrijven in programmeertaal.

• In Mac OS: vi, Emacs, TextWrangler / BBEdit



EUROPEAN BD- EMBL/EBI: Ook een databank
• Geeft vaak informatie rondom een ziekte.
• EBI linkt vaak naar Ensembl.



DBFETCH: Hiermee kan je data opzoeken van EMBL/EBI.
EUROPEAN NUCLEOTIDE ARCHIVE (ENA): Ook een database, maar wordt
vaak gebruikt als bijvoorbeeld PubMed niet beschikbaar is. Database van het
Europese continent.



EXERCISE

Find publication in PubMed with PMID 29764999

Explore the Gene and Nucleotide(RefSeq) links in the “Related Information”

• Which gene is it linked to?

• What is the NM indentifier?

Download GenBank formatted flatfile

Download flatfile using DBFetch (use format=default) Open in text editor

• BBEdit for Mac OS X

Uitwerking:

• Zoek naar Gene ENTREZ en verander vervolgens gene naar PubMed.




• Scroll naar beneden en klik op ‘Gene’ onder het kopje ‘Related information’. Hier is te zien dat het gaat om GENE E2F1.
• Scroll naar beneden op deze pagina en onder het kopje ‘NCBI Reference Sequences (RefSeq)’ bij ‘mRNA an Protein’s’ staat de
NM indentifier namelijk: NM_005225.3.
• Om vervolgens de GenBank formaties flatfile te downloaden moet je op deze NM_ indentifier klikken. Deze leidende naar de
nucleotide ENTREZ. Hier kan je de GenBank formatted FLATFILE downloaden in de rechter hoek.

• Laatste stap met DBFetch begrijp ik nog niet helemaal.
€12,99
Krijg toegang tot het volledige document:

100% tevredenheidsgarantie
Direct beschikbaar na je betaling
Lees online óf als PDF
Geen vaste maandelijkse kosten

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
SarahSilke Katholieke Universiteit Leuven
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
20
Lid sinds
3 jaar
Aantal volgers
15
Documenten
4
Laatst verkocht
1 jaar geleden

0,0

0 beoordelingen

5
0
4
0
3
0
2
0
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen