Garantie de satisfaction à 100% Disponible immédiatement après paiement En ligne et en PDF Tu n'es attaché à rien 4.2 TrustPilot
logo-home
Resume

Bio-informatica - samenvatting/handig uitgebreid document examen

Vendu
2
Pages
49
Publié le
20-01-2025
Écrit en
2023/2024

Samenvatting van alle slides en notities voor het vak Bio-informatica gegeven in de 2de bachelor Biomedische Wetenschappen. Door dit document te gebruiken op het examen behaalde in een 18/20. Achteraan bezit het ook uitwerkingen van de oefenzittingen. Zeer handig document om te gebruiken tijdens het examen aangezien er ook uitwerkingen & hulpmiddelen inzitten voor sneller te werken. Handig om te gebruiken in combinatie met mijn uitgewerkte oefeningen van de slides in de voordeelbundel.

Montrer plus Lire moins











Oups ! Impossible de charger votre document. Réessayez ou contactez le support.

Infos sur le Document

Publié le
20 janvier 2025
Nombre de pages
49
Écrit en
2023/2024
Type
Resume

Aperçu du contenu

Bio-informatica
INHOUD
1. Databanken ............................................................................................................................................................................... 3
Entrez gene (NCBI): https://www.ncbi.nlm.nih.gov/gene/ ............................................................................................................ 3
Entrez nucleotide (NCBI): https://www.ncbi.nlm.nih.gov/nucleotide/ .......................................................................................... 3
Entrez protein (NCBI): https://www.ncbi.nlm.nih.gov/protein ...................................................................................................... 4
3D structuren Entrez Structure (NCBI): https://www.ncbi.nlm.nih.gov/Structure/index.shtml .................................................... 4
EMBL/EBI search (European databank): https://www.ebi.ac.uk/ .................................................................................................. 4
ENA (tegenhanger entrez nucleotide): https://www.ebi.ac.uk/ena/browser/home ..................................................................... 4
PUBMED: https://pubmed.ncbi.nlm.nih.gov/................................................................................................................................. 4
Uniprot: https://www.uniprot.org/ ................................................................................................................................................ 4
Gene ontology: https://geneontology.org/ .................................................................................................................................... 6
MGI (mouse base): https://www.informatics.jax.org/ ................................................................................................................... 6
Flybase: https://flybase.org/ .......................................................................................................................................................... 6
OBO Open Biomedical Ontologies (OBO): https://obofoundry.org/ .............................................................................................. 7
OMIM Online Mendelian Inheritance in Man: https://www.omim.org/ ....................................................................................... 7
Human Phenotype Ontology (HPO): https://hpo.jax.org/ .............................................................................................................. 7
UCSC Genome Browser: https://genome.ucsc.edu/ ...................................................................................................................... 7
Ensembl genome browser (europese versie van de UCSC): https://www.ensembl.org/index.html ........................................... 10
UCSC cell browser: https://cells.ucsc.edu/ ................................................................................................................................... 10
2. Query ....................................................................................................................................................................................... 11
MySQL ........................................................................................................................................................................................... 11
UCSC table browser: https://genome.cse.ucsc.edu/cgi-bin/hgTables ......................................................................................... 12
BioMart: https://www.ensembl.org/biomart/ ............................................................................................................................. 13
3. Linux .............................................................................................................................................................................................. 14
Inloggen ........................................................................................................................................................................................ 14
• Jupyter ..................................................................................................................................................................................... 16
Codes: (shift enter om de code uit te voeren, steeds spatie tussen eerste commando en het vervolg) ..................................... 16
Notebooks ..................................................................................................................................................................................... 19
5. BLAST ............................................................................................................................................................................................ 19
BLAST: https://blast.ncbi.nlm.nih.gov/Blast.cgi............................................................................................................................ 19
BLAT: https://genome.ucsc.edu/cgi-bin/hgBlat ........................................................................................................................... 20
6. Oefeningen in Jupyter ............................................................................................................................................................. 21
LINUX Oefeningen ............................................................................................................................................................................. 21
Intro .............................................................................................................................................................................................. 21
Notebook: Introduction_linux.ipynb & Copying_files ............................................................................................................... 21
Gene ontology ............................................................................................................................................................................... 21
Notebooks: Exercise_Linux_GOdownload.ipynb ....................................................................................................................... 21
1

, HeidiSQL ........................................................................................................................................................................................ 23
Table browser ............................................................................................................................................................................... 24
GO-exercise ................................................................................................................................................................................... 26
Verwerken van een quickGO file in jupyter (zie notebook: GO_download) ................................................................................. 26
Verwerken van sequenties in Jupyter ........................................................................................................................................... 27
Notebook: Exercise_Linux_Emboss.ipynb ................................................................................................................................. 27
2 bestanden overlappen in Jupyter (zie notebook: BEDTools) ..................................................................................................... 28
Notebook: BEDTools_example.ipynb ........................................................................................................................................ 28
Gene predection in Jupyter (2 notebooks) ................................................................................................................................... 28
ORF prediction: reading frame bepalen .................................................................................................................................... 28
Basic codon statistics – ORF prediction: codon usage – codon gebruik ................................................................................... 29
Advanced codon statistics - ORF prediction ............................................................................................................................. 29
Gene ID (ORF prediction + custom track UCSC) ........................................................................................................................ 29
Via GeneID genen voorspellen om een custom track van te maken in UCSC ter controle: ...................................................... 30
Pandas: SQL querry met python ............................................................................................................................................... 34
Dot plot ......................................................................................................................................................................................... 35
Notebook: Les 9 ........................................................................................................................................................................ 35
Alignment ...................................................................................................................................................................................... 35
Notebook: Les 9 ........................................................................................................................................................................ 35
Sequenties vergelijken en repeats vinden met dotplot ............................................................................................................ 35
Alignments + parameters zoeken ............................................................................................................................................. 35
Gene lists from expression analysis .......................................................................................................................................... 37
Pattern matching: patronen in sequenties zoeken ................................................................................................................... 39
7. Oefenzittingen .............................................................................................................................................................................. 41
Oefenzitting 1................................................................................................................................................................................ 41
Information retrieval ................................................................................................................................................................. 41
CpG eilanden (zie notebook werkzittingen 1) ........................................................................................................................... 42
Unknown sequence study ......................................................................................................................................................... 44
Oefenzitting 2................................................................................................................................................................................ 47
CpG eilanden met Python (zie notebook: python CpgIsland excercise) ................................................................................... 47
miRNA target genes discovery: (zie notebook: miRNA exercise) .............................................................................................. 47




2

,1. DATABANKEN

ENTREZ GENE (NCBI): HTTPS://WWW.NCBI.NLM.NIH.GOV/GENE/

=> Opzoeken van een gen, gen structuur annotatie
• Klikken op juiste gen in de lijst (kan filteren op organismen)
• Inhoud:
• Samenvatting
• Visualisatie van de locatie van het gen
o Elk verschillend lijntje is een andere isovorm van het gen (kan tot andere eiwitten lijden) en heeft
een andere NM identifier en een andere NP identifier
o Donker gekleurde blokjes = coding sequences
o Licht gekleurde blokjes = UTR
o Licht gekleurde lijntjes = intronen
• Expressie van het gen (welke organen/weefsels)
• Bibliografie (artikels uit PubMed gelinkt aan het gen)
• Geassocieerde ziekten
• Pathways
• Gene Ontology
• Refseq identifiers van al de mRNA’s en de bijhorende proteïnes (met link naar entrez nucleotide) -> hier
staat voor hoeveel verschillende proteïnes het gen codeert.
• mRNAs/CDS/exon/intron features

ENTREZ NUCLEOTIDE (NCBI): HTTPS://WWW.NCBI.NLM.NIH.GOV/NUCLEOTIDE/

=> databank die vol zit met nucleotide sequenties & alle mRNA’s

• Samenvatting: header
• Publicaties
• Features:
o Lengte
o Exon per exon: mRNA -> zegt waar de coderende regio’s liggen, waar de aparte exonen gelegen zijn
o CDS (van welk tot welk nucleotide de effectieve code van het gen zit -> alles hiervoor = 5’UTR en
alles hierna is 3’UTR tov de totale lengte van het gen)
o Poly A site
o Eiwitsequentie
• Onderaan mRNA sequentie: nucleotiden sequentie
• Downloaden FASTA
o Send to (rechts bovenaan)
o Complete record
o File
o Format: FASTA (enkel sequentie) of GENBANK (header + al de features + sequentie) -> flat tekst file
zijn beide




3

, ENTREZ PROTEIN (NCBI): HTTPS://WWW.NCBI.NLM.NIH.GOV/PROTEIN

=> databank die vol zit met proteïne sequenties

• Samenvatting
• Publicaties
• Features:
o Delen van het eiwit met bepaalde functies (bijvoorbeeld opzoeken DNA bindingsplaats !kan
verschillend zijn in elke isovorm van het gen)
• Onderaan aminozuur sequentie

3D STRUCTUREN ENTREZ STRUCTURE (NCBI):
HTTPS://WWW.NCBI.NLM.NIH.GOV/STRUCTURE/INDEX.SHTML
• Zien van 3D structuren van eiwitten

EMBL/EBI SEARCH (EUROPEAN DATABANK): HTTPS://WWW.EBI.AC.UK/

=> zelfde informatie als in NCBI maar een Europese back-up
• Gene and protein summary
• Link naar ENSEMBL
• DBFETCH: kan je met deze link meteen direct de FASTA file gaan extraheren als je dit mee in je code steekt
als commando
o http://www.ebi.ac.uk/Tools/dbfetch/dbfetch?
db=refseqn;id=NM_005225.3;format=fasta&style=raw
o Kan je gewoon in zoekbalk vanboven ingeven & dan heb je meteen een txt file in je browser
o Je kan format als fasta (= enkel nucleotide) kiezen of als default (= alle informatie)

ENA (TEGENHANGER ENTREZ NUCLEOTIDE): HTTPS://WWW.EBI.AC.UK/ENA/BROWSER/HOME

=> overnacht back-up van entrez gene
• Enkel gebruiken als entrez gene niet werkt.
• Accession number: U… (kan ook ingevoerd worden in Entrez nucleotide)
• Hier haal je EMBL formaten van

PUBMED: HTTPS://PUBMED.NCBI.NLM.NIH.GOV/
=> wetenschappelijke artikels

• Onderaan artikel bij ‘related information’ staat Refseq voor vernoemde genen en proteïnes.

UNIPROT: HTTPS://WWW.UNIPROT.ORG/

=> onderaan Entrez gene onder NM en NP identifiers ook identifier voor uniprot (P…)
• Functie eiwit
• Heel veel informatie over het eiwit
• Downloaden via knop download
o Tekst -> zoals Embl en genbank formaat
o Fasta file
o GFF -> 9 kolommen: eiwit ID, bron, start, stop, en note in de laatste kolom



4

Reviews from verified buyers

Affichage de tous les avis
6 mois de cela

6 mois de cela

Thanks for the review! Are there any comments that you give an average score to the document? If so, you can always send me a message!

3,0

1 revues

5
0
4
0
3
1
2
0
1
0
Avis fiables sur Stuvia

Tous les avis sont réalisés par de vrais utilisateurs de Stuvia après des achats vérifiés.

Faites connaissance avec le vendeur

Seller avatar
Les scores de réputation sont basés sur le nombre de documents qu'un vendeur a vendus contre paiement ainsi que sur les avis qu'il a reçu pour ces documents. Il y a trois niveaux: Bronze, Argent et Or. Plus la réputation est bonne, plus vous pouvez faire confiance sur la qualité du travail des vendeurs.
InMyBiomedEra Katholieke Universiteit Leuven
Voir profil
S'abonner Vous devez être connecté afin de suivre les étudiants ou les cours
Vendu
90
Membre depuis
1 année
Nombre de followers
1
Documents
27
Dernière vente
3 jours de cela

4,1

7 revues

5
2
4
4
3
1
2
0
1
0

Récemment consulté par vous

Pourquoi les étudiants choisissent Stuvia

Créé par d'autres étudiants, vérifié par les avis

Une qualité sur laquelle compter : rédigé par des étudiants qui ont réussi et évalué par d'autres qui ont utilisé ce document.

Le document ne convient pas ? Choisis un autre document

Aucun souci ! Tu peux sélectionner directement un autre document qui correspond mieux à ce que tu cherches.

Paye comme tu veux, apprends aussitôt

Aucun abonnement, aucun engagement. Paye selon tes habitudes par carte de crédit et télécharge ton document PDF instantanément.

Student with book image

“Acheté, téléchargé et réussi. C'est aussi simple que ça.”

Alisha Student

Foire aux questions