Samenvatting

Uitgebreide samenvatting bio-informatica

Name: Uitgebreide samenvatting bio-informatica
SKU: doc_7231812
Rating: 3.50 (2 reviews)
Author: hannahgastmans1

Beoordeling

3.5

(2)

Verkocht

Pagina's

Geüpload op

11-02-2025

Geschreven in

2024/2025

Uitgebreide samenvatting van de theorie van het vak bio-informatica. Gemaakt a.d.h.v. de slides en notities tijdens de les. Heb met deze samenvatting in 1ste zit een 16 gehaald.

Instelling

Vak

Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Meld schending auteursrecht

Geschreven voor

Instelling: Universiteit Antwerpen (UA)
Studie: Biochemie En Biotechnologie
Vak: Bio informatica

Alle documenten voor dit vak (4)

Documentinformatie

Geüpload op: 11 februari 2025
Aantal pagina's: 71
Geschreven in: 2024/2025
Type: Samenvatting

Onderwerpen

bio informatica
biochemie
biotechnologie
informatica
biomedische
universiteit antwerpen
samenvatting

Voorbeeld van de inhoud

Bio-informatica
H1 Computer science background

1.1 Databases

Er zijn verschillende manieren om data te bewaren:

 Papier
 Flat files
o Geen structuur
o Geen metadata  geen uitleg wat wat is, geen uniform systeem
 Vb.: excel document, word document etc.

 Databases  2 soorten:
1. Relationele
2. NoSQL

Relational databases

Gegevens opgeslagen in een reeks tabellen die met elkaar verbonden zijn door een
gedefinieerde logica  kunnen hier gerichte vragen aan stellen

NoSQL databases

Alles wat niet efficiënt in een gewone databank past, kan hierin

1.2 Algorithms

Algoritme = set aan regels om mee te rekenen, meestal uitgevoerd door een computer
programma MAAR is niet noodzakelijk

 Voorbeelden zonder computer: staartdeling, routeplanner

VROEGER: traditionele algoritmes werden geproduceerd door een software engineer

NU: algoritmes die geoptimaliseerd worden a.d.h.v. voorbeelden  self-learning of
machine learning (AI)

! LET OP: algoritmes komen met bepaalde assumpties, vb.: bij routeplanner dat je met de fiets
gaat DUS een correcte uitkomst kan enkel bekomen worden wanneer deze assumpties
correct zijn

Toegepast voorbeeld

We willen een DNA-sequentie laten transleren door een algoritme  PROBLEEM: levert 6
theoretisch mogelijke AZ sequenties op WANT weten niet waar de translatie start en of we de
sequentie v/d leading of de lagging strand hebben

Pairwise sequence alignment algorithm

Voorloper op wat we in het volgend hoofdstuk gaan zien

Resultaten vergelijken  resultaten zo plaatsen dat ze zoveel mogelijk
gelijkenissen in dezelfde kolom hebben

1

,1.3 Principles of classification

Veel problemen die we willen oplossen in de bio-informatica zijn klassificatie problemen 
willen een correct label geven  gebruiken de ‘confusion matrix’ als
representatie

Confusion matrix

Kunnen hiermee ook verschillende dingen berekenen:

 Accuraatheid: beschrijft welke fractie van alle classificaties resulteerde in een correct
toegewezen label
 Gevoeligheid: beschrijft welke fractie van de positieve gevallen als zodanig werd
geïdentificeerd
 Specificiteit: beschrijft welke fractie van alle negatieve gevallen
als zodanig is geïdentificeerd

Computers maken soms fouten  we onderscheiden 2 grote fouten:

 Vals positief = type I fout
 Vals negatief = type II fout

Voor elke toepassing kan je uitmaken welke fout het ergste is, vb.: liever minder vals
negatieve bij diagnostiek dan vals positieve

! EXAMEN: wordt vaak gevraagd om manueel uit te rekenen

ROC analysis

Gaan algoritmes zo optimaliseren dat de fout dat we willen vermijden afneemt MAAR dan zal
de andere fout stijgen  spelen met een drempelwaarde tussen de 2 fouten door met
gevoeligheid en specificiteit te spelen  plotten in ‘receiver operating characteristic’

! EXAMEN: geen vraag over

1.4 Graph theory

Gaat over het omgaan met graphen
 Graph = mathematische structuur, netwerk dat bestaat uit
knooppunten (nodes) en de relaties in het netwerk (edges)

Graph representatie kan ook omgezet worden in een adjacency matrix of in een adjacency list

Enkele begrippen
2

,Path = combinatie aan edges
Cycle = pad dat terug uitkomt bij zijn beginpunt
Clique = stukje v/d graph waarin alles zeer sterk met elkaar verbonden is
Node degree = hoeveel edges een node met zich geconnecteerd heeft

Verschillende soorten graphen

Undirected = edges hebben geen richting
Directed = gerichte graph, beide richtingen v/e edge kunnen een
andere betekenis hebben
Mixed = combinatie v/d twee

Paden

Vaak meer dan 1 pad om 2 nodes met elkaar te verbinden  zoeken naar het korste pad
 Algoritmes ontwikkeld om het korste pad te berekenen
o Dijkstra’s algoritme: berekent het korste pad voor een nodenpaar
o Floyd-Warshall algorithm: berekent de kortste paden tussen alle nodenparen

! Als we de afstand tussen 2 noden willen definiëren nemen we ALTIJD het kortste pad

1.5 Computational complexity

Sommige problemen zijn ook voor computers moeilijk op te lossen met enkel ‘brute kracht’ (=
alle mogelijke oplossingen berekenen), vb.: ‘the travelling salesman problem’

De efficiëntie v/e algoritme wordt bepaald a.d.h.v. de duur van de berekeningen
(tijdscomplexiteit) of het geheugen dat het algoritme aankan
voor de input (ruimtecomplexiteit)
 Big-O notation = beschrijven hoe het algoritme verandert
wanneer de omvang groter wordt

Kunnen de Big-O notation van verschillende algoritmes
makkelijk met elkaar vergelijken

Voorbeeld: the travelling salesman problem

Complexity classes

Problemen worden ingedeeld o.b.v. hun complexiteit:

 P problems: kunnen worden opgelost in een polynomiale tijd
 NP problems: er is geen efficiënte manier om het probleem op te lossen MAAR een
kandidaat oplossing kan wel worden nagekenen in polynomiale tijd
 NP complete problems: het moeilijkste type NP problems
 NP hard problems: niet enkel NP en moeilijker dan de NP complete problems

3

, Veel problemen zijn te lastig om op te lossen  OPLOSSING: i.p.v. ‘de perfecte’ oplossing te
zoeken, zoeken we gewoon naar een ‘goede’ oplossing  we onderscheiden dus 2 methodes:

1. Exhaustive: systematisch alle kandidaten
‘checken’, brute kracht

2. Heuristic: gericht specifieke kandidaten ‘checken’
 MAAR kan zijn dat de bekomen oplossing niet
de beste oplossing is die er bestaat

Zoekprobleem

Veel problemen bestaan eruit om de beste oplossing te zoeken in een groot aanbod van
mogelijke oplossingen = zoekprobleem

Zoekalgoritme

Hebben een probleem als input en geven een oplossing terug die de
beste waarde van objectieve functie (= functie die de kwaliteit v/d
kandidaatoplossing aangeeft) heeft

Voorbeeld: woord zoeken in tekst
 Brute kracht: alle woorden scannen
 Heuristics: index gebruiken

Voorbeeld: zoeken de x-waarde waarvoor de y-waarde maximaal is  kunnen alle waarden
van x afscannen (brute kracht)  kunnen ook naar de pieken gaan kijken MAAR hebben dan
mss niet de hoogste piek: noemen dit een lokaal optimum  globaal optimum is voor de hele
zoekruimte de hoogste

Kan zich ook voordoen in meerdere dimensies  veel complexer

Optimalisatiemethoden

We gebruiken optimalisatie methoden i.p.v. brute kracht

Bij optimalisatiemethoden maken we gebruik van iterative improvement  beginnen v/e
oplossing die niet optimaal is en gaan deze stapje per stapje beter maken tot we een betere
oplossing krijgen

Voorbeelden van optimatlisatie methodes:

- Hill climbing
- Simulated annealing
- Evolutionary / genetic algorrithms

Hill climbing

Het begint met een willekeurige oplossing voor een probleem, om vervolgens een betere
oplossing te vinden door een stapsgewijze verandering aan te brengen in de oplossing  als
de verandering een betere oplossing oplevert, wordt er een nieuwe verandering in de nieuwe
oplossing aangebracht en zo verder tot er geen verbetering meer mogelijk is

Voorbeeld: berg beklimmen  willen de hoogste coördinaat vinden  paracommando uit
vliegtuig: vertrekt vanuit 1 punt en zet elke keer een stap in een random richting, als deze
hoger is dan blijft die staan en gaat die vandaar verder maar als het lager of hetzelfde gaat
die terug naar zijn beginpunt

4

$14.59

Krijg toegang tot het volledige document:

100% tevredenheidsgarantie

Direct beschikbaar na je betaling

Lees online óf als PDF

Geen vaste maandelijkse kosten

Maak kennis met de verkoper

hannahgastmans1

3.7

(6)

Beoordelingen van geverifieerde kopers

Alle 2 reviews worden weergegeven

romellocavaliere Biochemie · 22 beoordelingen

4 weken geleden

jensvanlerberghe1 Biochemie En Biotechnologie · 16 beoordelingen

1 maand geleden

3.5

2 beoordelingen

Betrouwbare reviews op Stuvia

Alle beoordelingen zijn geschreven door echte Stuvia-gebruikers na geverifieerde aankopen.

Maak kennis met de verkoper

hannahgastmans1 Universiteit Antwerpen

Bekijk profiel

Volgen

Verkocht

Lid sinds

1 jaar

Aantal volgers

Documenten

Laatst verkocht

1 week geleden

3.7

6 beoordelingen

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper hannahgastmans1. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor $14.59. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews) Afgelopen 30 dagen zijn er 50201 samenvattingen verkocht Opgericht in 2010, al 15 jaar dé plek om samenvattingen te kopen