100% de satisfacción garantizada Inmediatamente disponible después del pago Tanto en línea como en PDF No estas atado a nada 4,6 TrustPilot
logo-home
Resumen

Samenvatting Kennisclip file formats

Puntuación
4.0
(3)
Vendido
-
Páginas
3
Subido en
03-03-2018
Escrito en
2017/2018

Dit is een samenvatting van de kennisclip over file formats. Onderwerpen die hier aan bod komen, zijn: fasta files, file extension, Phred score, ASCII tabel, fastq files, metadata, Genbank, tab-separated values, TSV, compressed files etc.

Mostrar más Leer menos
Institución
Grado








Ups! No podemos cargar tu documento ahora. Inténtalo de nuevo o contacta con soporte.

Escuela, estudio y materia

Institución
Estudio
Grado

Información del documento

Subido en
3 de marzo de 2018
Número de páginas
3
Escrito en
2017/2018
Tipo
Resumen

Temas

Vista previa del contenido

Kennisclip file formats
Fasta files, biologische sequenties kunnen als fasta files opgeslagen worden. Hier kan je bijvoorbeeld
een nucleotide sequentie in weergeven, maar ook een eiwitsequentie. De file extensies die hierbij
horen zijn .fasta, .fna (fasta nucleid acid), .faa (fasta amino acid) of .fa. Fasta files zijn ‘plain text files’
wat wil zeggen dat je ze kan bekijken in ‘plain text editors’ als Notepad++, Sublime text, Wordpad en
Emacs. Het is dan ook handig om op je laptop in te stellen welk programma welke extensie opent.
File extension, als je een vreemde extensie tegenkomt is het altijd handig om ze eerst via een plain
text editor te openen om te kunnen zien om wat voor data file het gaat.
Regels fasta files, er zijn een paar regels die voor elk fasta file gelden:
- Elke sequentie bestaat uit minstens
twee regels.
- De eerst regel begint met ‘>’ gevolgd
door het ID van de sequentie. Dit ID
loopt door tot de eerste spatie van de
eerste regel.
- Elk ID is uniek in het file om voor elke
sequentie een eigen ‘identifier’ te
hebben.
- Er kan extra informatie in de eerste
regel staan buiten het ID. Deze komen
dan na de eerste spatie.
- De tweede regel (en mogelijke regels
daarna) bevatten de sequentie.
- Spaties in de sequentie hebben geen
betekenis. Ze zijn enkel toegevoegd voor duidelijkheid. Hierdoor kan het namelijk makkelijker
zijn om de sequentie te lezen.
Lettergebruik fasta files, voor nucleotide sequenties worden met name A, T, C en G
gebruikt en voor aminozuursequenties de letters van de 20 aminozuren. Als je echter
wat verder inzoomt zie je dat ‘N’ ook weleens gebruikt wordt voor
nucleotidesequenties en dat bij aminozuursequenties weleens de letter ‘X’ gebruikt
wordt. ‘N’ en ‘X’ geven aan dat het niet bekend is wat voor aminozuur/residu op die
positie aanwezig is. Vandaar dat we dit een ‘ambiguity factor’. Als je dan nog verder
inzoomt, zie je dat er nog meer letters gebruikt worden voor de nucleotidesequentie.
Dat zijn andere nucleotide ambiguity factors. In tegen stelling tot N geven zij niet aan
dat op de betreffende positie A, C, T of G zit, maar dat er bijvoorbeeld maar twee of 3
opties zijn.
Nauwkeurigheid, het feit dat er ‘ambiguity factors’ in fasta files aanwezig zijn,
komt door de nauwkeurigheid van DNA sequencing machines. Bij Sanger
Sequencing wordt bijvoorbeeld m.b.v. lichtsignalen aangegeven welk nucleotide
aanwezig is, maar soms overlappen deze lichtsignalen elkaar en is niet met
zekerheid te zeggen welke van de vier nucleotides op de betreffende positie
aanwezig is. Hetzelfde geldt voor Illumina sequencing waarbij de kleur van een
cluster dubbelzinnig kan zijn. Sequencing machines schatten de mogelijkheid
dat een nucleotide verkeerd doorgegeven wordt en wordt weergegeven in de
Phred score.
Phred score, geeft de kwaliteit van de nucleotide aan, waarbij een hoge score een goede kwaliteit
aangeeft en een lage score een lage kwaliteit aangeeft. Zo geeft een score van 30 (hoog) aan dat de
kans 10-3 is dat een nucleotide verkeerd doorgeven is. Er is dus een nauwkeurigheid van 99,9%. Een
Phred score van 20 geeft aan dat 1 op de 100 (10 -2) nucleotides fout kan zijn en dit is een
nauwkeurigheid van 99%. Verder is een score van 10 ook nog een mogelijkheid en hierbij is de
nauwkeurigheid maar 90%.
$4.26
Accede al documento completo:
Comprado por 0 estudiantes

100% de satisfacción garantizada
Inmediatamente disponible después del pago
Tanto en línea como en PDF
No estas atado a nada


Documento también disponible en un lote

Reseñas de compradores verificados

Se muestran los 3 comentarios
7 año hace

7 año hace

7 año hace

4.0

3 reseñas

5
1
4
1
3
1
2
0
1
0
Reseñas confiables sobre Stuvia

Todas las reseñas las realizan usuarios reales de Stuvia después de compras verificadas.

Conoce al vendedor

Seller avatar
Los indicadores de reputación están sujetos a la cantidad de artículos vendidos por una tarifa y las reseñas que ha recibido por esos documentos. Hay tres niveles: Bronce, Plata y Oro. Cuanto mayor reputación, más podrás confiar en la calidad del trabajo del vendedor.
brittheijmans Universiteit Utrecht
Seguir Necesitas iniciar sesión para seguir a otros usuarios o asignaturas
Vendido
634
Miembro desde
8 año
Número de seguidores
290
Documentos
381
Última venta
10 meses hace

Mijn samenvattingen bevatten altijd kleurtjes om de belangrijke begrippen aan te duiden en verder gebruik ik veel figuren om zaken uit te leggen. Heb je echter toch nog vragen, dan kan je altijd contact met met opnemen. Ik heb eerst 3 jaar biologie gestudeerd en ben nu bezig met een master om zowel arts als klinisch onderzoeker te worden.

4.4

533 reseñas

5
308
4
149
3
53
2
4
1
19

Recientemente visto por ti

Por qué los estudiantes eligen Stuvia

Creado por compañeros estudiantes, verificado por reseñas

Calidad en la que puedes confiar: escrito por estudiantes que aprobaron y evaluado por otros que han usado estos resúmenes.

¿No estás satisfecho? Elige otro documento

¡No te preocupes! Puedes elegir directamente otro documento que se ajuste mejor a lo que buscas.

Paga como quieras, empieza a estudiar al instante

Sin suscripción, sin compromisos. Paga como estés acostumbrado con tarjeta de crédito y descarga tu documento PDF inmediatamente.

Student with book image

“Comprado, descargado y aprobado. Así de fácil puede ser.”

Alisha Student

Preguntas frecuentes