You are on page 1of 4

Carolina Len 201117354

Taller Genmica y Bioinformtica (hasta ensamblaje)


1.

DATOS DE SECUENCIACIN Los datos de secuenciacin que vamos a utilizar


corresponden a lecturas obtenidas por secuenciacin de siguiente generacin en el
equipo Illumina, con libreras pareadas o Paired-end. Se encuentran disponibles en el
cluster en la carpeta ~/jl.moreno116/Semana_10 y tambin disponibles en el link
https://bce.uniandes.edu.co/exchange/plasmid/. Cpielos a su carpeta personal en
clustergate. Usando Galaxy, revise la calidad de sus secuencias, para esto est el
programa FastQC. Cuntas lecturas tiene? Copie sus grficas de calidad
Grfica de calidad para la secuencia 2:

Se reportan un total de 31602 secuencias.

Grfica de calidad para la secuencia 3:

Se reportaron un total de 31602 secuencias.

Los datos muestran un claro detrimento hacia el final de la lectura, que puede indicar la
presencia de adaptadores como contaminantes, por lo tanto esta zona debe ser
limpiada.

ENSAMBLAJE CON VELVET


Primero se inici una sesin interactiva usando qsub i q short y se entr a la carpeta
02_limpieza. All se ejecut el comando module load velvet/1.2.10
K-mero= 20
[mbio3518@node-7 02_limpieza]$ velveth ensamblaje_20 20 -fastq -shortPaired
r1Paired.fastq r2Paired.fastq
[0.000000] Velvet can't work with even length k-mers, such as 20. We'll use 19 instead,
if you don't mind.
[0.096862] Reading FastQ file r1Paired.fastq;
[0.169999] 30868 sequences found
[0.170006] Done
[0.329394] Reading FastQ file r2Paired.fastq;
[0.397372] 30868 sequences found
[0.397380] Done
[0.410730] Reading read set file ensamblaje_20/Sequences;
[0.420793] 61736 sequences found
[0.471825] Done
[0.471836] 61736 sequences in total.
[mbio3518@node-7 02_limpieza]$ velvetg ensamblaje_20 -scaffolding off
-min_contig_lgth 500 -cov_cutoff auto
Final graph has 6 nodes and n50 of 4090, max 4090, total 4138, using
0/61736 reads
K-mero= 25

En velveth dio el mismo resultado que para el k-mero 20


[mbio3518@node-7 02_limpieza]$ velvetg ensamblaje_25 -scaffolding off
-min_contig_lgth 500 -cov_cutoff auto
Final graph has 3 nodes and n50 of 2644, max 2644, total 4123, using
0/61736 reads
K-mero =30
En velveth dio el mismo resultado que para el k-mero 20
[mbio3518@node-7 02_limpieza]$ velvetg ensamblaje_30 -scaffolding off
-min_contig_lgth 500 -cov_cutoff auto
Final graph has 1 nodes and n50 of 4119, max 4119, total 4119, using
0/61736 reads
K-mero = 33
En velveth dio el mismo resultado que para el k-mero 20
[mbio3518@node-7 02_limpieza]$ velvetg ensamblaje_33 -scaffolding off
-min_contig_lgth 500 -cov_cutoff auto
Final graph has 1 nodes and n50 of 4148, max 4148, total 4148, using
0/61736 reads
Personalmente creo que el mejor kmero fue de 30, aunque en realidad velvetg lo tom
como 29 ya que un nmero impar de kmeros impide la formacin de palndromos en el
grafo, de igual forma el tamao del kmero no debe ser muy grande pues a mayores Kmeros se obtienen mayores tamaos de contigs pero se requiere un mayor profundidad
de secuenciacin o una mayor longitud de las lecturas para poder garantizar que las
lecturas cortas cubren ms que un tamao seleccionado de Kmer para cada posicin
genmica1. Asimismo, si el tamao del kmero es muy pequeo el grafo de Bruijin se
complica ya que lo kmeros corresponden a las aristas de este. De igual forma, ya que el
n50 corresponde al contig ms grande que el 50% de los contigs es ptimo que sea
alto.
Valores en FASTQC luego de que las secuencias fuesen limpiadas
(FASTQC despus de limpiadas con las secuencias pareadas)
Secuencia

1
3

%GC
antes

%GC
despus

45
44

44
44

Longitud
de la
secuencia
antes
101
73-101

Longitud
de la
secuencia
despus
1-101

Lecturas
totales
antes

Lecturas
totales
despus

31602
31602

30627
30627

FASTQ despus de limpiadas con las secuencias no pareadas


Secuencia
1
3

%GC
44
44

Longitud de la
secuencia
2-101
1-101

Lecturas totales
581
243

1 Tomado de: ESTUDIO Y EVALUACIN DE ALGORITMOS Y PROGRAMAS DE ENSAMBLAJE DE


SECUENCIAS, Miguel Hormigo Ruiz. Universidad Internacional de Andaluca, 2011

You might also like