Visualizar mapeos y control de calidad
Overview
Teaching: 60 min
Exercises: 30 minQuestions
¿Cómo visualizo las lecturas alineadas al genoma de referencia?
Objectives
Visualización de mapeos con JBROWSE2
JBROWSE nos permite visualizar los archivos bam (que hayan sido ordenados con sorted e indexados con index) Primero debemos cargar el genoma usando OPEN SEQUENCE FILE En Type elegir FastaAdapter, luego Choose file para seleccionar el archivo Saccharomyces_cerevisiae.R64-1-1.dna.toplevel.fa que esta en la carpeta reference_genome/ Poner un nombre provisorio al genoma en Assembly Name (ejemplo “Saccer3”)
Ahora que tenemos el genoma cargado, podemos abrir los archivos .sorted.bam. También para visualizar la posición de los genes anotados en el genoma, abriremos el archivo .gff3 que esta en la carpeta referece_genome Para una rápida comparación de los tres tipos de ensayos que tenemos, cargamos un archivo sorted.bam de DNAseq, ATACseq, y un archivo de RNAseq:
Para visualizar los mapeos tendremos que acercarnos a una región del genoma
Como pueden ver, los mapeos de reads caen en distintos lugares dependiendo de nuestros ensayos. Mapeos de DNAseq cubren en general todo el genoma, los de ATACseq se concentran en las regiones promotoras, y RNAseq se concentran en las regiones codificantes. También podemos visualizar las variantes que corresponden a las diferencias de nuestras cepas con el genoma de referencia que proviene de la cepa de laboratorio S288C
Analisis de calidad con QUALIMAP
Instalaremos qualimap usando mamba
mamba install -c bioconda qualimap
Generaremos informes HTML de cada archivo de mapeo (sorted.bam) con el siguiente script:
for FILE in bam/sorted_bam/*.sorted.bam;do qualimap bamqc -bam $FILE;done
También usaremos el modulo rnaseq de qualimap para un analisis más detallado de los mapeos de RNAseq
for FILE in bam/sorted_bam/*RNAseq*.sorted.bam;do qualimap rnaseq -bam $FILE -gtf reference_genome/Saccharomyces_cerevisiae.R64-1-1.57.gff3;done
Podemos realizar nuevamente un informe conjunto con MULTIQC
multiqc -o bam/sorted_bam/ bam/sorted_bam/
Key Points
Utilizar herramientas visuales para examinar el alineamiento de lecturas