Profesoras: Dra. Alicia Mastretta Yanes y M. en C. Azalea Guerra García
Brindar a los y las alumnas las herramientas computacionales y las mejores prácticas para manejar y explorar una gran cantidad datos de forma reproducible y robusta utilizando software libre, con un enfoque en datos secuenciación masiva y análisis genéticos.
El curso no se enfocará en ningún software especializado particular (e.g. en ensamblado de novo) sino que brindará las herramientas para que los y las alumnas sean capaces de aprender a utilizar por si mismos cualquier software especializado y organizar su propio proyecto bioinformático.
- Introducir a los y las alumnas a los principios de investigación reproducible en bioinformática y su importancia
- Introducir a los alumnos a Shell para manejo general de datos
- Introducir a los y las alumnos al pensamiento lógico y estructurado de la ejecución de un algoritmo
- Presentar a los alumnos los tipos de datos genéticos que se analizan con bioinformática
- Introducir a los y las alumnas al uso general de software especializado (ensambladores, alineadores, etc)
- Enseñar a los y las alumnas cómo organizar un proyecto bioinformático
- Formar a los y las alumnas en el uso de R para análisis bioinformáticos y gráficas
Tema | Horas teóricas | Horas prácticas |
---|---|---|
Unidad 1 Bioinformática e investigación reproducible | 2 | 1 |
1.1. Reproducibilidad y documentación de análisis bioinformáticos | ||
1.2. Repositorios de datos | ||
1.3. Código en computación | ||
1.4. Scripts y repositorios de código | ||
Unidad 2 Introducción a Unix Shell | 1 | 5 |
2.1. Introducción a la Consola y Línea de Comando | ||
2.2. Funciones básicas de navegación y manejo de archivos | ||
2.3. Funciones básicas de exploración de archivos | ||
2.4. Github | ||
2.4. Redirección | ||
2.5. Loops | ||
Unidad 3 Algoritmos y programación | 1 | 2 |
3.1. Lógica de la ejecución de un algoritmo | ||
3.2. Modularidad | ||
3.3. Cómo organizar un script | ||
Unidad 4 Uso general de software especializado y organización de un proyecto bioinformático | 2 | 4 |
4.1. Docker | ||
4.2. Utilidad de software especializado | ||
4.3. Instalación de software especializado | ||
4.4. Documentación de software especializado | ||
4.5. Organización de un proyecto bioinformático | ||
4.6. Markdown | ||
4.7. Github para organizar tu proyecto | ||
Unidad 5 Datos y análisis utilizados en bioinformática | 3 | 7 |
5.1. Datos crudos (e.g. Illumina raw reads) | ||
5.2. Información en los archivos FASTQ | ||
5.3. Análisis básicos de calidad y preparación de datos | ||
5.4. Datos procesados (e.g. Plink, VCF, BAM) | ||
5.5. Ensambladores de genomas y transcriptomas | ||
5.6. Ensambladores de datos RAD, GBS y símiles | ||
5.7. Mapeo a genoma de referencia | ||
5.8. Metabarcoding y símiles | ||
5.9. Importancia de elección de parámetros en análisis bioinformáticos | ||
Unidad 6 Introducción a R con un enfoque bioinformático | 4 | 9 |
6.1. RStudio | ||
6.2. Funciones básicas de R más importantes para bioinformática | ||
6.3. Limpieza de datos en R | ||
6.4. Graficar en R | ||
6.5. Funciones propias | ||
Unidad 7 Análisis de filogenias y genética de poblaciones | 2 | 9 |
7.1. Bioconductor y paquetes bioinformáticos en R | ||
7.2. Exploración gráfica y resumen de datos genéticos | ||
7.3. Estimación de parámetros genéticos | ||
7.4. Filogenias | ||
Unidad 8 Análisis bioinformáticos en pipeline | 5 | 5 |
8.1. Creación de “pipelines” para análisis de datos crudos a resultados | ||
8.2. Almacenamiento y reproducibilidad de un proyecto bioinformático |
Bibliografía básica
-
Haddock SHD, Dunn CW (2011) Practical computing for biologists. Sinauer Associates Sunderland, MA.
-
Buffalo V (2015) Bioinformatics data skills. O’Reilly.
-
Adler J (2010) R in a nutshell: A desktop quick reference. O’Reilly Media, Inc.
-
Beckerman AP, Petchey OL (2012) Getting started with R: an introduction for biologists. Oxford University Press.
Bibliografía complementaria
- Adegenet on the Web (2013). http://adegenet.r-forge.r-project.org/
- A Little Book of R for Bioinformatics (2013) http://a-little-book-of-r-for-bioinformatics.readthedocs.org/en/latest/index.html
- Bioconductor - Workflows (2015) http://www.bioconductor.org/help/workflows/
- File Format Reference - PLINK 1.9. (2015) http://pngu.mgh.harvard.edu/~purcell/plink2/formats.html
- Learn the Command Line | Codecademy (2015) https://www.codecademy.com/courses/learn-the-command-line
-
Acordeón de comandos Unix (Línea de comando) de FOSSwire [https://fosswire.com/post/2007/08/unixlinux-command-cheat-sheet/](https://fosswire.com/post/2007/08/unixlinux-command-cheat-sheet/)
- Montana, Giovanni. 2015. CRAN Task View: Statistical Genetics (2015) http://CRAN.R-project.org/view=Genetics
- Next Generation Sequencing (NGS)/Alignment - Wikibooks, Open Books for an Open World (2015) https://en.wikibooks.org/wiki/Next_Generation_Sequencing_(NGS)/Alignment
- Next Generation Sequencing (NGS)/De Novo Assembly - Wikibooks, Open Books for an Open World. (2015) http://en.wikibooks.org/wiki/Next_Generation_Sequencing_(NGS)/De_novo_assembly#Typical_workflow
- Next Generation Sequencing (NGS)/Pre-Processing - Wikibooks, Open Books for an Open World (2014) http://en.wikibooks.org/wiki/Next_Generation_Sequencing_(NGS)/Pre-processing#Sequence_Quality
- Try R. Code School (2015) [http://tryr.codeschool.com ](Try R. Code School)
- Population Genetics in R (2015) http://grunwaldlab.github.io/Population_Genetics_in_R/index.html
- R & Bioconductor – Manuals (2013) http://manuals.bioinformatics.ucr.edu/home/R_BioCondManual#TOC-Basics-on-Functions-and-Packages
- Reference-Guide – Rmarkdown Reference Guide (2015) http://rmarkdown.rstudio.com/RMarkdownReferenceGuide.pdf
- Bioconductor for Genomic Data Science, sitio del curso de Kasper Daniel Hansen http://kasperdanielhansen.github.io/genbioconductor/
- R Cheat sheet https://cran.r-project.org/doc/contrib/Short-refcard.pdf