Este es el repositorio de apuntes y código del curso Introducción a la bioinformática e investigación reproducible para análisis genéticos semestre 2017-II, brindado por las profesoras Dra. Alicia Mastretta Yanes y M. en C. Azalea Guerra.
El curso pertenece al Posgrado en Ciencias Biológicas de la Universidad Nacional Autónoma de México pero los materiales aquí presentados son de acceso libre.
El objetivo general del curso es brindar alumna/os con una formación en biología las herramientas computacionales y las mejores prácticas para manejar y explorar una gran cantidad datos de forma reproducible y robusta utilizando software libre, con un enfoque en datos secuenciación masiva y análisis genéticos.
Para más detalles:
El repositorio está dividido en un folder por Unidad. Dentro de cada folder subiremos los apuntes y código utilizado en cada clase conforme los vayamos viendo en el semestre, así como los enlaces a las tareas.
Las notas de este repositorio están escritas en formato Markdown y, como notarás, el repositorio se encuentra hospedado en GitHub.
Cubriremos ambas herramientas en el curso, pero en resumen:
-
Markdown es un procesador texto-a-HTML que de forma sencilla permite formatear texto
así
. Esto es útil para resaltar los los comandos y los resultados de la terminal del resto del texto en los documentos de clase (y en foros de ayuda). -
GitHub es un repositorio web especializado en software (pero se puede subir cualquier texto, como este). La parte de arriba enlista los archivos y carpetas dentro del repositorio. La nota de texto a su derecha es el comentario que yo realicé al subir o modificar (commit) el archivo de mi computadora a GitHub. En la parte de abajo puedes leer el contenido de dichos archivos en formato html. Y si los bajas los verás en formato Markdown.
Brindar a los y las alumnas las herramientas computacionales y las mejores prácticas para manejar y explorar una gran cantidad datos de forma reproducible y robusta utilizando software libre, con un enfoque en datos secuenciación masiva y análisis genéticos.
El curso no se enfocará en ningún software especializado particular (e.g. en ensamblado de novo) sino que brindará las herramientas para que los y las alumnas sean capaces de aprender a utilizar por si mismos cualquier software especializado y organizar su propio proyecto bioinformático.
- Introducir a los y las alumnas a los principios de investigación reproducible en bioinformática y su importancia
- Introducir a los alumnos a Shell para manejo general de datos
- Introducir a los y las alumnos al pensamiento lógico y estructurado de la ejecución de un algoritmo
- Presentar a los alumnos los tipos de datos genéticos que se analizan con bioinformática
- Introducir a los y las alumnas al uso general de software especializado (ensambladores, alineadores, etc)
- Enseñar a los y las alumnas cómo organizar un proyecto bioinformático
- Formar a los y las alumnas en el uso de R para análisis bioinformáticos y gráficas