06 al 08 y del 27 al 31 de julio de 2015 de 9.00 a 18.00
CIFASIS- ROSARIO

Objetivos:

  • Familiarizarse con conceptos y terminologías propias de esta área.
  • Familiarizarse con los tipos de datos más comunes que son objeto de análisis en la Bioinformática.
  • Conocer las herramientas básicas de la bioinformática para el análisis de secuencias y las estrategias de uso.
  • Capacitar en el manejo de los programas y herramientas disponibles, con la posible aplicación a datos experimentales propios.
  • Interpretar los posibles resultados valorando la relevancia biológica de los mismos.
  • Adquirir conocimientos elementales del lenguaje de programación en Perl y aplicarlos a la Automatización de tareas propias del análisis de secuencias.

Dcentes Responsable:
Dr. Guillermo PRATTA

Docente:
Ing. Elec. Mg. Laura Mónica Angelone
Lic. Estefania Mancini,
Lic. Uciel Pablo Chorostecki
Dr. Luis Esteban

Carga horaria:40 horas presenciales
(30 hs de Clases Teóricas y 10 hs de Clases Prácticas.)

Contenidos:

Tema 1 (carga horaria: 8 hs):

  • Programación de tareas para el análisis de secuencias
  • Rudimentos de Perl. Variables. Tipos de Datos: escalares, arrays, hashes. Instrucciones de control de flujo. Operaciones con archivos. Funciones para manipular cadenas de texto. Distintos paradigmas en programación. Programación estructurada. Nociones de programación orientada a Objetos. Uso de blibiotecas BioPerl. Formatos de archivos de uso mas frecuente en Bioinformática: Fasta, GenBank, Embl, Pdb. Aplicación de BioPerl al Filtrado y procesamiento automático de Archivos Multifasta y archivos GeneBank.

Tema 2 (carga horaria: 8 hs):

  • Comparación de secuencias y búsqueda de similitudes
  • Definición del problema y motivación biológica. Bases evolutivas. Similitud vs. Homologías. Similitud vs. Identidad. Métodos. Nomenclatura biológica e informática. Programación dinámica. Gráfico de puntos (Dot-Plot). Tipos de alineamiento (local, global, extremos libres). Medidas de similitud de secuencias. Significado estadístico de la alineación. Generación de Matrices de store (BLOSUM, PAM).BLAST, PSI-BLAST, PHI-BLAST, Mega-Blast. Alineamiento múltiple de secuencias. Objetivo del alineamiento múltiple. Secuencia consenso. Métodos simultáneos. Métodos progresivos. Funciones Métricas de scoring. Algoritmos de aproximación. Alineamiento múltiple con consenso. Aspectos prácticos: Uso de CLUSTALW., T-Coffee.

Tema 3 (carga horaria: 6 hs):

  • Uso de programas de construcción y búsqueda de motivos
  • Patrones de secuencias y perfiles. Expresiones regulares. Matrices de probabilidad sitio específica. Perfiles mediante Hiden Marcov Models. Alineamientos contra perfiles HMM. Cantidad de información en motivos, Logos. Aplicaciones en base de datos (PFAM, SCOP, INTERPRO).

Tema 4 (carga horaria: 4 hs):

  • Análisis genómico
  • Tecnologías de Secuenciación de genomas. Calidad de secuencias. Ensamblado de secuencias genómicas.Algortimos : 1.Overlap computation (Superposición de cómputo) 2. Greedy (voraz) 3. Overlap-layout-consensus(OLC) (superposicion de esquemas consenso) 4. Eulerian path (camino Euleriano) 5.Scalfolding .Clusterización y reducción de redundancia. Métodos de Clusterizacion. Clasificaciones: a. Aglomerativos versus divisivos b. Monotéticas versus politéticas c. Hard versus fuzzy d. Determinísticos versus estocásticos e. Incremental versus no incremental. Metodos de Partición: Método de las K-Medias. Metodos Jerarquicos. Metodos no Jerarquicos. Distancias y Similitud de enlaces.Clasficación de acuerdo a la medida de Similitud de enlace entre clusters. Metodo del minimo o vecino más cercano.Metodo del maximo o distancia maxima. Metodo de la media o distancia promedio. Ponderado o no ponderado. Método del centroide o distancia prototipo. Método de la mínima varianza. Clustering basados en modelos numéricos: Self organizing Maps. Métodos basados en Grafos. Grupos de ortólogos (COGs). Ontología Génica (GO).

Tema 5 (carga horaria: 4 hs):

  • Filogenia Molecular: Evolución de secuencias
  • Filogenia y árboles filogenéticos. Árbol de la vida. Terminología: Ortólogos, Parálogos y Xenólogos. Datos usados en la construcción de árboles filogenéticos. Filogenia de genes versus Filogenia de especies. Tasas evolutivas. Definición de árbol evolutivo. Métodos de distancia. Métodos de máxima parsimonia. Métodos de máxima verosimilitud. Métodos bayesianos. Aplicaciones. Uso de Mega.

Programa analítico de prácticos (carga horaria: 10 hs):

  1. Escritura de un script en Perl para la resolución de una tarea específica.
  2. Búsqueda y comparación de secuencias usando NCBI blast y blast standalone.
  3. Alineamiento múltiple usando clustal y busqueda de motivos con HMMer de un conjunto de secuencias.
  4. Evaluación de la calidad y ensamblado de un conjunto de datos de secuencias obtenidos de secuenciación mediante la tecnología 454.
  5. Obtención de árboles filogenéticos con Mega, utilizando distintos modelos y algoritmos.

Actividades y formas de evaluación:
La metodología consistirá en clases teóricas y clases prácticas.
La evaluación constará de un examen final diferido que los alumnos deberán resolver individualmente y entregar en un lapso de dos semanas.

Requisitos para la aprobación:
Asistencia al 75 % de las clases y obtención de 6 puntos sobre 10 en el examen final diferido. Profesionales a los que está dirigido el curso:Biólogos, Ingenieros Agrónomos, Licenciados en Genética, Licenciados en Biotecnología, Licenciados en Análisis de Sistemas, Ingenieros Electrónicos, Licenciados en Estadística y carreras afines a Bioinformática. Cupo:Un mínimo de 5 alumnos y un máximo de 25 alumnos.

Se planea realizar de 10 hs de práctica, en salas equipadas con Computadoras.

Arancel: $1200

Bibliografía:

  • Essential Bioinformatics. Jin Xiong,.Camrige Universiity Press 2006
  • Biological sequence analysis. R. Durbin, S. Eddy, A. Krogh, G. Mitchison, Cambridge University Press, 2003.
  • Introduction to Bioinformatics. A. M. Lesk, , Oxford University Press 2002.
  • Introduction to Bioinformatics. T. K. Attwood, D. J. Parry-Smith. Pearson Education Asia. 2 nd Ed., 2002.
  • Bioinformatics Computing. B. Bergeron, Prentice Hall, New Jersey, 2003.
  • Developing Bioinformatics Computing Skills. C. Gibas, P. Jambeck, O’Reilly, Sebastopol, 2001
  • Beginning Perl for Bioinformatics. James Tisdall, O’Reilly Press, 2000
  • Mastering Perl for Bioinformatics. James Tisdall, O’Reilly Press, 2000
  • Perl Cookbok. Tom Christiansen & Nathan Torkington. O’Reilly & Associates,1999
  • Perl 5.0 Un lenguaje multiuso. Jose Miguel Prellezo Gutierrez, 2002
  • Bioperl course. Catherine Letondal and Katja Scuherrl

Informes e Inscripción:

Secretaría de Posgrado
Facultad de Ciencias Agrarias – UNR
Campo Experimental Villarino
C.C. 14 (S2125ZAA) Zavalla – Santa Fe
Tel: ++54 341 – 4970389 – 4970080
posgrado-agr@unr.edu.ar

Leave a Reply