21 y 22 de marzo de 2018
11 y 12 de abril de 2018.
16 y 17 de mayo de 2018
Días Miércoles de 14.00 a 17.00 hs y Jueves de 9.00 a 16.00 h
Ocampo y Esmeralda – CIFASIS Rosario

Docentes:
Dra. Elizabeth Tapia

Objetivos:
Comprender los principios del aprendizaje a partir de datos y su aplicación al desarrollo de soluciones para problemas de Ciencias Biológicas en general y de Biología Molecular en particular. El desarrollo de estas soluciones requiere la utilización de técnicas provenientes del aprendizaje de patrones y de la estadística y la introducción de información específica del dominio de aplicación a los efectos de resolver problemas de dimensionalidad y/o ruido en los datos fuente.

Profesionales a los que está dirigido el curso:
Biólogos, Ingenieros Agrónomos, Licenciados en Genética, Licenciados en Biotecnología, Licenciados en Análisis de Sistemas, Ingenieros Electrónicos, Licenciados en Estadística y carreras afines a Bioinformática.

Contenidos:  

Tema 1 – Fundamentos del Aprendizaje (6 hs)
Aprendizaje a partir de datos y tipos de aprendizaje. Aprendizaje no supervisado vs. supervisado. Aprendizaje semi-supervisado. Componentes y factibilidad del aprendizaje. Clasificación y regresión lineal.

Tema 2 – Evaluación del aprendizaje (6 hs)
Medidas de Error. Entrenamiento y evaluación. Generalización. Sobreajuste. Ruido y regularización. Validación. Compromiso entre sesgo y varianza.

Tema 3 – Técnicas del Aprendizaje de Máquina I (8 hs):
Clasificadores. Redes Neuronales. Arboles de Decisión. Bagging. Random Forest. Dimensionalidad de datos generados por técnicas de alto rendimiento en Biología Molecular. Métodos de reducción de dimensionalidad. Método de las componentes principales. Métodos de selección de variables. Métodos univariados y multivariados.   Métodos de filtrado y de wrapper.

Tema 4 – Técnicas del Aprendizaje de Máquina II (8 hs)
Máquinas de vectores soporte (SVM). Margen. Separación lineal de datos. Maximización del Margen. Una solución desde la programación cuadrática. Vectores soporte. Generalización. Transformaciones no lineales mediante kernels. SVMs de margen blando.

Programa Analítico de Prácticas (12 horas)

  1. Exploración de Weka3, un entorno para minería de datos en Java. Aplicación de algoritmos de aprendizaje no supervisado y supervisado al análisis de perfiles de expresión génica.
  2. Selección supervisada de variables en Weka 3. Aplicación a problemas de clasificación de perfiles de expresión génica.
  3. Librerías R/Bioconductor para la clasificación de perfiles de expresión génica.
  4. Máquinas de Vectores Soporte en Weka 3 y R/Bioconductor. Aplicación a la clasificación de perfiles de expresión génica.

Actividades y formas de evaluación:
La metodología consistirá en clases teóricas y clases prácticas. La evaluación constará de un examen final que los alumnos deberán resolver individualmente y de un trabajo final grupal (máximo 2) que deberán entregar y exponer en un lapso de dos semanas.

Carga horaria:
40 hs, 24 hs de Clases Teóricas y 16 hs de Clases Prácticas. Modalidad presencial y multimedia.

ARANCEL: $2500

Requisitos para la aprobación:
Asistencia al 75 % de las clases y obtención de 6 puntos sobre 10 en el examen final individual y trabajo final diferido.

Cupo:Un mínimo de 5 alumnos y un máximo de 25 alumnos.

Bibliografía:

  • Yaser S. Abu-Mostafa, Malik Magdon-Ismail, and Hsuan-Tien Lin. 2012. Learning from Data. AMLBook. ISBN: 978-1600490064
  • Gareth James, Daniela Witten, Trevor Hastie, and Robert Tibshirani. 2014. An Introduction to Statistical Learning: With Applications in R. Springer Publishing Company, Incorporated.
  • Ian H. Witten, Eibe Frank, and Mark A. Hall. 2011. Data Mining: Practical Machine Learning Tools and Techniques (3rd ed.). Morgan Kaufmann Publishers Inc., San Francisco, CA, USA.
  • Peter Flach. 2012. Machine Learning: The Art and Science of Algorithms that Make Sense of Data. Cambridge University Press, New York, NY, USA.
  • Christopher M. Bishop. 2006. Pattern Recognition and Machine Learning (Information Science and Statistics). Springer-Verlag New York, Inc., Secaucus, NJ, USA.

Leave a Reply