Computación de alto rendimiento con R para investigadores

Fechas: del 28 de octubre al 12 de noviembre de 2019

Modalidad: Online - Plataforma Zoom
Frecuencia:
Lunes a Viernes
Horario:
17:00 - 21:00
Duración: 40 horas

Instructor: Ing. Miguel Alfonso Flores Sánchez, PhD. Ver C.V.icon

Resumen:

Este curso surge de la necesidad de agilizar las investigaciones y optimizar los recursos computacionales para el procesamiento de algoritmos altamente demandantes y grandes volúmenes de datos. En este contexto, R ofrece herramientas de alto nivel para interactuar con la computación de alto rendimiento (HPC - High Performance Computing). El curso está dirigido a investigadores que desean acelerar y ampliar sus scripts a plataformas de procesamientos más grandes, como es el caso de Clústers. El curso introducirá los conceptos básicos de HPC y su arquitectura computacional, se revisarán rápidamente las estructuras básicas de programación en R y se continuará con paquetes relevantes de R para ciencia de datos destinados a la utilización de recursos informáticos de alto rendimiento. Primero se aplicará paralelización en computadoras personales, para luego continuar con la paralelización y distribución de procesos en el Clúster. Los participantes aprenderán estrategias para hacer que los scripts de R sean más rápidos, al establecer conexión con el Clúster a través de RStudio Server y al utilizar múltiples núcleos y nodos para la aceleración paralela y distribuida de procesos.

Audiencia:
Dirigido a investigadores en áreas de ingeniería, ciencias naturales, de la tierra, ambientales, biológicas, de la computación, estadísticas, sociales, entre otros.

Objetivo General:
Promover   la   investigación   interdisciplinaria   para   la resolución eficiente de problemas científicos complejos.

Metodología y Evaluación

Se hará uso del método constructivista, partiendo de la revisión de los conocimientos previos de los estudiantes para proceder a la construcción de nuevos conocimientos a partir del uso de estrategias metodológicas dinámicas (aprendizaje basado en problemas, trabajo colaborativo, método de casos, aprendizaje por proyectos, entre otros), libros, videos y espacios para la comunicación como foros, mensajes.

Requisitos Previos:
No se requiere previo conocimiento en HPC, sin embargo, si se requiere experiencia previa en R. Por ello se recomienda la preparación anticipada con recursos introductorios sobre R. Considere, por ejemplo, los cursos disponibles en DataCamp y Coursera. Se debe traer computadora personal con R y RStudio instalados.

Características del curso:
El curso tendrá una duración de 40 horas con actividades prácticas a partir de las orientaciones teóricas.
Se ofrecerán materiales adicionales que garanticen la continuidad del aprendizaje en el tema.
El estudiante entregará avances del trabajo que realiza a través de la plataforma de educación virtual.

Competencias a Desarrollar:
Los participantes aprenderán estrategias para hacer que los scripts de R sean más rápidos, al establecer conexión con el Clúster a través de RStudio Server y al utilizar múltiples núcleos y nodos para la aceleración paralela y distribuida de procesos.

Contenidos:

A. Introducción
HPC y su arquitectura computacional: ¿qué es y para qué es útil?

B. Código R eficiente en computadoras personales
Básicos de R
Código de R eficiente
Paralelización en ordenadores personales

C. Procesamiento en el Cluster de CEDIA
Conexión remota
Rstudio Server como interfaz en HPC
Transferencia de datos al cluster
Paralelización con R en el Cluster (parallel)
Procesamiento distribuido en el Cluster (rslurm)
Procesamiento con GPUs

Costo Miembros: $160 + IVA
Costo No miembros: $180 + IVA
Información extra: Se entrega certificado de aprobación por 40 horas una vez finalizado el curso.
Canjeables por cupos: SI
 

Descripción del evento

Inicio 28-10-2019 5:00 pm
Clausura 12-11-2019 9:00 pm
Apertura Inscripción 16-10-2019
Capacidad 30
Cierre inscripción 21-10-2019
Cuota $160+IVA (miembros), $180+IVA (no miembros).
Categorias de Eventos Investigación,EFC,Online
La inscripción está cerrada