Sigla: PF3311
Creditaje: 4
Tipo de curso: Optativo
Descripción

Las decisiones basadas en datos están cambiando la forma en que las organizaciones operan. Varios factores propician la generación de un alto volumen de datos, por ejemplo, la automatización de los negocios, la diversificación de las transacciones en medios electrónicos, el uso de dispositivos electrónicos como sensores, el crecimiento del uso de redes sociales y el aumento de las conexiones entre dispositivos (internet de las cosas). Este gran volumen de datos genera la necesidad de contar con técnicas y herramientas automatizadas para transformarlos en información o conocimiento útil para apoyar la toma de decisiones en las organizaciones.

La aplicación de técnicas de análisis de grandes volúmenes de datos requiere un aprendizaje sobre la preparación de datos, la capacidad de poder seleccionar una técnica adecuada al problema, a solucionar y a la interpretación de resultados. En este curso se estudiarán principios generales y mejores prácticas aplicables al proceso de análisis de datos. Así mismo, se estudiarán diferentes técnicas y modelos de programación de sistemas de procesamiento masivo de datos con aplicaciones en la industria y en la ciencia.

En el curso se combina la teoría con ejercicios prácticos. El curso le permitirá al estudiante utilizar sistemas de procesamiento masivo para escribir aplicaciones de análisis de datos de gran tamaño, utilizando un ambiente de programación basado en Python y bibliotecas de alto nivel que facilitan ciertos trabajos. Al finalizar el curso, el estudiante tendrá conocimiento y herramientas para enfrentar una serie de retos técnicos que puede encontrar en ambientes empresariales y científicos.

Objetivo general
El objetivo general del curso es que los estudiantes desarrollen las habilidades necesarias para el pre-procesamiento de datos y el uso de técnicas adecuadas de análisis, con el fin de descubrir el conocimiento en grandes volúmenes de datos, mediante estrategias que integren lo teórico y lo práctico, incluyendo un fuerte componente de actividades en el laboratorio.
Objetivos específicos
  • Identificar las necesidades de aplicar las técnicas automatizadas de descubrimiento de conocimientos en grandes volúmenes de datos, con el fin de encontrar los patrones que permitan la transformación de los datos en información o conocimiento útil para la toma de decisiones, a través de estrategias declarativas.
  • Pre-procesar los datos, incluyendo su limpieza, transformación, integración y reducción, para asegurar descubrimiento de conocimiento veraz, a través de estrategias declarativas y prácticas.
  • Utilizar y contrastar diferentes técnicas de análisis de grandes volúmenes de datos para seleccionar la técnica más apropiada al problema y tipo de datos en cuestión, mediante el uso práctico de estas técnicas.
  • Interpretar y evaluar los resultados obtenidos al aplicar las técnicas automatizadas para asegurar el descubrimiento de patrones no triviales, implícitos, previamente desconocidos y potencialmente útiles.
Docentes que imparten el curso