Las decisiones basadas en datos están cambiando la forma en que las organizaciones operan. Varios factores propician la generación de un alto volumen de datos, por ejemplo, la automatización de los negocios, la diversificación de las transacciones en medios electrónicos, el uso de dispositivos electrónicos como sensores, el crecimiento del uso de redes sociales y el aumento de las conexiones entre dispositivos (internet de las cosas). Este gran volumen de datos genera la necesidad de contar con técnicas y herramientas automatizadas para transformarlos en información o conocimiento útil para apoyar la toma de decisiones en las organizaciones.
La aplicación de técnicas de análisis de grandes volúmenes de datos requiere un aprendizaje sobre la preparación de datos, la capacidad de poder seleccionar una técnica adecuada al problema, a solucionar y a la interpretación de resultados. En este curso se estudiarán principios generales y mejores prácticas aplicables al proceso de análisis de datos. Así mismo, se estudiarán diferentes técnicas y modelos de programación de sistemas de procesamiento masivo de datos con aplicaciones en la industria y en la ciencia.
En el curso se combina la teoría con ejercicios prácticos. El curso le permitirá al estudiante utilizar sistemas de procesamiento masivo para escribir aplicaciones de análisis de datos de gran tamaño, utilizando un ambiente de programación basado en Python y bibliotecas de alto nivel que facilitan ciertos trabajos. Al finalizar el curso, el estudiante tendrá conocimiento y herramientas para enfrentar una serie de retos técnicos que puede encontrar en ambientes empresariales y científicos.