El almacenamiento masivo de información hace que la minería de datos tenga una importancia cada vez mayor. El conocimiento a fondo de los datos dentro de una organización es importante en la medida en que puede ayudar a conocer y comprender el comportamiento de ella misma y del entorno, y favorecer así la toma de decisiones. Gracias a la minería de datos la información oculta en las bases de datos puede ser analizada y aprovechada por las organizaciones, ya que la minería de datos se ocupa principalmente de la construcción de información no representada explícitamente en los datos.
En este curso se estudiará en primera instancia a Python como un Lenguaje de Programación Funcional y Orientado a Objetos. Luego se estudiarán en detalle la implementación de Métodos Exploratorios y de Clustering (Aprendizaje no Supervisado) en Python, métodos como Análisis en Componentes Principales, Agrupación Jerárquica y k-medias serán estudiados. También se estudiarán en detalle la implementación de métodos: Métodos Predictivos y de Regresión (Aprendizaje Supervisado) en Python, métodos como los K vecinos más cercanos, el Método de Bayes, Análisis Discriminante Lineal y Cuadrático, Máquinas Vectoriales de Soporte, Árboles de Decisión, Bosques Aleatorios (Random Forest) y Métodos de Potenciación (Ada- Boosting y XG-Boosting).