Curso Introducción al análisis de datos en Python

Curso

Curso Introducción al análisis de datos en Python

Facultad de Economía
Inicio / Programas / Curso Introducción al análisis de datos en Python

Curso Básico Análisis de datos en Python

En el mundo laboral debido al incremento en el volumen de datos y la necesidad de automatización de tareas se ha generado la necesidad de implementar nuevos softwares y lenguajes de programación a las tareas del día a día. Adicionalmente, al ser Python open source, muchos de los desarrollos de la frontera de conocimiento se han implementado en este lenguaje. Python es el lenguaje de programación que más nuevos programadores ha atraído en los últimos años, es el tercer lenguaje más popular del mundo y el primero en lo que relaciona a análisis de datos, machine learning y minería de datos. Además, es el lenguaje más solicitado por los empleadores en busca de analistas de datos. En respuesta a esta necesidad, el curso de Introducción al análisis de datos en Python busca que los estudiantes adquieran una comprensión general del lenguaje de programación, su utilidad para el análisis de datos y automatización de tareas. En el curso se tratará la sintaxis básica de programación, el manejo de datos y su visualización. Así, el énfasis será sobre la importación, organización y manejo de datos y la presentación de resultados. 
 

Este curso hace parte del programa Programa Proyectos de analítica en Python. Ver más aquí.

Dirigido a

El curso está dirigido a personas que deseen desarrollar habilidades de programación en Python. Se espera que el curso sea tomado por personas en el entorno laboral que deseen generar un impacto positivo en sus organizaciones por medio de la automatización de procesos y análisis estadístico de volúmenes considerables de datos. De igual forma, se espera ofrecerles a los investigadores que no han tenido la oportunidad de tener un acercamiento a la programación una herramienta con la que podrán iniciar su aprendizaje en los lenguajes de programación. Por último, el curso les dará las herramientas necesarias para tomar cursos aplicados de educación continuada en los cuales se mostrará el uso de Python a problemas de diferentes industrias. El curso no tiene requisitos para su inscripción.

Objetivos

Enseñar a los estudiantes los conceptos básicos de programación.
Familiarizar a los estudiantes en la sintaxis básica de Python.
Se enseñarán las siguientes habilidades:
  • Operaciones matemáticas vectoriales y matriciales con numpy.
  • Limpieza y Manipulación de bases de datos.
  • Visualización de datos con las librerías más famosas.
  • Automatización de tareas en Python.
  • Generar valor agregado a partir de análisis estadísticos descriptivos.
  • Introducción a web scrapping

Metodología

El curso se realizará en salas habilitadas para el uso de computadores y cada sesión estará dividida en dos módulos. A su vez, cada módulo estará dividido en dos partes, durante la primera parte de cada módulo el profesor introducirá técnicas, comandos y conceptos relacionados con la utilización de Python y utilizará ejemplos que lo ilustren; durante la segunda parte los estudiantes deberán trabajar individualmente en un ejercicio, el cual deberán entregar al finalizar cada módulo. Adicionalmente, se realizarán 2 talleres en clase en los cuales se espera que los estudiantes, con ayuda del profesor, reafirmen sus conocimientos. 

Contenido

Sesión 1:
Modulo 1:
¿Qué es Python? ¿Qué es Anaconda? 
¿Qué es un lenguaje multipropósito?  
Instalación de Python, Anaconda y Jupyter LAB. 
Instalación y carga de librerías. 
Jupyter Lab, páneles y comandos rápidos. 
Sintaxis en Python: Identación y estructura básica. 
Tipos de datos: entero, float, lógico, character. Missings: NaN, NA. 
Estructuras de datos: Listas, cadenas, tuplas y diccionarios. 
Numpy y Pandas.
Operaciones básicas e indexación. 
¿Dónde buscar ayuda?
Sesión 2:
Importar información 
Manejo de listas y diccionarios
Extraer información de objetos y rebanados. 
Uso de vectores lógicos para extraer información de objetos. 
Definir funciones. 
Estructuras de control.
Sesión 3:
Programación orientada a objetos
Clases y métodos.
Loops: while y for.
Controles de flujo: continue, break.
Sesión 4:
Instalar y cargar paquetes. 
Funciones apply, mapping and merge.
Funciones de manejo de texto.
Manejo básico pandas, numpy.arrays y spicy: selección de filas y/o columnas, selección condicionada.
Creación de muestras y subconjuntos de data frames: subsets and samples.
Importación de datos: txt, csv, xlsx, .pkl y gzip.
Inspección inicial de la información.
Sesión 5: 
Introducción a plotly y matplot.
Gráficos base: histogramas, scatter plot, bar plot, box plot. 
Otras herramientas para visualización de datos: manejo de mapas. 
Personalización de gráficos: ejes, colores, títulos. 
Exportación de gráficos.
Sesión 6:
Construcción de análisis estadísticos descriptivos.
Pruebas estadísticas.
Modelos estadísticos. (Regresiones y modelos de clústering)
Sesión 7:
Introducción a Web Scrapping
 

Profesores

Juan Sebastián Moreno Pabón

Coordinador académico: Trabaja con los profesores en el diseño, construcción y mejoras de los contenidos, pero no es profesor del curso. Actualmente trabaja en Pinpoint Predictive, un start-up de psicometría de Silicon Valley apoyado por la incubadora de Stanford, StartX . En su rol como Investigador Senior desarrolla y despliega técnicas de inteligencia artificial para predecir comportamientos a partir de psicometría. Juan Moreno pasó cuatro años como investigador y luego como director asociado del departamento de minería de datos de Quantil, consultora en matemáticas aplicadas y machine learning. Lideró equipos de investigadores y desarrolló una amplia variedad de soluciones impulsadas por inteligencia artificial en diferentes sectores, que incluyen salud, seguridad pública, banca, transporte, educación, legal y manufactura, entre otros. Juan también ha trabajado como profesor de cátedra en el Departamento de Economía de su alma mater, la Universidad de los Andes, donde ha impartido cursos sobre matemáticas discretas, macroeconomía, aprendizaje automático, Python y R para análisis de datos. Como científico social computacional, Juan ha investigado temas relacionados a la predicción de delitos, la equidad en las aplicaciones de aprendizaje automático y la segregación en las redes sociales. También es miembro de la junta directiva del Centro de Analítica para Políticas Públicas (CAPP).

Condiciones

Eventualmente la Universidad puede verse obligada, por causas de fuerza mayor a cambiar sus profesores o cancelar el programa. En este caso el participante podrá optar por la devolución de su dinero o reinvertirlo en otro curso de Educación Continua que se ofrezca en ese momento, asumiendo la diferencia si la hubiere.

La apertura y desarrollo del programa estará sujeto al número de inscritos. El Departamento/Facultad (Unidad académica que ofrece el curso) de la Universidad de los Andes se reserva el derecho de admisión dependiendo del perfil académico de los aspirantes.