Análisis y visualización de datos usando Python

Lesson Maintainers: Paula Andrea Martinez, Heladia Salgado, Rayna Harris, Vini Salazar, Estamos buscando personas interesadas en ser maintainers de esta versión.

Python es un lenguaje de programación general que es útil para escribir scripts para trabajar con datos de manera efectiva y reproducible.

Esta es una introducción a Python diseñada para participantes sin experiencia en programación. Estas lecciones pueden enseñarse en un día (~ 6 horas). Las lecciones empiezan con información básica sobre la sintaxis de Python, la interfaz de Jupyter Notebook, y continúan con cómo importar archivos CSV, usando el paquete Pandas para trabajar con DataFrames, cómo calcular la información resumen de un DataFrame, y una breve introducción en cómo crear visualizaciones. La última lección demuestra cómo trabajar con bases de datos directamente desde Python. Nota: los datos no han sido traducidos de la versión original en inglés, por lo que los nombres de variables se mantienen en inglés y los números de cada observación usan la sintaxis de habla inglesa (coma separador de miles y punto separador de decimales).

Antes de empezar

La enseñanza en Data Carpentry es práctica, y por tanto se fomenta que los participantes usen sus propias computadoras para asegurar la correcta configuración setup de las herramientas para un trabajo eficiente. Estas lecciones no asumen conocimientos previos sobre los temas presentados o herramientas usadas.

Para empezar, sigue las direcciones en Setup para bajar los datos a tu computadora y siguen las instrucciones de instalación.

Prerequisitos

Esta lección requiere la instalación de Python. Para el uso efectivo de este material, por favor instala todo antes de trabajar en la lección.

Para instructores

Si enseñas esta lección en un taller, por favor lee las Notas de instructor.

Schedule

Setup Download files required for the lesson
00:00 1. Antes de comenzar ¿Qué es Python y por qué debería aprenderlo?
00:30 2. Breve introducción a la Programación en Python ¿Qué es Python?
¿Porqué deberías aprender Python?
00:30 3. Comenzando con datos ¿Cómo importar datos en Python?
¿Qué es Pandas?
¿Por qué debería de usar Pandas para trabajar con datos?
01:30 4. Indexación, segmentación y creación de subconjuntos a partir de DataFrames en Python ¿Cómo puedo acceder a un dato específico en mi ‘dataset’?
¿Cómo pueden ayudarme Python y Pandas a analizar mis datos?
02:30 5. Tipos de datos y formatos ¿Qué tipos de datos pueden estar contenidos en un DataFrame?
¿Por qué es importante el tipo de datos?
03:15 6. Combinando DataFrames con Pandas ¿Puedo trabajar con datos de diferentes fuentes?
¿Cómo puedo combinar datos de diferentes datasets?
04:00 7. Flujos de trabajo y automatización ¿Puedo automatizar operaciones en Python?
¿Qué son las función y por qué debería usarlas?
05:30 8. Creando gráficos con plotnine ¿Cómo puedo visualizar datos en Python?
¿Qué es la ‘gramática de gráficos’?
07:00 9. Entrada de datos y visualización - Matplotlib y Pandas ¿Qué otras herramientas aparte de ggplot puedo usar para crear gráficos?
¿Por qué usar Python para crear gráficos?
08:45 10. Acceso a base de datos SQLite usando Python y Pandas ¿Cómo conectarse a una base de datos SQLite desde Python?
¿Cómo extraer datos de una base de datos SQLite a un DataFrame de Python?
¿Cuáles son los beneficios de usar una base de datos en vez de un archivo CSV?
09:30 Finish

The actual schedule may vary slightly depending on the topics and exercises chosen by the instructor.