El libro Pandas Python, escrito por Eduardo Correa y publicado por Casa Do Código, se presenta como una guía imprescindible para aquellos interesados en el campo de la ciencia de datos. A través de sus páginas, el autor explora en profundidad la biblioteca pandas, una de las herramientas más utilizadas en Python para el Data Wrangling, que es una fase crucial en el análisis de datos.
La ciencia de datos implica el uso de técnicas estadísticas y computacionales para analizar grandes volúmenes de información. Eduardo Correa destaca que la etapa de pré-processamento es la más desafiante, ocupando un 80% del tiempo total de un proyecto de datos. A lo largo de este libro, se enfatiza en las tareas de:
- Selección de datos
- Limpieza de datos
- Transformación de datos
El enfoque de Correa es práctico y está diseñado para ayudar a los lectores a entender cómo usar pandas para resolver problemas reales de Data Wrangling. A través de un proyecto práctico, se enseña:
- Teoría detrás de pandas
- Uso de la biblioteca para actividades de selección, estudio, limpieza y transformación de una base de datos real
- Implementación de un modelo de Machine Learning, específicamente un modelo de clasificación de datos