En el tercer paso del ciclo analítico -análisis y visualización- se requiere de una ingeniería de datos para extraer resultados. Antes de ejecutar cualquier técnica, método o estrategia de ingeniería de datos es necesario limpiar los datos recolectados. Este proceso de limpieza significa convertir los datos recolectados en un conjunto de datos completo y correcto. Durante la recolección de datos se pueden producir errores, tanto intencionados como no intencionados, que pueden modificar el resultado de los cálculos. Es esencial dominar este procedimiento para generar resultados y visualizaciones sin sesgos de datos. El libro tiene 8 capítulos y tiene un enfoque muy práctico mostrado a través de la herramienta Excel:
- Los bloques de construcción de la limpieza de datos
- Ejecutar comprobaciones rápidas de sanidad en los datos
- Comprueba diferentes tipos de preguntas
- Tratar con los datos perdidos
- Controlar la detección de valores atípicos
- Tratar preguntas condicionales
- Unir, delimitar concatenar o datos
- Estudio de caso: Limpieza de datos de una encuesta sobre papel