By | agosto 31, 2017

En el tercer paso del ciclo analítico -análisis y visualización- se requiere de una ingeniería de datos para extraer resultados. Antes de ejecutar cualquier técnica, método o estrategia de ingeniería de datos es necesario limpiar los datos recolectados. Este proceso de limpieza significa convertir los datos recolectados en un conjunto de datos completo y correcto. Durante la recolección de datos se pueden producir errores, tanto intencionados como no intencionados, que pueden modificar el resultado de los cálculos. Es esencial dominar este procedimiento para generar resultados y visualizaciones sin sesgos de datos. El libro tiene 8 capítulos y tiene un enfoque muy práctico mostrado a través de la herramienta Excel:

  1. Los bloques de construcción de la limpieza de datos
  2. Ejecutar comprobaciones rápidas de sanidad en los datos
  3. Comprueba diferentes tipos de preguntas
  4. Tratar con los datos perdidos
  5. Controlar la detección de valores atípicos
  6. Tratar preguntas condicionales
  7. Unir, delimitar concatenar o datos
  8. Estudio de caso: Limpieza de datos de una encuesta sobre papel

Puedes conseguir el libro aquí.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *