Hogar En las noticias ¿Qué es el preprocesamiento de datos? - definición de techopedia

¿Qué es el preprocesamiento de datos? - definición de techopedia

Tabla de contenido:

Anonim

Definición: ¿Qué significa el preprocesamiento de datos?

El preprocesamiento de datos es una técnica de minería de datos que implica transformar los datos sin procesar en un formato comprensible. Los datos del mundo real a menudo son incompletos, inconsistentes y / o carecen de ciertos comportamientos o tendencias, y es probable que contengan muchos errores. El preprocesamiento de datos es un método probado para resolver estos problemas. El preprocesamiento de datos prepara datos sin procesar para su posterior procesamiento.


El preprocesamiento de datos se utiliza en aplicaciones basadas en bases de datos, como la gestión de relaciones con el cliente y aplicaciones basadas en reglas (como redes neuronales).

Techopedia explica el preprocesamiento de datos

Los datos pasan por una serie de pasos durante el preprocesamiento:

  • Limpieza de datos: los datos se limpian mediante procesos como completar los valores faltantes, suavizar los datos ruidosos o resolver las inconsistencias en los datos.
  • Integración de datos: los datos con diferentes representaciones se agrupan y se resuelven los conflictos dentro de los datos.
  • Transformación de datos: los datos están normalizados, agregados y generalizados.
  • Reducción de datos: este paso tiene como objetivo presentar una representación reducida de los datos en un almacén de datos.
  • Discretización de datos: implica la reducción de varios valores de un atributo continuo dividiendo el rango de intervalos de atributos.
¿Qué es el preprocesamiento de datos? - definición de techopedia