Tabla de contenido:
- Definición: ¿qué significa Knowledge Discovery in Databases (KDD)?
- Techopedia explica el descubrimiento del conocimiento en bases de datos (KDD)
Definición: ¿qué significa Knowledge Discovery in Databases (KDD)?
El descubrimiento de conocimiento en bases de datos (KDD) es el proceso de descubrir conocimiento útil de una colección de datos. Esta técnica de minería de datos ampliamente utilizada es un proceso que incluye la preparación y selección de datos, la limpieza de datos, la incorporación de conocimientos previos sobre conjuntos de datos y la interpretación de soluciones precisas a partir de los resultados observados.
Las principales áreas de aplicación de KDD incluyen marketing, detección de fraude, telecomunicaciones y fabricación.
Techopedia explica el descubrimiento del conocimiento en bases de datos (KDD)
Tradicionalmente, la minería de datos y el descubrimiento de conocimiento se realizaban manualmente. Con el paso del tiempo, la cantidad de datos en muchos sistemas creció a un tamaño mayor que el terabyte, y ya no se pudo mantener manualmente. Además, para la existencia exitosa de cualquier negocio, el descubrimiento de patrones subyacentes en los datos se considera esencial. Como resultado, se desarrollaron varias herramientas de software para descubrir datos ocultos y hacer suposiciones, que formaban parte de la inteligencia artificial.
El proceso KDD ha alcanzado su punto máximo en los últimos 10 años. Ahora alberga muchos enfoques diferentes para el descubrimiento, que incluyen aprendizaje inductivo, estadísticas bayesianas, optimización de consultas semánticas, adquisición de conocimiento para sistemas expertos y teoría de la información. El objetivo final es extraer conocimiento de alto nivel de datos de bajo nivel.
KDD incluye actividades multidisciplinarias. Esto abarca el almacenamiento y acceso de datos, algoritmos de escalado a conjuntos de datos masivos e interpretación de resultados. El proceso de limpieza de datos y acceso a datos incluido en el almacenamiento de datos facilita el proceso de KDD. La inteligencia artificial también es compatible con KDD al descubrir leyes empíricas a partir de la experimentación y las observaciones. Los patrones reconocidos en los datos deben ser válidos en datos nuevos y poseer cierto grado de certeza. Estos patrones se consideran nuevos conocimientos. Los pasos involucrados en todo el proceso de KDD son:
- Identifique el objetivo del proceso KDD desde la perspectiva del cliente.
- Comprender los dominios de aplicación involucrados y el conocimiento que se requiere
- Seleccione un conjunto de datos de destino o un subconjunto de muestras de datos en el que se realiza el descubrimiento.
- Limpie y preprocese los datos al decidir estrategias para manejar los campos faltantes y alterar los datos según los requisitos.
- Simplifique los conjuntos de datos eliminando variables no deseadas. Luego, analice las funciones útiles que se pueden utilizar para representar los datos, según el objetivo o la tarea.
- Haga coincidir los objetivos de KDD con los métodos de minería de datos para sugerir patrones ocultos.
- Elija algoritmos de minería de datos para descubrir patrones ocultos. Este proceso incluye decidir qué modelos y parámetros pueden ser apropiados para el proceso general de KDD.
- Busque patrones de interés en una forma de representación particular, que incluye reglas de clasificación o árboles, regresión y agrupación.
- Interpretar el conocimiento esencial de los patrones minados.
- Use el conocimiento e incorpórelo a otro sistema para acciones adicionales.
- Documente y haga informes para las partes interesadas.