Hogar Audio ¿Qué es la minería de datos de texto? - definición de techopedia

¿Qué es la minería de datos de texto? - definición de techopedia

Tabla de contenido:

Anonim

Definición: ¿Qué significa la minería de datos de texto?

La minería de datos de texto implica peinar un documento de texto o recurso para obtener información estructurada valiosa. Esto requiere herramientas analíticas sofisticadas que procesen texto para obtener palabras clave específicas o puntos de datos clave de lo que se consideran formatos relativamente sin procesar o no estructurados.

La minería de datos de texto también se conoce como minería de texto o análisis de texto.

Techopedia explica la minería de datos de texto

En la minería de datos de texto, los sistemas de ingeniería utilizan cosas como taxonomías y análisis léxico para determinar qué partes de un documento de texto son valiosas como datos minados. Los modelos estadísticos son comúnmente útiles, y los sistemas también pueden usar heurísticas, o conjeturas algorítmicas, para tratar de determinar qué partes de un texto son importantes. Otros sistemas de control incluyen el etiquetado y el análisis de palabras clave, donde las herramientas buscan nombres propios específicos u otras etiquetas y palabras clave para descubrir de qué se está escribiendo.

Otro componente único de la minería de texto a menudo se llama análisis de sentimientos. En el análisis de sentimientos, que generalmente es mucho más difícil que el análisis estadístico, las herramientas analíticas intentan descubrir el estado de ánimo o el sentimiento detrás del texto escrito y otros aspectos de lo que aborda en un nivel muy subjetivo e intuitivo. Con la aparición de herramientas de inteligencia artificial, se ha avanzado mucho en el análisis de sentimientos, de modo que la minería de datos de texto moderna es más que solo recopilar referencias cuantitativas e implica llevar modelos conceptuales de alto nivel a la minería de texto para descubrir formas nuevas y únicas para agregar datos valiosos.

¿Qué es la minería de datos de texto? - definición de techopedia