Tabla de contenido:
Definición: ¿Qué significa Speech Analytics?
La analítica de voz es el proceso de extracción de contenido relevante y vital de un archivo de audio grabado. Tiene la capacidad de identificar, categorizar y hacer referencias cruzadas automáticamente información importante con respecto a lo que se dice o la sustancia o significado real del discurso, no solo palabras individuales. Para que esto sea posible, el análisis de voz utiliza varios tipos de aplicaciones de software, como el reconocimiento automático de voz y las herramientas de minería de audio.
Techopedia explica Speech Analytics
Existen tres enfoques principales en el análisis de voz: voz a texto, reconocimiento directo de frases y fonética.
- Voz a texto: usa bi-gramos o tri-gramos como unidades básicas para analizar el habla y necesita que coincida con miles de palabras. El resultado es un flujo de palabras que facilita el trabajo y también es preciso.
- Reconocimiento directo de fase: analiza directamente el habla buscando frases predefinidas en lugar de convertirlas en texto o fonemas. Aunque este es el método más largo, también es el más preciso ya que no se pierde información al convertir los datos.
- Fonética: la forma más rápida de procesamiento ya que la unidad básica utilizada es un fonema. Dado que solo se conocen unos pocos fonemas en la mayoría de los idiomas, se utiliza una larga lista de estos que el software hace referencias cruzadas para fonemas de destino al más cercano en la lista.