Hogar Desarrollo ¿Qué es texto a voz (tts)? - definición de techopedia

¿Qué es texto a voz (tts)? - definición de techopedia

Tabla de contenido:

Anonim

Definición: ¿Qué significa Texto a voz (TTS)?

Texto a voz (TTS) es un proceso de modelado de lenguaje natural que requiere cambiar las unidades de texto en unidades de voz para la presentación de audio. Esto es lo opuesto de discurso a texto, donde una tecnología toma palabras habladas y trata de grabarlas con precisión como texto. El texto a voz ahora es común en las tecnologías que buscan reproducir la salida de audio del texto digital para ayudar a aquellos que no pueden leer o para otros tipos de usos.

Techopedia explica Text to Speech (TTS)

El desarrollo de la capacidad de texto a voz incluye algunos desafíos únicos. Especialmente en el idioma inglés, donde una gran cantidad de homónimos tienen pronunciaciones variadas, los programas de computadora se basan en modelos de probabilidad para adivinar la pronunciación deseada de una palabra en texto digital. El programa también tiene que convertir unidades de texto en fonemas, las unidades más pequeñas de pronunciación de voz. El resultado es que muchas tecnologías de texto a voz son menos que infalibles, aunque los desarrolladores han avanzado mucho en estas tecnologías durante varios años.


Con el tiempo, los expertos han observado algunas mejores prácticas para el desarrollo de TTS. Estos incluyen bases de fonemas y enfoques concatenativos con análisis predictivo. Los mejores programas también pueden funcionar con requisitos mínimos de memoria y son fáciles de configurar. Los desarrolladores continúan trabajando en los recursos de TTS para cualquier idioma dado, superando los principales desafíos de la ambigüedad y otros obstáculos para una representación más precisa.

¿Qué es texto a voz (tts)? - definición de techopedia