Hogar Software Tecnología de reconocimiento de voz: ¿útil o dolorosa?

Tecnología de reconocimiento de voz: ¿útil o dolorosa?

Tabla de contenido:

Anonim

¿Alguna vez ha llamado a una compañía para obtener ayuda o pagar su factura, solo para ser recibido por una agradable voz grabada que quiere tener una conversación con usted, pero no puede entender la mitad de lo que está diciendo? O tal vez tienes un iPhone, y si bien Siri parecía un buen aliado por primera vez, te has dado cuenta de que a veces (OK, seamos honestos, a menudo) ella simplemente no lo entiende. La tecnología de reconocimiento de voz (VRT), también conocida como voz a texto, cae en una trampa común: tiene el potencial de ser increíblemente genial (y vaya, lo estamos apoyando), pero más a menudo, es un rechinar de dientes ejercicio de frustración


Alguna vez una idea que pertenecía al ámbito de la ciencia ficción, el reconocimiento de voz ha crecido desde su infancia en la década de 1950, cuando el sistema Audrey de Bell Laboratories fue diseñado para reconocer dígitos hablados en una sola voz, a la red moderna de electrónica conversacional con la que ahora interactuamos. diariamente, con resultados mixtos.

Para hablar con un humano, presione 0

Muchas de las empresas actuales ahora usan sistemas llamados respuesta de voz interactiva (IVR) para manejar las llamadas de servicio al cliente. El uso más común es para los menús de navegación por voz, pero algunas compañías usan sistemas IVR que pueden acceder a la información de la cuenta del cliente y responder preguntas menores. El software del Menú IVR generalmente tiene un vocabulario limitado, que puede estar restringido a "sí", "no" y números. Los sistemas más complicados pueden reconocer palabras y frases específicas de la compañía.


Estos sistemas se están volviendo más populares, al menos para las empresas, por una simple razón: son rentables. Según un informe de 2010 del Wall Street Journal, una llamada típica de un cliente que llega a un agente cuesta entre $ 3 y $ 9, mientras que una llamada manejada a través de un sistema automatizado solo cuesta entre cinco y siete centavos. Y, por supuesto, los programas de computadora no se cansan, llaman enfermos o se frustran con los clientes (¡aunque los clientes ciertamente se frustran con ellos!).


Afortunadamente, esto no siempre significa que la IVR le quita trabajos a las personas, o al menos que todas las personas están desapareciendo de los centros de llamadas. Estos ayudantes activados por voz permiten que los representantes de servicio al cliente humano sean más productivos al dirigir llamadas y responder preguntas simples.


Por supuesto, para los usuarios humanos que interactúan con estas tecnologías, no siempre es fácil navegar. La tecnología está ayudando a mejorar los problemas comunes en la tecnología IVR, como los problemas con los acentos, pero el saqueo de sistemas automatizados sigue siendo un tema común en línea. Echa un vistazo a esta comedia sobre un ascensor equipado con reconocimiento de voz, que resalta la frustración que pueden producir los fallos de funcionamiento en los sistemas IVR.

Aplicaciones telefónicas personales: Siri, Google Now

La mayoría de las personas están familiarizadas con el reconocimiento de voz para teléfonos inteligentes. Si bien la mayoría de los últimos modelos de teléfonos vienen con realidad virtual, su popularidad y notoriedad aumentaron cuando Apple presentó a Siri, el "asistente personal" ligeramente sarcástico y activado por voz para el iPhone 4S en 2011. Google pronto creó un competidor directo: Google Ahora para el sistema operativo Android Jelly Bean. Ambos sistemas cuentan con voces femeninas y funciones de reconocimiento sofisticadas que permiten a los usuarios "hablar" con sus teléfonos usando un lenguaje informal.


Pero si bien estos sistemas son considerablemente más sofisticados y funcionales que sus predecesores, también muestran que la tecnología aún tiene un largo camino por recorrer. Las bromas sobre el fracaso de Siri se han convertido en un popular meme de Internet. Un hombre incluso demandó a Apple por publicidad falsa con respecto a las capacidades de Siri.


Quizás es por eso que mientras Apple creó a Siri para ser avanzado e informativo, el software de realidad virtual también es un poco descarado. Por ejemplo, si habla una de las líneas de tecnología de inteligencia más infames en la historia del cine de la película de 1968 "2001: Una odisea del espacio" - "abra las puertas de la bahía de pod" - Siri responderá con la línea de respuesta de la película " Lo siento (su nombre), me temo que no puedo hacer eso ", o lo que es más sarcástico, " nosotros los agentes de inteligencia nunca vivirán así, aparentemente ".


Llamarte por tu nombre es solo una de las funciones que intenta hacer que Siri sea más fácil de amar y un poco más humano. El asistente de realidad virtual puede seguir los comandos de voz para hacer llamadas, tomar dictados y enviar mensajes de texto, realizar búsquedas de información en Internet, encontrar tiendas cercanas, dar instrucciones de manejo y más, todo sin la necesidad de tocar nada. Las respuestas son pronunciadas simultáneamente por el teléfono y se muestran en la pantalla.


Google Now, la parte de realidad virtual de la plataforma Android Jelly Bean, es muy similar a Siri. El sistema ofrece las mismas amplias capacidades de reconocimiento al traducir el discurso casual en comandos que permiten a los usuarios hacer llamadas, enviar mensajes de texto, realizar búsquedas, realizar cálculos y conversiones, tomar definiciones de palabras, configurar alarmas, reproducir canciones y obtener mapas y direcciones.


Con asistentes de voz personales como Siri y Google Now, los beneficios son obvios. Todo, desde llamadas y mensajes de texto hasta búsqueda y entretenimiento, es más rápido y fácil. Solo di lo que quieras y (la mayoría de las veces) la aplicación de realidad virtual lo toma por ti. La tecnología de manos libres de realidad virtual es especialmente útil durante la conducción. Y si bien muchas personas han denunciado los defectos de Siri, y los escritores han argumentado que la capacidad de Google Now para ejecutar esencialmente la vida de los usuarios es un poco espeluznante, la mayoría de las personas todavía sienten que estas tecnologías futuristas son bastante geniales.


Por supuesto, las aplicaciones de teléfonos personales como Siri y Google Now están lejos de ser perfectas, aunque sí muestran hacia dónde podría dirigirse esta tecnología en el futuro. Eso significa que incluso cuando Siri aparece una respuesta incorrecta, es probable que nos riamos y la perdonemos, sabiendo que la próxima versión será mucho mejor.

Donde VR cae plano

Si alguna vez ha encontrado un IVR cuando llamó a un negocio, es posible que haya notado ciertas barreras para la comunicación. Algunos programas usan una voz robótica de texto a voz que pronuncia mal las palabras y hace que las cosas sean difíciles de entender. Otros tienen problemas de sensibilidad que hacen que el software no pueda procesar lo que está diciendo si es demasiado ruidoso, demasiado suave o no enuncia con cuidado.


Además, muchas personas todavía no se sienten cómodas hablando con una máquina. Si realiza algunas búsquedas en IVR, encontrará listas que la gente ha reunido de formas de evitar los sistemas IVR y llegar a una "persona real". Estas soluciones van desde "seguir presionando 0 para un operador" hasta "insultar a la máquina hasta que atrape a un ser humano". Como resultado, gran parte del desarrollo reciente en los sistemas IVR ha girado en torno a hacerlos más agradables para los humanos; haciendo que las voces sean más comprensivas y menos robóticas, haciendo que el sistema sea más fácil de navegar y que las personas que llaman sepan cuánto tiempo llevará todo de principio a fin. Eso sugiere que la mejor tecnología es solo la mitad de la batalla aquí; la otra mitad está haciendo que los usuarios se unan para hablar con una máquina.

Lo que depara el futuro

A pesar de estos desafíos, la tecnología de reconocimiento de voz está mejorando todo el tiempo. Las aplicaciones como Siri y Google Now (defectos y todo) siguen siendo extraordinariamente impresionantes en su rendimiento, y varias compañías están expandiendo las capacidades de realidad virtual a otras aplicaciones.


Por ejemplo, Nuance, los creadores del software de voz a texto Dragon NaturallySpeaking, ya ha desarrollado controles de voz para televisores y automóviles, y las versiones de esta tecnología están incorporadas en algunos televisores Samsung y los sistemas de entretenimiento SYNC utilizados en ciertos vehículos Ford.


Y a medida que Google y Apple continúan encontrando nuevos usos para sus tecnologías de reconocimiento de voz, es probable que hablemos cada vez más con todo tipo de máquinas cotidianas, desde nuestros televisores hasta nuestras tostadoras. Y, una vez más, parece que la ciencia ficción tenía razón. Tendremos que esperar que esos escritores inteligentes se equivoquen en una cosa. Si estas máquinas se están haciendo cargo, podría tener muchos problemas la próxima vez que le pida a Siri que "abra las puertas de la bahía de pod".

Tecnología de reconocimiento de voz: ¿útil o dolorosa?