Los grandes retos de la voz como interfaz

27 marzo 2019

Los grandes retos de la voz como interfaz

by Sngular

Las interfaces de interacción por voz están creciendo en popularidad a un ritmo exponencial. Los gigantes tecnológicos como Apple, Amazon, o Google mantienen el desarrollo de plataformas de interacción por voz como centro de su estrategia. Estas grandes corporaciones están impulsando esta tendencia al competir con sus asistentes de voz como Google Home o Alexa, entrando en nuestros hogares y convirtiendo su uso en mainstream. Si bien aún le falta un largo camino por recorrer, las expectativas de los usuarios están cambiando y la adopción de VUI sigue creciendo.

Según Grand View Report, se estima que el volumen de mercado global en Speech & Voice Recognition alcanzará los 31.82 billion de dólares en 2025. Sin embargo, a medida que se expanden las oportunidades para utilizar VUI, los desafíos son inevitables. Analizamos con Carlos Guardiola, Chief Innovation Officer de Sngular, los grandes retos de la voz como interfaz.

Sngular: ¿Cuáles crees que son los principales retos de la voz como interfaz?

Carlos Guardiola: Yo diría que hay tres retos muy importantes a destacar:

El Discovery

El primero de ellos es cómo las personas descubren lo que el sistema sabe o puedo hacer por ellos. En una web, por ejemplo, está muy trillado. Hay muchas maneras de hacer que una persona descubra qué puede hacer en ella. Hoy en día es bastante fácil entrar en una web desde un ordenador y pedir un billete de tren, hacer una reserva en un hotel, o comprar un producto en Amazon. Pero cuando tienes al otro lado un asistente de voz, no es aún tan intuitivo lo que puedes hacer con ella. Actualmente las interfaces de voz obligan al usuario a adaptarse al lenguaje utilizando comando predeterminados.

Evidentemente, si quieres conocer los destinos a los que te lleva Renfe, no te va a contestar en forma de narración de la A a la Z. Probablemente tenga que entender lo que necesitas haciendo una serie de preguntas que puedan afinar su respuesta, convirtiendo así esa consulta en un proceso mucho más eficiente. Por tanto hay un reto en cómo hacer de forma intuitiva y natural que tu usuario entienda lo que es capaz de hacer su asistente por voz por él, ese discovery.

La rapidez del sistema

Hay otro reto  importante por parte del sistema, y es el de entender de la forma más rápida posible y menos intrusiva lo que alguien está pidiendo. Esto es un reto de las plataformas de voz desde que empezaron a ponerse los primeros asistentes telefónicos robóticos en los años 90. Inicialmente se genera mucha frustración por parte del usuario cuando no conseguía hacerse entender con el asistente, y acababa siempre pidiendo hablar con un operador. Esta frustración ha provocado que el usuario no vea el valor de utilizar esta tecnología.

La creación de identidad de la marca

El tercer reto importante va dirigido a las marcas. Las empresas llevan muchos años creando su identidad en canales físicos o web. Empezaron en periódicos, lo llevaron a la televisión y pasaron al canal digital, y lo han aprendido a hacer a través de elementos como los colores, las fotos, el estilo o los mensajes. Hay  fotos que ves, y sabes que son de Coca-Cola, incluso hay fotos que sabes que están representando a un banco o una aseguradora.

Cuando lo trasladamos a una interacción a través de un asistente virtual con un altavoz de Google o Amazon, hay que tener una mentalidad totalmente diferente. ¿En qué  momento y de qué manera se crea esa identidad en voz para diferenciar tu marca? ¿Cómo hacer para que los usuarios entiendan que están hablando con Coca-Cola y no con Pepsi?

Es también diferente a la forma de hacerlo en radio, ya que un anuncio que va precedido por un jingle de entrada y otro final sería molesto en cada frase de una conversación directa con el usuario y la gente podría dejar de usarla.  A día de hoy todavía no está definido si podrías utilizar la voz de un famoso o de un actor para representar una marca.

De momento hay un catálogo de voces en Alexa o Google Assistant que puedes utilizar, pero aún no es mainstream el uso de tu propia voz. En televisión hoy en día hay determinados actores que son las voces de muchas marcas y gracias a los elementos visuales se identifica si Matías Prats te está hablando de Línea directa o de ING, por ejemplo. Pero, ¿cómo lo harías sin soporte visual?

Por tanto, para crear estas conversaciones antes hay que crear la personalidad de la marca, y representarla en su voz.

C.G.: Eso es. Esta misma reflexión se trató durante el primer capítulo del VoiceXMeetup durante la charla de Alyssa Ciccarello. La forma en la que las personas hablan no es la misma en el norte o en el sur de España, y la forma, la familiaridad o la formalidad con la que hablas con tu hermano, no es la misma que la que te comunicas con una persona mayor o un niño. Sin embargo, forman parte de la misma personalidad: La tuya. ¿Debería también condicionar el usuario con el que nos estamos comunicando la forma en la que la voz de la empresa se comunica con ellos? No hay una respuesta formal unilateral. No obstante, si nosotros matizamos nuestro lenguaje al comunicarnos con diferentes personas para conseguir transmitir algo concreto, las marcas también deberían hacerlo para impactar en sus usuarios de la forma que quieren hacerlo.

¿Crees que estos dispositivos van a poder identificar nuestro estado de ánimo, nuestro sexo o nuestra edad al “hablar con nosotros” y  adaptar la conversación?

C.G.: Debería. La tecnología es madura para los desarrolladores o proveedores de tecnología, pero todavía no es mainstream para que el resto la podamos utilizar. Pero creo que acabaremos llegando a eso. Los sistemas deberían ser capaces de distinguir nuestros estados de ánimos y responder a ellos.

 

Volver a la listaSiguiente artículo
arrow

Titulo

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.