VoiceXMeetUp S01E01: Fundamentos de la voz y el diálogo

28 febrero 2019

VoiceXMeetUp S01E01: Fundamentos de la voz y el diálogo

by Sngular

Las interfaces de usuarios por voz son una realidad que están cambiando la forma que interactuamos con la tecnología. Cada vez es más común entre los usuarios el uso de asistentes virtuales para hacer tareas básicas. La facilidad de comunicarse con un dispositivo para revisar agendas o poner música sin la necesidad de interactuar físicamente, está convirtiendo a esta tecnología en una necesidad.

Sin embargo, la creación de una experiencia entre un ser humano y sistema de interacción por voz no tiene el mismo nivel de profundidad que, por ejemplo, un sistema de interacción por pantalla. VoiceXLab, una iniciativa creada desde Sngular y PS21, ha nacido de la necesidad de potenciar esta tecnología. Esta iniciativa busca crear la primera comunidad viva en España dedicada a investigar las posibilidades tecnológicas y de negocios de la voz como canal de comunicación entre personas e inteligencias artificiales.

En nuestro primer VoiceXMeetUp: fundamentos de la voz y el diálogohemos asentado las bases y elementos claves sobre los que se construye una experiencia de Interacción a través de la Voz: la Voz y el Diálogo. Para entender la importancia del desarrollo de esta tecnología, primero entendamos el mercado.

Market Research Findings de Sngular

Se estima que hay un gran volumen de negocio para las VUI, se estima que la oportunidad de negocio es de $7.000 M en 2025. No obstante, vemos que la realidad del mercado no corresponde con la realidad del negocio. Hoy en día, lo principales usos que se le está dando a esta tecnología son a escuchar música, o búsquedas rápidas. Pero este uso es el nuevo caldo de cultivo para el mercado del futuro.

Gracias a los grandes avances en términos de procesamiento del lenguaje natural e inteligencia artificial, se está dando lugar nuevos casos de uso y nuevos modelos de negocio. Una vez que el usuario haya construido este hábito, va a ser más fácil que generen y depositen confianza en esta tecnología para actividades más complejas. Por ejemplo, podríamos utilizar esta tecnología para hacer transferencias a través de voz, o hacer compras impulsivas o recurrentes en plataformas ecommerce. Laura Ruiz, Innovation Manager en Sngular, nos ha presentado los principales indicadores que demuestran este crecimiento:

  • El 55% de los hogares en EEUU tendrán altavoces inteligentes en 2022.
  • El 50% de las búsquedas en 2020 se harán por voz.
  • Para 2025 la oportunidad será de $7.000M en reconocimiento de voz.
  • Existen 5 sectores atractivos en términos de inversión y beneficios a través de la interfaz voz que son salud, automoción, finanzas, ecommerce y atención al cliente, el vértice cross estrella.

La interacción conversacional simplifica y humaniza la relación con la tecnología, pero como nos explicaba Laura en su ponencia, “el hecho de que nos comuniquemos regularmente no nos hace idóneos para diseñar conversaciones”. A la hora de desarrollar interfaces de usuario de voz (VUI) hay que tener en cuenta dos voces: la de nuestro usuario y la Inteligencia Artificial.

¿Qué es la voz?

Alyssa Ciccarello, coach de voz, nos explicaba que “la voz es una herramienta muy potente de comunicación que tiene como propósito crear un puente entre las personas”, para lograr un impacto y poder conseguir lo que queremos.

Todos tenemos una voz y algo que decir. El “deseo de comunicarnos… de compartir” es una necesidad casi de vida o muerte que se crea desde un impulso completamente físico e involuntario. Este impulso es canalizado a través de nuestro cuerpo hasta convertirlo en movimientos musculares que terminan produciendo la voz.

El lenguaje, la otra parte de la comunicación humana, es cultura lo que significa que algunos elementos de nuestra voz lo vamos modificando para encajar dentro de nuestra cultura, lo que es socialmente aceptable. La forma de hablar de quienes nos rodean nos va amoldando el acento, el volumen y el tono. Esto nos hace más aptos para ser parte de nuestra sociedad o “tribu”.

A la hora de desarrollar interfaces por voz, “¿qué tanto debe sonar a la comunidad en la que está? ¿Qué elementos del lenguaje tiene que tener en cuenta experiencias?… ¿Tiene que adaptarse a un acento o un idioma?… ¿Qué tan sensible y adaptado a la cultura tienes que estar?”. La tecnología está tratando de replicar lo más rápido posible la habilidad humana de comunicarnos, pero a pesar de que nuestro asistente de voz, por ejemplo, pueda imitarnos, ¿”debería?”, nos reflexiona Alyssa.

Teorías en crisis de la comunicación

El paradigma de la comunicación está cambiando. La teoría de la comunicación como la conocemos se ha visto afectada por las nuevas tecnologías. Óscar Gómez, socio director de Qwerty Comunicación, compartió con nosotros los procesos que intervienen en el proceso de la comunicación y cómo podemos incorporarlo en la tecnología VUI.

En todo proceso de comunicación existen dos protagonistas: el emisor y el receptor. Entre ambos se produce un proceso de retroalimentación: el emisor lanza un mensaje y el receptor reacciona y responde al emisor. Pero, ¿qué pasa cuando el mensaje no es claro y el canal no es el adecuado?

Óscar nos pone el siguiente ejemplo:

Este incomprensible tweet de Iñigo Errejón no estaba bien dirigido ni se estaba utilizando el canal de comunicación más adecuado.”El mismo intentó explicar lo que había querido decir, pero ni él lo sabía” nos cuenta Óscar.

Si trasladamos este ejemplo al proceso de comunicación con nuestros asistentes virtuales, nos damos cuenta de la importancia del contexto y el canal. No es lo mismo cuando estás hablando con un sistema, por ejemplo, mientras conduces, que estás en un contexto comunicativo en el que no está poniendo toda tu atención en la conversación sino en conducir, es completamente distinto cuando vas con tu teléfono o en tu casa cocinando.

El uso de los asistentes virtuales lo hacemos mientras realizamos otras tareas con la atención centrada en otra cosa. Lo que va a cambiar es la forma en que interactúas con la interfaz. Nuestro asistente virtual debe ser capaz de adaptarse y ser más conciso.

Igualmente, Oscar nos presenta otro ejemplo:

La casa blanca pidió hacer la entrevista con el objetivo de exponer al Presidente Obama en un canal que le permitiera llevar su mensaje sobre el sistema de salud pública Obamacare frente a su público objetivo: adolescentes americanos.

Esto demuestra la importancia de elegir un canal específico para llegar a un determinado público. La audiencia a quienes nos dirigimos está cambiando y tenemos que adaptarnos. Ahora nuestra audiencia consume la información cómo, cuándo y con el formato que quiera. Este cambio de paradigma es una oportunidad para todos.

Las apps llegaron y nos sobrepasaron enseguida, pero no está ocurriendo lo mismo con la interacción por voz. Las interfaces de voz obligan a los usuarios a interactuar con comando predeterminado. Por eso, el usuario no ha llegado a entender el potencial del uso de esta tecnología. Aunque hoy en día se le dé un uso muy básico, dentro de poco será una herramienta básica para mejorar y agilizar nuestras vidas.

No te pierdas los últimos eventos de VoiceXLab. Si quieres ver la presentación del primer meetup, haz clic aquí.

Country

Offices

Volver a la listaSiguiente artículo
arrow

Titulo

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.