Introduciendo el Voice System Persona Canvas

27 mayo 2019

Introduciendo el Voice System Persona Canvas

by Mike Nøah


Puedes descargarte el Voice System Persona Canvas


Para aquellos involucrados en el desarrollo de producto es más que conocido el concepto de user persona creado por Alan Cooper.

En la interfaz conversacional este concepto evoluciona hacia el de voice user persona — en el que aspectos como lo que dicen las personas y cómo lo dicen alcanza un nivel de importancia aún mayor. Pero a esta evolución hay que añadir una nueva identidad que definir en la interacción. Y es lo que denominaremos voice system persona, capaz de perfilar la identidad del sistema con el que interactúan los usuarios a través de la conversación.

Tenemos experiencia en cómo crear user personas con modelos y templates accesibles. Sin embargo, ante la madurez todavía en crecimiento del desarrollo conversacional, cabe preguntarse cómo se construye una voice system persona adecuada y qué proceso puede seguirse para su construcción.

Qué es este canvas y para qué sirve

El Voice System Persona Canvas es un lienzo de trabajo que sirve como hoja de ruta y que nace con la intención de crear un marco para perfilar la identidad de productos de voz en el seno del desarrollo de interfaces conversacionales.

La identidad de tales sistemas es un hito fundamental en el diseño de conversación y, de manera análoga a lo que se consigue con las user personas en el diseño de productos, la voice system persona nutre y sirve de referencia a la hora de afrontar el diseño de diálogos de los asistentes. Además, constituye la extensión natural a la voz de la identidad de marca; lo que hace de este canvas una herramienta útil no sólo para diseñadores de conversación sino también para todos aquellos perfiles de negocio, marketing y desarrollo de producto.

Contexto de uso

El canvas por sí solo carece de utilidad. Como herramienta que forma parte del proceso de diseño, necesita de una información previa sin la cual no tendría pleno sentido su construcción. Por eso, antes de describirlo, es importante situar su contexto de uso; qué cosas necesitamos antes de utilizar el canvas.

  • Voice user personas: sin conocer al interlocutor con el que el asistente va a conversar, la creación de una identidad se reduce a un ejercicio de hipótesis. Saber quién habla con nuestro sistema y cómo lo hace permitirá identificar conexiones, sutilezas y necesidades de los rasgos de la voice system persona en su interacción con los usuarios.
  • Los escenarios: aunque se trata de una componente intrínseca dentro del concepto de voice user persona, destaquemos el contexto — emocional o físico — en el que se situará el usuario. Escenarios de uso que influyen sobre la conversación y que tendrán que tenerse en cuenta durante la construcción de la identidad. Sobre todo a la hora de mapear situaciones de conversación.
  • La propuesta de valor: aunque parezca obvio, tener clara cuál es la misión del asistente y qué papel juega — bien como producto individual o como parte de un ecosistema — definirá unívocamente ciertos rasgos de su identidad.
  • La marca y estilo de comunicación: sobre todo en el caso de productos que forman parte de un ecosistema. En estos casos puede llegar a ser necesario encajar la marca ya existente o una variante en la identidad.

Descripción del Voice System Persona Canvas

El canvas consta de 4 partes principales:

1 Mapa emocional de la voz

Para mapear la voz, comenzamos por acotar las diferentes situaciones de conversación; aquellos conjuntos de diálogos con raíz común que vendrán definidos principalmente por la propuesta de valor y la profundidad de conversación que queramos dar al producto.

Las situaciones de conversación incluyen componentes universales como fallbacks o errores, onboarding, saludos, despedidas… También incluyen todas aquellas propias de cada producto como pueden ser temas recurrentes, descripciones, tareas, uso de sonidos… Pueden llegar a definirse situaciones mucho más particulares tales como momentos en los que el usuario amenaza al asistente porque no le ha entendido, momentos en los que el usuario trata de burlarse o incluso intenta ligar con el sistema.

Una vez identificadas las situaciones, vamos a localizar cada una de ellas en el mapa emocional global de nuestro asistente. Este mapa emocional — inspirado en el trabajo de Aarron Walter en Designing for Emotion — nos permite asociar a cada situación un estado emocional básico a partir del cual establecer cómo se comunica nuestro asistente.   

Por un lado, una escala de cercanía marcado por los extremos amistoso y moderado u hostil (dependiendo de la necesidad) — sutilmente modificada a partir de los adjetivos friendly y unfriendly en la versión inicial del mapa. Por otro, una escala complementaria que marca el nivel de autoridad del asistente — bien en conocimiento o liderazgo — marcado por los extremos dominante y dócil.

En el ejemplo de la imagen podemos ver cómo ante situaciones de error en el reconocimiento del mensaje por parte del sistema (Fallback I), el asistente se mostrará más amistoso y dócil a la hora de comunicarse con el usuario.

Este mapa no va a determinar todavía los rasgos de nuestro asistente, pero sí nos va a permitir realizar una acotación a alto nivel. A través del contexto de uso y las voice user personas, el mapa emocional nos permite marcar el camino para el resto del canvas.

2 Rasgos del voice system persona

Pensemos ahora en qué adjetivos definen al asistente o, dicho de otro modo, qué adjetivos nos gustaría que el usuario asocie al sistema.

 

Una vez propuestos una lista suficiente, escogemos de 4 a 6 adjetivos capaces de sintetizar los rasgos principales de nuestra voice system persona. Por eso resulta útil profundizar en la definición de cada uno de ellos apoyándonos en el contrapunto del ‘pero no’. Por ejemplo, podríamos definir nuestro asistente como divertido pero no burlón; o como serio pero no frío.

Son adjetivos que a lo largo del canvas se tomarán como referencia, de ahí que esta fase sea uno de los momentos importantes.

3 Identidad del sistema

A partir de los adjetivos principales recién seleccionados, pensemos qué personajes — no necesariamente reales ni humanos — caben bajo esa descripción. Cuando hablamos de personajes bajo una misma descripción hablamos de una variedad tal como: un mayordomo, Alfred Pennyworth, un jefe de servicio de hotel, Jarvis, un chófer,…  

 

Asociado uno o una mezcla de varios personajes (3 máximo, por ejemplo), es el momento de hacer lo más parecido a las user personas que ya conocemos.

Con ello nos referimos a definir aspectos demográficos, culturales y de comportamiento que afectarán a la conversación en contenido y forma. De estos rasgos — siempre con las user personas, marca y propuesta de valor en mente — obtendremos características de la conversación como temas recurrentes, small talks, la calidad, el nivel cultural, jergas, el uso de emoticonos, diminutivos, onomatopeyas, anglicismos…

Además, a través de estas características conseguiremos complementar el número y tipo de situaciones de conversación iniciado en la primera fase. Por ejemplo, en este punto del canvas podríamos perfilar de qué le gusta hablar al asistente en su día a día. Ese rasgo nos permite definir un tema recurrente que forme esporádicamente, y de manera natural, parte de la conversación como un small talk o diálogo distendido.  

Cabe mencionar en este punto que, a pesar de la humanización que instintivamente hacemos de los asistentes, hay ciertos aspectos en la definición de identidad del sistema que carecen de la relevancia que podemos pensar a priori en muchos casos. Rasgos como la edad y el sexo, o el aspecto físico en asistentes sin identidad visual, no tienen por qué ser necesariamente datos diferenciadores en este punto ya que podrían llegar a limitar decisiones posteriores como, por ejemplo, la elección de la voz a utilizar (sea sintética o grabada).

4 Rasgos de la conversación

En esta fase recuperamos conclusiones obtenidas a lo largo de todo el proceso para definir mapas situacionales. El voice system persona canvas admite la flexibilidad de realizar tantos mapas como situaciones definidas queramos diferenciar o, por el contrario, realizar un único mapa que defina toda la interacción del asistente sin discriminar entre las distintas situaciones.

Dependiendo del número de adjetivos que hayamos escogido como principales en la segunda fase del canvas — 4, 5 o 6 — construiremos diagramas de araña cuadrados, pentagonales o hexagonales en el que definir una influencia nula, baja, intermedia, intensa o predominante de cada adjetivo. El ejemplo de la imagen muestra el caso en el que hay definidos 4 adjetivos principales y cómo sería consecuentemente un mapa situacional concreto.

 

 
 

 

Este tipo de mapas nos ofrece una gran variedad de posibilidades que tenemos muchas ganas de seguir probando y validando en proyectos como Alfred, el asistente virtual interno de Sngular. Hablamos de posibilidades como la comparativa de situaciones para diferentes asistentes, los matices de una misma personalidad para diferentes usuarios  o la evolución de un voice system persona con el tiempo de vida de un producto.

Pero el canvas no sólo tiene por qué servir como fin en sí mismo. De la misma manera que las user personas nos permiten construir mapas de empatía y otros artefactos, las conclusiones de este canvas aspiran a ser punto de partida para análisis complementarios como el análisis emocional del sistema.

Evolución del canvas

La creación de esta herramienta ha sido un trabajo de investigación, recopilación y aprendizaje que no acaba aquí y que aspira a evolucionar a través de actualizaciones versionadas del canvas.

Algunos de los próximos pasos se centrarán en la asociación de rasgos lingüísticos — orales y escritos — a rasgos emocionales y de comportamiento en el diseño de voice user personas y la identidad del sistema.

Conclusiones

Debemos ser conscientes de que el diseño de conversación presenta limitaciones como la diferencia natural de matices entre la comunicación escrita y oral. Pero a día de hoy, también existe la limitación tecnológica que marca la diferencia entre voces sintéticas y la voz humana.

Para el caso de las voces artificiales, las limitaciones se reflejan en mayor y menor medida en términos de intensidad, velocidad, tono, duración silábica, prosodia… Con esta situación, hay ciertos rasgos del canvas que se verán mermados y será necesario tenerlo en cuenta para no excedernos en trabajar características que acabarán por no poder reflejarse todavía en el producto.

Sin embargo, ante muestras como la de Google Duplex hace ya un año, la certeza de que dichas limitaciones tecnológicas acabarán por minimizarse parece más que plausible y hace del canvas un ejercicio de anticipación en el diseño de identidades que poder usar también hasta que llega ese momento.

Mientras tanto, continuaremos aprendiendo y haciendo crítica. Y también compartiendo la experiencia a través de workshops — que se definirán en próximas fechas — donde poner en práctica y a prueba este voice system persona canvas.


Puedes descargarte el Voice System Persona Canvas.


Referencias principales

Sobre el equipo

El Voice System Persona Canvas de Sngular es el resultado de un magnífico trabajo colaborativo entre nuestras distintas DKCs. Agradecemos a Mike Nøah y Jhonattan Perez (UX Designers), Luca de Filippis (Lingüista Computacional), y Álvaro Olmo y Marina Jiménez (Conversational Designer) por el fantástico trabajo que han realizado creando, refinando y perfeccionando el VUI Persona Canvas.

Country

Volver a la listaSiguiente artículo
arrow

Titulo

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.