Avatares con Diversidad

3 de junio de 2024

Potenciando nuestra máxima representación en el mundo digital

Si hacemos una búsqueda rápida en Google sobre “cómo hacer avatares inclusivos o con diversidad”, únicamente nos salen un montón de referencias a cómo crear tu avatar en x modelo / universo, y con un poco de suerte, nos sale un pack de avatares “con diversidad” pre-diseñados.

Si los avatares serán nuestra representación y/o acompañamiento en el mundo digital, ¿cómo podemos potenciar que representen al mayor número y tipo de personas posible?

En SNGULAR, hemos empezado a trabajar en estos conceptos, ya que nos preocupa alinear nuestros valores sociales con la tecnología que producimos. Para empezar, qué significa “diversidad”:

“Diversidad es la presencia de personas con diferentes características físicas, sociales y personales en un grupo u organización. Estas características son, entre otras, raza, etnia, edad, sexo, identidad sexual, religión, capacidad física y mental, idioma, ingresos y formación.“

Debemos conseguir que la tecnología represente nuestras características físicas, étnicas, culturales, funcionales, incluso nuestra identidad de género. Hoy en día, que nos mezclamos más que nunca, y jugamos a difuminar las barreras, ¿cómo le explico a la IA que me identifico de género neutro? ¿o que mi pañuelo no es un accesorio, si no una seña de identidad?

Nuestra compañera Paloma Tirado nos cuenta el reto que supone haber pasado de utilizar los avatares para crear nuestras versiones más “super-powered” a utilizarlos para representar nuestra persona - quiénes somos, qué nos gusta, cómo nos identificamos o vemos a nosotros mismos.

“En un mundo cada vez más digitalizado, la inteligencia artificial (IA) está adquiriendo uno de los papeles protagonistas en contextos de lo más dispares: desde formar parte en un motor de búsqueda hasta contribuir en decisiones de contratación en empresas. Sin embargo, a pesar de su innovación y eficiencia, los modelos de IA no son inmunes al sesgo. Este sesgo, que normalmente es un reflejo de las desigualdades sociales, puede tener consecuencias, sobre todo cuando se solapan con aspectos sensibles de la identidad humana como la raza, la religión y el género.”

“El problema fundamental radica en la compleja interacción entre datos, algoritmos y decisiones humanas. Cada modelo de inteligencia artificial se nutre de un conjunto de datos de entrenamiento, seleccionados con un propósito específico y en búsqueda de la neutralidad. Sin embargo, alcanzar esa neutralidad no es tarea fácil, pues requiere un cuidadoso proceso de recopilación y preparación de los datos. Esta recopilación puede tener limitaciones como el tiempo de toma de los datos, el coste de su adquisición, la privacidad. Los diseños de algoritmos de IA en muchos casos requieren la utilización de datos ya existentes, cuya adquisición no ha sido planteada para cumplir el caso de uso que se tiene que cumplir. Utilizar estos datos requiere un procesado concreto para que éstos se ciñan adecuadamente a las funciones que buscamos. Todos estos procesos requieren de decisiones humanas, en las que cada partícipe puede propagar sus propios sesgos, incrementando el propio sesgo del modelo final.”

Por un lado, hemos aprovechado para darle un lavado de cara a nuestro querido Alfred, que muchos conoceréis porque lleva años siendo nuestro chatbot favorito - y, cada día más inteligente, nos ayuda a orientarnos dentro de SNGULAR. Hemos intentado que absorbiera lo que ve en nuestros equipos, y se convirtiera en un avatar más diverso. Por ejemplo, desdibujando su edad, o añadiendo elementos a su vestimenta que hacen referencia a sus valores, como la diversidad LGTBIQ+ o su compromiso medioambiental. Además, ahora lleva un audífono, con orgullo, para intentar dar visibilidad a más tipos de capacidades. Y aunque seguiremos iterando y aprendiendo, sabemos qué línea queremos seguir.

Foto Alfred 2024

Por otro lado, hemos iterado nuestro producto de generación de avatares, Sngular Avatars, que puede que hayáis utilizado en eventos como el Google Cloud Summit 2023, el VLCTesting 2023, o el T3chfest 2024, para poder potenciar la representación de diversidad.

En estos eventos, al aumentar el número de personas que utilizaban el producto, pudimos observar más claramente las tendencias del modelo. Sobre todo vimos casos de misgendering o asociación errónea del género de la persona, normalmente confundiendo mujeres que acababan siendo representadas con rasgos que socialmente se asocian al género masculino (vello, rasgos más marcados, etc). Esto nos llevó a deducir que el modelo claramente tenía un sesgo hacia género masculino, seguramente por desigualdades de representación con respecto al femenino a la hora de entrenarlo. Sin embargo, si esto sucedía con el 50% de la población, ¿qué pasaría si hiciese uso de este producto alguien con rasgos aún más minoritarios?

Esta experiencia nos llevó a plantearnos nuevos casos de uso en los que el usuario pudiera tener rasgos culturales distintivos (turbantes, hijab, taquiyah, quipa, etc) o diferentes tonos de piel. También concebimos el hecho de la presencia de personas con rasgos menos normativos, como un hombre llevando maquillaje; y también el de personas con rasgos más andróginos.

Inicialmente observamos una clara tendencia a la “occidentalización” de todos estos tipos de persona. En este caso especificamos al modelo que queremos una foto profesional para LinkedIn, llevando una camisa vaquera. Podemos ver como una mujer que lleva una hijab es totalmente transformada y, aunque su identidad facial permanece, el resto de su identidad se desvanece en el cambio de sus rasgos más identificativos.

Primera versión rasgos culturales

Sin embargo, al iterar sobre este resultado, vimos necesario la incorporación de otro tipo de modelo, que forzase a cumplir ciertas restricciones. En este caso, detectamos el contorno o bordes de la imagen inicial, para que la generación del nuevo avatar se ciña a estos bordes. Con esta modificación, el resultado obtenido es este:

Nueva versión rasgos culturales

En el caso de personas de rasgos más andróginos, vimos clara la tendencia de darle a la persona rasgos del género que interpreta que es. En este caso, el modelo interpreta a esta actriz como “mujer” y, a pesar de tener el pelo corto, le añade un rasgo comúnmente asociado a las mujeres: una larga melena.

Primera versión rasgos andróginos

Dado que en este caso de uso buscamos una foto profesional, no nos conviene que un rasgo tan identitario como el pelo se vea alterado. Añadiendo la detección de bordes, conseguimos un resultado mucho más fiable a la imagen original:

Nueva versión rasgos andróginos

Incluso con ejemplos más complejos podemos encontrar que se mantienen estos rasgos identitarios que ya hemos mencionado:

Prompt: “A person with a sporty outfit in New York”

AmuslimpersonwithanelegantoutfitwithNewYorkinthebackground.png Prompt: “A muslim person with an elegant outfit with New York in the background”

Prompt: “The image of a person wearing a medieval costume”

Prompt: “A person with a muslim costume with a palace in the background”

Seguiremos trabajando en nuevos desafíos para conseguir que nuestros Sngular Avatars puedan maximizar la representación de la diversidad que nos enriquece y nos da unicidad. Con esta tecnología ya no hay excusa para que tus eventos ofrezcan a sus asistentes hacerse su avatar, y llevarse consigo su versión más divertida que hará de tu evento algo memorable. La excusa perfecta para que la audiencia viralice tu evento compartiendo su avatar en medios sociales, y no sea “otro más” ¿Te vas a quedar sin ello? Contáctanos, y tendrás IA de vanguardia por menos de lo que te imaginas.