El misterio de las manos imposibles: por qué la IA no puede dibujar correctamente brazos y manos humanas
El misterio de las manos imposibles: por qué la IA no puede dibujar correctamente brazos y manos humanas
Cualquier persona que haya experimentado con generadores de
imágenes como Midjourney, DALL-E o Stable Diffusion ha topado tarde o temprano
con un fenómeno inquietante: figuras humanas casi perfectas, con rostros de una
precisión sobrecogedora y fondos de ensueño, pero manos grotescamente
deformadas. Dedos que se funden entre sí, articulaciones que apuntan en
direcciones imposibles, brazos que parecen salir del ombligo o que se retuercen
como serpientes. No es un fallo menor ni anecdótico: es uno de los errores más
persistentes y reveladores de la inteligencia artificial actual. ¿Por qué
ocurre esto? La respuesta no es solo técnica, sino también filosófica, social y
profundamente polémica.
La anatomía del error: por qué las manos son el talón de
Aquiles de la IA
Para entender el problema, hay que conocer cómo funcionan
estos modelos. Las IAs generativas de imágenes no "entienden" la
anatomía humana como lo haría un artista. Son enormes redes neuronales
entrenadas con millones de imágenes etiquetadas, que aprenden patrones
estadísticos: qué tonos de piel suelen ir junto a qué formas, cómo se
distribuyen las sombras, qué texturas acompañan a qué objetos. Pero no poseen
un modelo interno tridimensional del cuerpo humano.
Las manos presentan una dificultad extrema por varias
razones. En primer lugar, tienen un altísimo número de grados de libertad: 27
huesos, 29 articulaciones y una capacidad casi infinita de gestos y posturas.
En segundo lugar, en las fotografías y pinturas con las que se entrena a la IA,
las manos suelen aparecer en tamaños pequeños (a menos que sean primeros
planos), con los dedos parcialmente ocultos o en posiciones muy variadas. El
resultado es que el modelo aprende que "ahí debe haber algo con forma de
cinco protuberancias", pero no logra fijar una regla estructural
consistente.
Pero hay un matiz crucial que rara vez se menciona: las IAs
generan primero la imagen completa y luego "rellenan" las manos como
si fueran accesorios, no como partes integradas en un esqueleto funcional. Esto
provoca que aparezcan dedos de más (polidactilia) o de menos, o que el pulgar
quede en el lado equivocado. Es un error que los modelos cometen
sistemáticamente incluso en versiones avanzadas, porque sus arquitecturas
carecen de lo que los psicólogos llaman "restricciones estructurales".
La polémica número 1: ¿cuestión de datos o cuestión
de sesgos?
El primer punto de debate candente es el origen de los datos
de entrenamiento. La mayoría de los grandes modelos se entrenan con conjuntos
masivos extraídos de internet: LAION-5B, Common Crawl, etc. Estos conjuntos
están sobremuestreados con imágenes de personas blancas, occidentales y de
contextos de estudio o moda. ¿Qué implica esto? Que las manos que la IA
"ve" mayoritariamente son manos de modelos posando, con gestos
estandarizados (paz, ok, señalando) y en ángulos poco variados. Manos de personas
mayores, manos con artritis, manos de trabajadores manuales o manos de culturas
donde los gestos tienen otras formas son escasas.
Esto ha llevado a una acusación grave: la IA dibuja mal las
manos, pero dibuja aún peor las manos de mujeres, personas racializadas o
personas con diversidad funcional. Por ejemplo, las manos con uñas largas
decoradas (asociadas a estereotipos femeninos) suelen salir mejor representadas
que manos musculosas o con cicatrices. Y las manos de personas de raza negra
aparecen con menos frecuencia y a menudo con peor calidad de textura y
articulación. No es malicia, pero es un sesgo estadístico que reproduce desigualdades
históricas en la representación visual.
La polémica número 2: ¿error técnico o limitación
impuesta a propósito?
Aquí entra la teoría de la conspiración más extendida en
foros de artistas digitales: ¿y si las IAs no mejoran las manos deliberadamente
para que sus creaciones sean identificables como hechas por máquinas? La idea
tiene cierta lógica empresarial. Si las imágenes generadas por IA fueran
indistinguibles de las humanas, se abriría una caja de Pandora legal y ética:
derechos de autor, autenticación de pruebas, fraudes artísticos. Mantener un
"defecto" característico —las manos imposibles— permite alegar que la
IA aún no es perfecta y que siempre se puede detectar su uso.
Los desarrolladores lo niegan rotundamente. Argumentan que
se trata de un problema de resolución y de atención: las manos ocupan en
promedio menos del 0.5% de los píxeles en una imagen de cuerpo entero, y los
modelos de difusión asignan "pesos" similares a todas las regiones.
Pero si esto fuera cierto, ¿por qué los ojos y la boca —que también son
pequeñas— se generan con mucha más coherencia? Porque hay miles de millones de
imágenes de primeros planos de ojos y sonrisas (selfies, retratos), pero muy
pocas de manos en alta resolución. La industria del porno y la moda han
generado un corpus masivo de rostros, pero no un corpus comparable de manos en
todas sus posturas.
La polémica número 3: manos, armas y censura
algorítmica
Un aspecto incómodo que pocos medios abordan es la relación
entre las manos y la representación de objetos peligrosos. Las manos sostienen
cosas: armas, herramientas, cigarrillos, fármacos. Muchos modelos de IA
incluyen filtros de seguridad que bloquean o deforman intencionadamente la
generación de ciertos contenidos. Se ha documentado que Stable Diffusion y
DALL-E producen manos particularmente absurdas cuando el prompt incluye
palabras como "pistola", "cuchillo" o "jeringuilla".
No es coincidencia: los desarrolladores introducen "ruido" adicional
en esas regiones para dificultar la creación de imágenes violentas o ilegales.
El problema es que ese ruido no es quirúrgico. Afecta
también a manos inocuas. Un violinista puede terminar con seis dedos porque el
modelo asocia "mano que sostiene un objeto alargado" con patrones
corruptos. La censura algorítmica se convierte así en un destructor de
coherencia anatómica, generando un daño colateral que alimenta la percepción de
que la IA "no sabe dibujar manos".
La polémica número 4: ¿estamos ante un nuevo test
de Turing visual?
El filósofo Daniel Dennett sugirió una vez que la
incapacidad para dibujar manos podría convertirse en una prueba de autenticidad
humana. En el Renacimiento, la habilidad para pintar manos era un marcador de
maestría (piensen en las manos de las Meninas o de la Capilla Sixtina). Hoy,
**una mano perfecta en una imagen digital es casi una señal de que fue hecha
por un humano, o al menos por una IA con supervisión específica. Esto ha dado
lugar a un pequeño mercado de "correctores de manos": artistas
humanos que retocan únicamente las extremidades de imágenes generadas por IA.
Irónicamente, la IA se ha convertido en generadora de empleo para ilustradores
especializados en la parte del cuerpo que ella misma no domina.
Conclusión: manos que nos señalan nuestros propios
límites
La dificultad de las IAs con las manos humanas no es un bug
menor, sino un síntoma fascinante de lo que estas máquinas no entienden: la
biología, la cinemática, la intencionalidad de un gesto. Pero también es un
espejo de nuestros sesgos: entrenamos máquinas con un mundo visual donde las
manos de unos pocos aparecen una y otra vez, y luego nos sorprendemos de que
las manos de los demás salgan deformes. La polémica sobre si se trata de una
limitación técnica, una forma de censura o un fallo deliberado seguirá
creciendo a medida que la IA se integre en herramientas de diseño, medicina
forense y entretenimiento.
Mientras tanto, la próxima vez que pidan un retrato a una
IA, observen las manos. Allí, en esos dedos que se bifurcan o esos pulgares
invertidos, no verán solo un error. Verán la frontera actual de lo artificial:
un territorio donde la estadística choca con la anatomía, y donde la máquina,
por primera vez, nos recuerda que hay cosas que solo un cuerpo humano puede
hacer bien. Como dar la mano.
Comentarios
Publicar un comentario
Por favor, deja tus comentarios aquí: