Una imagen vacía

Un par de días atrás fui a ver La Princesa Mononoke al cine. Hace años que no la veía y fui porque estaban dando una versión mejorada en audio e imagen. Esos días recordaba que la vi por primera vez en mi adolescencia, cuando mi familia tenía un videoclub y yo veía y descargaba anime que luego intercambiaba con mis amigos. Me encantó volver a verla y conectarme con esos años cuando descubrí la animación, mi gusto por la ilustración, y las artes gráficas en general. Diría que en esos años fue cuando empecé a mirar el dibujo, y el diseño posteriormente, como algo que podía hacer para toda la vida.

Algo que me gusta mucho de las películas de estudio Ghibli es la banda sonora. De vez en cuando escucho uno que otro disco de Joe Hisaishi o alguna interpretacion en piano de las canciones principales. Este concierto que dio un par de años atrás celebrando los 25 años como compositor es muy conmovedor.

También fui a ver la película por todo el ruido que se estaba dando esos días en las redes sociales con el nuevo modelo de OpenAI y la capacidad de generar imágenes con el estilo del estudio de animación. Quería volver a sentir qué era lo que me gustaba tanto de las películas de Miyazaki. Con todo el flujo de imágenes al estilo Ghibli, le estaba dando hartas vueltas a la relación que hay entre arte y tecnología, y el impacto que tiene en la percepción de las personas la facilidad de generar instantáneamente ilustraciones de alta calidad.

La película por supuesto era mejor de lo que la recordaba. La idea del bien y el mal es central en la historia y esta tiene muchas lecturas sobre cómo la naturaleza y los seres humanos podemos ser crueles y bondadosos al mismo tiempo. La banda sonora es preciosa, y como era de esperar, todas las escenas están milimétricamente editadas para construir momentos dramáticos de realismo mágico. No hay nada dejado al azar.

En el estilo particular que tiene el estudio, donde el grueso de la animación está hecho a mano, sacar un recuadro del contexto de la historia y presentarlo como algo atractivo por sí solo, lo vacía de todo significado. La imagen es solo un instante de una escena que queda retratado con un estilo de ilustración determinado. Y por desgracia, ese es el único valor agregado de esta herramienta generativa. Tomar una fotografía y aplicarle un filtro “estilo anime”. Nada más ni nada menos.

Comunicar una idea a través de una imagen requiere pensar una forma y luego ejecutarla, para luego volver a pensarla, y luego volver a ejecutarla. Y extender ese ejercicio en el tiempo hasta que la imagen tome la fuerza suficiente para darse a entender por sí sola. Es tanta la energía que se deposita en el proceso, que De vuelta con el cuaderno le dedica una jornada de varios días a pensar y sumergirse en las infinitas posibilidades que permite un cuaderno.

Una herramienta automática que toma una fotografía y redibuja los elementos bajo un estilo determinado es una imagen totalmente vaciada de significado. ¿Por qué dedicarle tiempo, y muchísima energía, a construir una herramienta que solo logra imitar un estilo de manera superficial? Y por cierto ¿por qué todas tienen ese tono cafe anaranjado?

Pero al mismo tiempo, también exageran los que culpan a quienes usan estas herramientas y las acusan de cometer un insulto. Estudio Ghibli no es dueño de un estilo de ilustración, pese a volverse el icono más reconocible de la animación japonesa. Si quiero ver una foto de mi familia convertida en un anime, no veo nada ofensivo en aplicarle un filtro de imagen. Y tengo la sensación de que el grueso de la gente solo quiere tener una imagen bonita para el perfil de WhatsApp, no comenzar un negocio lucrativo de venta de imágenes. Aunque seguro hay uno que otro tontito haciéndolo.

Ofensivo es como OpenAI entrena y usa sus modelos, pero eso es otro tema.

Tampoco creo que Miyazaki exagera cuando años atrás, antes del boom de la inteligencia artificial, le dijo a unos estudiantes que la prueba que habían hecho con un modelo generativo era un “insulto a la vida”. Los chicos le estaban vendiendo optimización a un estudio de animación que se toma año y medio en producir una escena de 4 segundos. Producir más en menos tiempo no es precisamente lo que Miyazaki buscaba.

Acá abajo se puede ver el momento completo cuando Miyazaki se indigna de lo que está viendo. Audio en japonés y subtítulos en inglés.

De esa misma grabación, creo que hay una parte anterior a la frase célebre que es mucho mas reveladora y que apela a la idea de una imagen con significado. Cito el texto con una traducción personal.

Todas las mañanas… no estos últimos días pero, visito a mi amigo que tiene una discapacidad. Es muy dificil para él hacer un simple choque de manos. Su brazo rígido alcanzando mi mano. Ahora, y pensando en él, no puedo ver esto y encontrarlo interesante. Quiensea que haya creado esto, no tiene idea de lo que es el dolor. Estoy profundamente disgustado. Si realmente quieren hacer cosas espeluznantes, vayan y háganlo. No espero nunca incorporar esta tecnología en mi trabajo. Creo fuertemente que esto es un insulto a la vida misma.

Para retratar el sufrimiento, hay que estar cerca del sufrimiento.

Generar imágenes a lo estudio Ghibli no creo que sea el fin la humanidad. El boom afortunadamente ya pasó y quedó en el archivo de las tendencias en redes sociales. Pero sí que es triste ver una tecnología deshumanizante que reduce la expresión humana a un simple gesto de producción eficaz.