Trevor Burgess
Estudié Literatura en la Universidad en una época en la que la semiótica y el estructuralismo dominaban la deconstrucción de los textos literarios. En un departamento de literatura existía la tendencia a pensar en el lenguaje como la forma fundamental de entender el mundo. En su punto más extremo, algunos profesores declaraban que el mundo es un texto que hay que leer.
Ahora, los neurólogos nos dicen que al menos el 40% de la actividad de nuestro cerebro está relacionada con la visión. Yo pinto y he practicado, estudiado y enseñado dibujo y pintura toda mi vida. Según mi experiencia, las partes de mi cerebro que procesan el lenguaje se adormecen o desconectan cuando me dedico a pintar. Quienes me conocen como un alma parlanchina quizá se sorprendan de que cuando salgo del estudio después de una larga sesión de pintura me quede un poco mudo y me cueste articular palabra.
Uno de los libros más influyentes sobre la enseñanza del dibujo explica por qué es así. Se titula
“Drawing on the right side of the brain” de Betty Edwards. Se basa en el conocimiento de la neurobiología del cerebro, que nos dice que, para la mayoría de nosotros, las funciones verbales, analíticas y secuenciales se localizan principalmente en el hemisferio izquierdo; y las funciones visuales, espaciales y perceptivas se localizan principalmente en el hemisferio derecho. El libro está lleno de ejercicios prácticos de dibujo diseñados para ayudar a los alumnos a apagar el lado izquierdo lógico y encender el lado derecho intuitivo del cerebro.
¿Qué tiene esto que ver con la inteligencia artificial? Me ha sorprendido que, entre tanta maravilla sobre cómo la IA puede «generar imágenes» de un modo que intenta imitar el funcionamiento de las redes neuronales de nuestro cerebro, apenas se haya comentado el hecho de que los modelos dominantes que utiliza se basan en el lenguaje. Las habilidades fundamentales que hay que aprender para utilizar con eficacia la mayoría de las herramientas de generación de imágenes de IA son cómo escribir instrucciones verbales, precisas y secuenciales, precisamente las funciones del hemisferio izquierdo del cerebro que interfieren con la percepción visual y espacial al aprender a dibujar y pintar. Existen modelos alternativos de «controlNet» de dibujo a imagen y de pose a imagen, como Scribble o el «Realtime Canvas» de Leonardo, que no se basan en instrucciones de texto, pero los modelos dominantes no están entrenados en la percepción espacial. Para lo que sí parecen estar entrenados visualmente es para el reconocimiento de patrones. Esto conecta con los procesos de dibujo y pintura relacionados con la superficie bidimensional, pero no es muy útil para construir un espacio convincente dentro de una imagen, y explica en parte por qué la IA puede componer imágenes de un edificio o un paisaje reconocibles si se describen con palabras, pero le resulta difícil convertir un plano 2D en una visualización 3D.
Entonces, ¿cómo nos adaptamos al uso de esta nueva herramienta los que enseñamos las habilidades de las artes visuales que intervienen en la producción física del dibujo, la pintura, la escultura y la artesanía? Dicen que la nueva tecnología es disruptiva. ¿Tenemos que adaptar nuestras actividades del hemisferio derecho para seguir el procesamiento de datos del hemisferio izquierdo de las máquinas? No hay que evitar aprender a avisar. Pero aportemos a ello nuestras propias disrupciones creativas del hemisferio derecho.
Vi un ejemplo divertidísimo en Internet de alguien que recomendaba los mejores generadores de imágenes de inteligencia artificial y que, como ejemplo, había pedido a la IA que hiciera que una nube pareciera un perro. La IA produjo una nube con la cara de un perro pegada en la parte superior (imagen de la izquierda). Al parecer, el prompter dio 120 instrucciones para que la nube se pareciera cada vez más a un perro y se mostró orgulloso del resultado. ¿El resultado? (imagen de la derecha) Err… Una nube con una cabeza de perro ligeramente más detallada pegada a ella. Por mucho que intento ver la nube como un perro, no consigo ver en ella la forma de un perro: sin patas, cola ni piernas. ¿Y tú?
Eso es pensamiento cerebral izquierdo. Seguir, seguir, seguir sucesivamente etapa tras etapa hacia un resultado deseado. En mi opinión, después de 120 indicaciones, la nube se parece aún menos a un perro: por ejemplo, el trozo de nube de la parte inferior derecha que me hizo pensar que podría ser la cola del perro se ha desprendido. La IA le ha cortado la cola al perro. ¿Qué tal si pensamos con el cerebro derecho: que la nube sea una nube de lluvia? Saca al perro a pasear. ¿Pedirle a la IA que haga ladrar a la nube o que vuelva a ponerle la cola al perro? No sé, lo que sea para que surja algo más extraño e inesperado.
Hablando con algunos artistas visuales que han trabajado con estas nuevas herramientas, lo que les emociona es precisamente la rareza y lo extraño de lo que ofrece la IA, y les preocupa que, a medida que se hace más precisa y controlada, se pierda la imprevisibilidad. La retórica en torno a la IA trata de hacer las cosas de forma más rápida y eficiente, y por supuesto que podemos aprovecharnos de ello. Pero, si pensamos en la generación de textos e imágenes con IA como herramienta creativa, quizá deberíamos aprender del libro de Betty Edwards, desconectar por un momento nuestra formación visual y nuestros objetivos orientados a los resultados, y considerarla de forma lúdica como una especie de collage digital hiperactivo, organizando materiales preexistentes de formas extrañas y maravillosas, pegando perros y nubes. Diviértanse.