IA NUAGES ET CHIENS

Trevor Burgess

J’ai étudié la littérature à l’université à une époque où la sémiotique et le structuralisme dominaient la déconstruction des textes littéraires. Dans le département de littérature, on avait tendance à considérer le langage comme le moyen fondamental de comprendre le monde. À l’extrême, certains professeurs affirmaient que le monde était un texte à lire.

Maintenant, les neurologues nous racontent qu’au moins 40% de l’activité cérébrale est en lien avec la vision. Je réalise des peintures et j’ai consacré toute ma vie à la pratique, à l’étude et à l’enseignement du dessin et de la peinture. Mon expérience m’a montré que certaines parties de mon cerveau qui traitent le langage se mettent en veille ou s’éteignent lorsque je suis absorbé par la peinture. Les personnes qui me connaissent comme quelqu’un de bavard pourraient être surprises de me voir un peu muet et avoir du mal à trouver mes mots lorsque je sors de mon atelier après une longue séance de peinture.

L’un des ouvrages les plus influents sur l’enseignement du dessin explique pourquoi il en est ainsi. Il s’agit de “Drawing on the right side of the brain de Betty Edwards. Il s’appuie sur la neurobiologie du cerveau, qui nous apprend que, chez la plupart d’entre nous, les fonctions verbales, analytiques et séquentielles sont principalement situées dans l’hémisphère gauche, et les fonctions visuelles, spatiales et perceptives dans l’hémisphère droit. Le livre contient de nombreux exercices pratiques de dessin destinés à aider les apprenants à désactiver le côté logique gauche et à activer le côté intuitif droit du cerveau.

Quel est le rapport avec l’IA ? J’ai été frappé par le fait que, malgré l’émerveillement sur la façon dont l’IA peut « générer des images » en imitant le fonctionnement des réseaux neuronaux de notre cerveau, peu de commentaires ont été faits sur le fait que les modèles dominants qu’elle utilise sont basés sur le langage. Les compétences fondamentales qui doivent être apprises pour utiliser efficacement la plupart des outils de génération d’images par IA sont comment rédiger des instructions verbales, précises et séquentielles, soit précisément les fonctions du cerveau gauche qui interfèrent avec la perception visuelle et spatiale dans l’apprentissage du dessin et de la peinture. Il y a d’autres modèles « controlNet » pour convertir des croquis en images et des poses en images, comme Scribble ou « Realtime canvas » de Leonardo, qui ne sont pas basés sur des consignes textuelles, mais les modèles dominants ne sont pas entraînés à la perception spatiale. Ils semblent être entraînés à reconnaître des formes. Cela rejoint les processus de dessin et de peinture liés à la surface en 2D, mais ce n’est pas très utile pour construire un espace convaincant au sein d’une image. Cela explique en partie pourquoi l’IA peut assembler des images d’un bâtiment ou d’un paysage reconnaissable si vous le décrivez avec des mots, mais qu’elle a du mal à convertir un plan en 2D en une visualisation en 3D.

Alors, comment nous, qui enseignons les compétences artistiques nécessaires à la production physique du dessin, de la peinture, de la sculpture et de l’artisanat, pouvons-nous nous adapter à l’utilisation de ce nouvel outil ? On dit que les nouvelles technologies sont disruptives. Devons-nous adapter nos activités du cerveau droit pour suivre le traitement des données du cerveau gauche des machines ? Il est inévitable d’apprendre à donner des consignes. Mais apportons-y nos propres perturbations créatives issues du cerveau droit.

Nuage ressemblant à un chien. G : 1ère itération. D : après 120 suggestions.

J’ai vu un exemple hilarant sur Internet de quelqu’un recommandant les meilleurs IA génératrices d’images qui, en tant qu’exemple, a donné pour consigne de créer un nuage ressemblant à un chien. L’IA a produit un nuage avec une sorte de visage de chien collé au-dessus (image de gauche). Le prompteur a ensuite apparemment parcouru120 précisions pour que le nuage ressemble de plus en plus à un chien, et était visiblement fier du résultat. Le résultat ? (image de droite) Ehh… Un nuage avec une tête de chien un peu plus détaillée collée sur dessus. J’ai beau essayer de voir le nuage comme un chien, je n’arrive pas à distinguer la forme d’un chien : il n’a ni pattes, ni queue, ni jambes. Et vous ?

C’est le raisonnement du cerveau gauche. Continuez, continuez, continuez sans relâche, étape après étape, vers le résultat souhaité. Si vous demandez mon avis, après 120 précisions, le nuage ressemble encore moins à un chien : par exemple, le petit bout de nuage en bas à droite me faisait penser que la queue du chien avait été détachée. L’IA a coupé la queue du chien ! Et si on faisait appel à notre cerveau droit : faire du nuage un nuage de pluie ? Emmener le chien en promenade. Demandez à l’IA de modifier l’image pour que le nuage aboie ou que la queue du chien réapparaisse ? Je ne sais pas, n’importe quoi pour rendre l’image encore plus bizarre et obtenir quelque chose d’inattendu.

En discutant avec certains artistes visuels qui ont utilisé ces nouveaux outils, c’est précisément l’étrangeté et la singularité de ce que produit l’IA qui les passionnent, et ils craignent qu’à mesure qu’elle devient de plus en plus précise et contrôlée, elle perde son caractère imprévisible. Le discours autour de l’IA porte sur la rapidité et l’efficacité, et nous pouvons bien sûr en tirer parti. Mais si on considère la génération de texte en image par l’IA comme un outil créatif, on peut peut-être s’inspirer du livre de Betty Edwards et mettre de côté notre formation visuelle et nos objectifs axés sur les résultats pendant un moment pour voir ça comme un processus de collage hyperactif, où on arrange des éléments existants de manière bizarre et merveilleuse, en collant des chiens et des nuages ensemble. Amusez-vous bien !

_TAGS

_PARTENAIRES