Trevor Burgess
Študoval som literatúru na univerzite v čase, keď semiotika a štrukturalizmus dominovali pri dekonštrukcii literárnych textov. V literárnom oddelení bola tendencia považovať jazyk za základný spôsob, akým chápeme svet. V najextrémnejšom prípade niektorí prednášajúci vyhlasovali, že svet je text, ktorý treba čítať.
Neurológovia nám teraz hovoria, že najmenej 40% aktivity nášho mozgu je spojené s videním. Maľujem obrazy a celý život sa venujem praktizovaniu, štúdiu a vyučovaniu kreslenia a maľovania. Z vlastnej skúsenosti viem, že časti môjho mozgu, ktoré spracovávajú jazyk, sa stávajú neaktívnymi alebo sa vypínajú, keď sa venujem maľovaniu. Ľudia, ktorí ma poznajú ako hovornú dušu, by mohli byť prekvapení, že keď vyjdem zo štúdia po dlhej maliarskej seanse, som trochu nemý a mám problém skladať slová dohromady.
Jedna z najvplyvnejších kníh o výučbe kreslenia vysvetľuje, prečo je to tak. Volá sa “Drawing on the right side of the brain” (Kreslenie na pravej strane mozgu) od Betty Edwards. Je založená na pochopení neurobiológie mozgu, ktorá nám hovorí, že pre väčšinu z nás sú verbálne, analytické a sekvenčné funkcie umiestnené najmä v ľavej hemisfére. Vizuálne, priestorové a percepčné funkcie sú hlavne umiestnené v pravej hemisfére. Kniha je plná praktických cvičení na kreslenie, ktoré sú navrhnuté tak, aby pomohli študentom vypnúť logickú ľavú stranu a zapnúť intuitívnu pravú stranu mozgu.
Čo to má spoločné s umelou inteligenciou – AI? Udivuje ma, že medzi všetkým tým obdivom, ako AI dokáže „generovať obrázky“ spôsobom, ktorý sa snaží napodobniť fungovanie neurónových sietí v našich mozgoch, sa len málo hovorí o tom, že dominantné modely, ktoré používa, sú založené na jazyku. Základné zručnosti, ktoré je potrebné naučiť sa na efektívne používanie väčšiny nástrojov na generovanie obrázkov AI, sú, ako písať verbálne, presné a sekvenčné príkazy – presne tie funkcie ľavej hemisféry, ktoré zasahujú do vizuálneho a priestorového vnímania pri učení sa kresliť a maľovať. Väčšina dominantných modelov je trénovaná na analýzu a spracovanie dát, nie na priestorové vnímanie. Zdá sa, že sú vizuálne trénované na rozpoznávanie vzorov. To súvisí s procesmi kreslenia a maľovania na 2D povrchu, ale nie je veľmi užitočné pri konštrukcii presvedčivého priestoru v rámci obrázka, a čiastočne to vysvetľuje, prečo AI dokáže zostaviť obrázky rozpoznateľnej budovy alebo krajiny, ak ich opíšete slovami, ale má problém previesť 2D plán do 3D vizualizácie.
Ako sa teda tí z nás, ktorí učia vizuálne umenie, ktoré zahŕňa fyzické vytváranie kresieb, malieb, sôch a remesiel, prispôsobia používaniu tohto nového nástroja? Hovorí sa, že nová technológia je rušivá. Musíme prispôsobiť naše aktivity pravej hemisféry, aby sme nasledovali spracovanie dát ľavej hemisféry strojov? Nevyhneme sa tomu, aby sme sa naučili, ako zadávať príkazy (prompty). Ale prinášajme do toho naše vlastné kreatívne rušenia pravej hemisféry.
Videl som na webe vtipný príklad niekoho, kto odporúčal najlepšie generátory obrázkov AI, ktorým ako príklad zadal prompt, aby oblak vyzeral ako pes. AI vytvorila oblak s tvárou psa akoby prilepenou na vrchu (ľavý obrázok). Zadávateľ potom zrejme prešiel cez celých 120 príkazov, aby oblak vyzeral postupne viac ako pes a bol očividne hrdý na výsledok. Výsledok? (pravý obrázok) Hmm… Oblak s trochu detailnejšou psou hlavou prilepenou na ňom. Ako veľmi sa snažím vidieť oblak ako psa, jednoducho v ňom nevidím formu psa: žiadne labky, chvost ani nohy. Vy ich vidíte?
To je myslenie ľavej hemisféry. Pokračovať, pokračovať, pokračovať postupne cez fázu za fázou smerom k požadovanému výsledku. Ak sa ma spýtate, po 120 príkazoch oblak vyzerá ešte menej ako pes: napríklad kúsok oblaku vpravo dole, ktorý ma prinútil myslieť si, že to bol psí chvost, sa odpojil. AI odrezala psí chvost! Čo tak trochu myslenia pravej hemisféry: urobiť z oblaku dažďový oblak? Vziať psa na prechádzku. Požiadať AI, aby oblak štekal alebo aby psí chvost vrátila späť? Neviem – čokoľvek, čo by prinieslo viac zvláštností a niečo nečakané.
Keď som hovoril s niektorými vizuálnymi umelcami, ktorí sa zaoberajú týmito novými nástrojmi, vzrušuje ich presne tá zvláštnosť a podivnosť toho, čo AI vytvára. Obávajú sa, že ako sa AI stáva čoraz presnejšou a kontrolovanejšou, stráca sa nepredvídateľnosť. Rétorika okolo AI je o tom, ako robiť veci rýchlejšie a efektívnejšie a samozrejme, môžeme to využiť. Ale ak uvažujeme o generovaní obrázkov z textu pomocou AI ako o kreatívnom nástroji, možno si vezmeme lekciu z knihy Betty Edwards a na chvíľu vypneme naše vizuálne tréningy a ciele orientované na výsledky. Budeme to brať hravo ako akýsi digitálne hyperaktívny kolážový proces, usporiadanie existujúcich materiálov zvláštnymi a úžasnými spôsobmi, spájanie psov a oblakov. Bavte sa!
I saw a hilarious example on the web of somebody recommending the best AI image generators who, as an example, had prompted the AI to make a cloud look like a dog. The AI produced a cloud with a dog’s face sort of stuck on the top of it (left image). The prompter then apparently went through a full 120 prompts to make the cloud look successively more like a dog and was clearly proud of the result. The result? (right image) Err… A cloud with a slightly more detailed dog’s head stuck on it. As much as I try to see the cloud as a dog, I just can’t see the form of a dog in it: no paws, tail or legs. Can you?
That is left-brain thinking. Keep on, keep on, keep on successively through stage after stage after stage towards a desired result. If you ask me, after 120 prompts the cloud looks even less like a dog: for example the bit of cloud at the bottom right that did make me think it could be the dog’s tail has got detached. The AI has cut the dog’s tail off! What about some right brain thinking: make the cloud a rain cloud? Take the dog for a walk. Ask the AI image prompt to make the cloud bark or put the dog’s tail back on? I don’t know – anything to throw up more weirdness and get something unexpected.
Talking to some visual artists who have engaged with these new tools, it is exactly the weirdness and strangeness of what AI throws up that excites them, and they worry that as it keeps getting more and more precise and controlled, the unpredictability is being lost. The rhetoric around AI is about doing things faster and more efficiently, and of course we can take advantage of that. But, if we are thinking about AI text to image generation as a creative tool, maybe we take a lesson from Betty Edwards’ book, and switch off both our visual training and our results-orientated goals for a moment and just think of it playfully as a sort of digitally hyper-active collaging process, arranging pre-existing materials in weird and wonderful ways, sticking dogs and clouds together. Have fun!