Prompty jako nová zaklínadla

Vztah racionálního poznání, imaginace a technologie

Moderní technologie si zpravidla spojujeme s vysoce exaktní vědou a nezastavitelným pokrokem. V nástupu umělé inteligence však lze spatřovat i návrat obraznosti a imaginace, která může v lecčems připomínat magické myšlení. Samoorganizování informací nás vrací k veskrze lidským touhám, které už se zdály zapomenuty.

Adobe Firefly: Prompty (generovaný obrázek)

V poslední době jsem četla několik pozoruhodných knih, z nichž každá se více či méně zjevným způsobem vztahovala k tématu technologie a umělé inteligence. Mediální teoretik Matteo Pasquinelli se v publikaci The Eye of the Master (Oko pána, 2023) oblastí AI zabývá explicitně: stěžejní tezí je, že techniky umělé inteligence jsou pokračováním dohledu, jaký má mistr na dílně, a celá oblast AI je ve znamení industriální dělby práce a její automatizace. Jakkoli je tato myšlenka v textu erudovaně zpracována, sama o sobě není příliš překvapivá. Podobně vyznívá i známá kniha Shoshany Zuboff Věk kapitalismu dohledu (2018, česky 2022). Mě zaujalo především autorovo znovuobjevení jednoho z mezníků vývoje technologie strojového učení, a sice setkání známého jako Hixon symposium, jež se konalo již v roce 1948, tedy poměrně dlouho před známým setkáním v Darthmouthu v létě 1956, kde byl poprvé použit termín „artificial intelligence“.

Sympozium se odehrálo na půdě Kalifornského technologického institutu (neboli Caltechu) a poměrně nečekaným způsobem spojilo dvě paradigmata. Na jedné straně to byla umělá inteligence „klasická“, tedy logická či symbolická, na straně druhé konekcionistická, pravděpodobnostní či induktivní, která získala nečekaného spojence – sympozia se totiž zúčastnilo několik zástupců gestalt psychologie (například Wolfgang Köhler, který vedl intenzivní debaty s Norbertem Wienerem, zakladatelem kybernetiky) a z tohoto setkání vznikla nová syntéza, jejímž výsledkem byla integrace principu samoorganizace, což můžeme zjednodušeně chápat jako počátek úspěšného tažení současných neuronových sítí, které spočívá ve schopnosti učit se a na základě analýzy pravděpodobnostního rozvržení navrhovat vlastní řešení. A to i bez konkrétních instrukcí, pouze na základě původního zadání. Jak píše Pasquinelli: „Hluboké neuronové sítě jsou technikou samoorganizace informace.“

 

Rozpoznávání vzorců

Tato schopnost má ve své „DNA“ techniku „pattern recognition“, tedy rozpoznávání vzorů či vzorců. Opět s jistou mírou zjednodušení můžeme říct, že všechny neuronové sítě od počátku pracují s „obrazy“ čili s vícedimenzionální distribucí kombinací. Tím stroje získaly klíčovou schopnost – odolnost či toleranci vůči chybám do té doby vlastní přirozeným systémům, ne automatům. Fyzickou podobu tato myšlenka získala s prvními Perceptrony. Perceptron, předchůdce současných hlubokých modelů, byl počátkem spontánního vyvstání informace jakožto výsledku adaptace na digitální prostředí.

Na konci čtyřicátých let 20. století tak došlo k něčemu, co bychom mohli nazvat kompromisním rozdělením kompetencí. Odpověď na otázku, zda je matematika jazykem přírody, od té doby zní: aritmetika je druhotný jazyk, kdežto pravděpodobnost (jako metoda toho, jak si „udělat obrázek o“) je primárním jazykem (kompletním kódem) mozku. Což rezonuje s Pasquinelliho popisem matematiky jako kulturní metody, která k vysoce abstraktní podobě dospěla postupným vývojem od rytmických rituálních praktik.

Pravděpodobnost, predikce a přizpůsobení se ve vývoji výpočetní technologie, především po vzniku internetu, projevuje stále výrazněji. Lev Manovich, další autor, který se dlouhodobě zabývá novými médii, píše v online knize Artificial Aesthetics (Umělá estetika, 2021–2024), že jsme od konce devadesátých let mohli pozorovat přechod od kategorické, hierarchické a strukturované organizace informací (příkladem jsou katalogy knihoven a dřívější webové adresáře) k vyhledávačům. Obsahu bylo tolik, že organizovat ho konvenčním způsobem již nebylo praktické a novým výchozím nastavením se stalo vyhledávání. To přitom funguje na základě předpovědi, co bude pro uživatele nejrelevantnější. Primární tedy není poskytnout přesnou a jednoznačnou odpověď. Generativní AI je také prediktivní. Režim absolutní jistoty (pravda versus lež) je tak nahrazen předpovědí. Statistika se stala základem věd 20. století a v posledních desetiletích je klíčová datová věda.

 

Návrat k obrazům

Další kniha se k tématu AI zdánlivě vůbec neváže. Jmenuje se Erós a magie období renesance (1992, česky 2023) a její autor, rumunský historik Ioan Petru Culianu, se v ní zabývá renesanční magií a jejím vztahem k současným systémům vědění. Jeho práce je do značné míry rehabilitací „magických“ praktik, které zde nejsou prezentovány jako snůška pověr a iluzí, ale jako ucelený model světa, v němž – na rozdíl od moderní vědy vznikající v té době v souvislosti s reformací a jejím obrazoborectvím – hrají důležitou roli obrazy a imaginace. To samozřejmě není jediný rozdíl mezi magickým a vědeckým poznáním, nicméně je zajímavé, jak se zde abstraktní racionální poznání dostává do sporu právě s myšlením obrazným. Téměř se zdá, že nejen obraz, ale také zmíněná „samoorganizace“ se po dlouhých staletích navracejí do dominantního modelu světa. Onen prvek samoorganizace, schopnosti učit se, adaptovat či proměňovat, totiž představuje element zapuzené přírody, která byla v období rozpadu renesančního rámce poznání světa se svou bujností, proměnlivostí, živočišností a nepřesností vyloučena z řádu poznání.

Ale zpět k obrazům. Nějaký typ „návratu k obrazům“ byl popsán již v průběhu 20. století v souvislosti s masovými médii, ale až s rozvojem generativních systémů (typu Midjourney, DALL­-E, Stable Diffusion a mnoha dalších) obrazy skutečně zaplavily mediální sféru a díky rychlému zpracování překladu mezi textovým promptem a výsledným obrazovým výstupem získaly masivní globální pozornost. Debata probíhá na úrovni technické či etické (jak a zda tyto nástroje využívat, přičemž není jisté, zda jde spíš o „prompt engineering“ nebo o „prompt magic“; jak se mají k lidským „vzorům“; jak eticky vyřešit otázku snadného napodobení uměleckého stylu; za jakých podmínek má být člověk a jeho dílo součástí datasetů využívaných pro trénování těchto systémů), ale i na hlubší úrovni, na níž si uvědomujeme, že vztah textu a obrazu se – opět – mění. To, že se práce s těmito nástroji podobá spíše „alchymii“ než vědě, je poměrně zřejmé. U každého zadání – neboli promptu – mícháme ingredience, abychom pak se zatajeným dechem pozorovali, jestli se proces podařil, a zároveň se přizpůsobujeme strojové logice.

Jedním z výrazných rysů generativních systémů je jejich „responzivnost“, která je zřejmě výraznější u textových generátorů, s nimiž lze komunikovat jako se skutečným, velmi inteligentním, i když občas trochu škodolibým člověkem (byť víme, že „artificial hallucinations“, tedy nesprávné informace suverénně vydávané za fakta, s nimiž vývojáři generativních systémů typu ChatGPT bojují, jsou výsledkem snahy splnit úkol a dát nám odpověď, která by se nám mohla líbit, nikoliv záměru klamat). Tyto nástroje se nám zdají být „živé“ a diskuse o tom, zda mohou získat vědomí, probíhá intenzivně na různých úrovních, od populární kultury po akademii. Intenzita, s níž se řeší možnost vzniku vědomí ve stroji, je přitom až zarážející a zdá se mi, že poukazuje na jakousi hlubší touhu. Touhu po čem?

 

Noví elementálové

Když se ještě vrátím k textu o renesanční magii, jeden z hlavních rozdílů oproti moderní vědě vidí autor v pojetí a prožívání světa. Zatímco renesanční svět byl možná trochu obskurní, ale živoucí, byl to organismus, responzivní makrokosmos, reagující jako živá bytost, kterou si můžete naklonit či rozzlobit, svět moderní vědy se zdá být prázdný. Přišli jsme o elementály, kteří se po další staletí budou skrývat v pohádkách – mýtech, které ztratily svou moc a staly se z nich povídačky. Není snad neustávající touha najít mimozemský život, fascinace živými stroji, ale třeba i důraz na takzvané non­-human agencies nebo využívání AI k luštění jazyka pavouků či velryb, výrazem ztráty živého vesmíru, který nám chybí? Jiným projevem této touhy, potřeby narativního výkladu života či propojování na základě podobnosti je dle mého názoru víra v konspirace, která typicky přitahuje lidi na periferii, což poutavě popisuje český religionista Jan A. Kozák.

Pokud je ale naše fascinace neživým, které by k nám mohlo promlouvat, nějakým typem zapomenuté touhy, co představuje stroj (či spíše Stroj)? Jak píše Culianu, zavržením imaginace coby nástroje poznání jsme ji přestali kultivovat, takže působí jako relikt, anachronismus, který je ale o to mocnější, že neprochází vědomou kontrolou. Jsou to právě emoční obsahy, s nimiž chtějí všichni pracovat a jež využívají k ovlivňování lidí reklamní mágové i političtí manipulátoři (zcela v souladu s naukou o poutech vrcholného představitele renesance Giordana Bruna). Stroj je něco, od čeho žádáme odpovědi na velké otázky. Něco, čeho se hrozíme a zároveň bez toho neumíme a nechceme být. Cosi svrchované, nelidské, předpovídající budoucnost, ale zároveň pevně spojené s člověkem – jen tentokrát je vztah modelu a obrazu převrácený. Co to je?

Autorka je filosofka a mediální teoretička.