Lorem ipsum dolor

Výzvy AI: Dobrý aparát Švejk

22. 1. 2025Barbora TrnkováEsej

S větším odstupem publikujeme pro úplnost poslední text spadající do série Výzvy AI, kterou sestavil pro Artalk Palo Fabuš, a která vycházela v průběhu podzimu. Tato rozsáhlejší esej od Barbory Tnkové se věnuje AI ve vztahu k umění, konkrétně její omezené striktní pragmatičnosti, predikování budoucnosti či podporování společenských stereotypů a neinkluzivitě.

Vztah umění a technologie nazývané umělá inteligence (AI) je pro mne jako fotografku zásadní téma. K médiu fotografie totiž přistupuji s přesvědčením, že výsledný obraz nezobrazuje objektivní realitu, ale spíše odráží perspektivu – určitou interpretaci světa, z níž byly vytvořeny (foto)aparáty, jimiž byl daný obraz pořízen. 

Dominantní perspektivu, právě proto, že je převládající, je velmi obtížné zaměřit, reflektovat a přehodnocovat její problematické aspekty. Avšak právě v široce implementovaných výstupech technologie AI se obnažuje.[1] Tento moment je klíčový, protože znamená významnou příležitost k její reflexi. 

V následujícím textu nejprve představím zjevnější slabá místa AI, které na ni poukazují, jako jsou technologický pragmatismus, rezignace na smysl a předpojatosti. Abych však naznačila rozsah jejího vlivu na naši realitu, navážu popisem hlubších mechanismů konstruovanosti samotného vidění. Na závěr vysvětlím, co má AI společného se Švejkem a nabídnu vlastní fotografickou strategii, ve které zkoumám, jak si nenechat utéct křehkou příležitost tuto určující a často přežitou perspektivu konfrontovat.

You press the button and We do the rest II, (z výstavy Barbora Trn a Lucia Bergamaschi: Garden of Internalized Gaze), Galerie města Třince, 2023, foto: Barbora Trnková.

Každý přece tak nějak ví, co je to umění

Tuto perspektivu jsem začala odkrývat ve svém uměleckém zkoumání, když jsem se ptala na otázku, v jakém smyslu můžeme AI chápat jako příležitost pro rozvoj v oblasti kreativity a umění. V rámci výzkumu jsem se podílela na výstavě AI All Idiots (katalog zde) v pražské MeetFactory, kde jsme kriticky představovali AI v souvislosti s uměním prostřednictvím experimentu – vytvořením vlastní generativní AI sítě naučené generovat obrazové výstupy na základě obrazových materiálů od zástupců a zástupkyň české umělecké scény zveřejněných na internetu. Ukázali jsme škálu témat a problémů, které s touto technologií, kreativitou a uměním souvisí, a které mimo jiné onu zmíněnou dominantní perspektivu obnažují. V této souvislosti bych ráda poukázala na konkrétní dva problémy. Jednak technologicky podmíněnou redukci složitosti a také akceleraci zkreslení a biasů.

AI: All Idiots App, ScreenSaverGallery, Tomáš Javůrek, syntetická fotodokumentace: Barbora Trnková, 2023.

První problém se týká skutečnosti, že již na úrovni sběru dat pro dataset, na kterém se AI učí, dochází k vytržení komplexních otázek z kontextu komplexního světa, k jejich redukci a přizpůsobení se matematickému modelu. Například na principiálně nesnadno zodpověditelnou otázku, co je to umění, se v duchu technologického pragmatismu odpoví jednoduše tím, co je po ruce a dá se prakticky a snadno použít pro tvorbu datasetu.[2] Po ruce mají vývojáři to, co je dostupné, k čemu se mohou snadno a rychle dostat. Jde o materiály, které již za nějakým jiným účelem byly digitalizovány a nasbírány – jako jsou například databáze dokumentací uměleckých děl vzniklé za různorodými účely, které si vytvářejí galerijní a muzejní instituce, nebo i data ze sociálních sítí, nashromážděná bez našeho vědomí. Databáze, na nichž se AI učí, tedy nutně obsahují zkreslená data a neodpovídají komplexním úkolům, které pak má naučený program umět vykonávat.

Následně je tato komplexní a v principu nezodpověditelná otázka (co je to umění?) delegována na skupinu lidí, kteří dataset vytvoří přiřazením významu k danému obrazovému materiálu na základě předpokladu, že každý přece tak nějak ví, co je to umění. Případně se vývojáři spoléhají na to, že se atribuce významu v množství dat už nějak srovná, protože zkrátka předpokládají, že kvalitu odpovědi na komplexní otázky lze kompenzovat kvantitou vstupních dat a prediktivními výpočty. Jak poznamenává Kate Crawford, výzkumnice v oblasti dopadů AI a autorka knihy Atlas of AI: Power, Politics and The Planetary Costs of Artificial Intelligence, vývojářům stačí, že počítačové programy nás nemusí chápat – stačí, že se nás naučily předvídat.[3] Tím se IT podnikatelé snaží vyhnout odpovědnosti za tyto zjevné procesní nedostatky datasetů, které jsou zavádějící a nabité kulturně a historicky podmíněnými narativy. 

Jak vidíme, metodologie odpovídání na komplexní otázky je v případě technologie AI téměř nahodilá, vedená převážně co nejpraktičtějšími inženýrskými řešeními. Jako společnost jdeme přitažlivé vizi umělé inteligence naproti a vše kolem, včetně sebe samých, přizpůsobujeme výpočetnímu a technologickému pragmatismu. Je až úsměvné pozorovat, jak velkoryse nabízíme kompresi složitosti světa na spontánně digitalizované podklady, ochotně podstupujeme redukci dimenzionality, vytrhávání pojmů, jejich trivializaci a v neposlední řadě rozpuštění souvislostí, které jsou vždy nutné ke správnému chápání smyslu. To vše jen s vidinou konstrukce programu s určitými vlastnostmi výkonné inteligence, zabaleného do termínů spojených s tvorbou kouzel, přání, efektivity a snů. 

Antropomorfizujeme si AI, aby se nám s ní lépe empatizovalo a vytváříme si záminky v podobě často nadbytečných služeb a implementací (text-to-image generátory, filtry, chatovací aplikace, AI friends apod.), jež sytí naši zvědavost komunikovat s touto vzrušující entitou, která tím nabývá techno-sociálních rozměrů. A kromě jiného dosud patří mezi slepá místa obrovská environmentální zátěž spojená s trénováním a provozem AI, a o jejímž skutečném rozměru se můžeme jen dohadovat, protože zatím máme k dispozici jen několik málo analýz.  

The Look of Internalized Machine Gaze, syntetická fotografie (MJ), 2022, foto: Barbora Trnková.

Není jedno, jak se konstruuje vidění

Vedle rezignace na složitost a zmiňované ekologické zátěže, dochází také k akceleraci reprodukce předpokladů, které skrze technologii AI operují.[4] Zastaralé a často škodlivé narativy se tak prostřednictvím AI znovu vpisují do našeho sociokulturního prostředí, nadále strukturují naše životy a brzdí potřebné změny. Moment nenápadné akcelerace zkreslení v současných technologiích s AI mi připadá podstatný právě pro oblast výtvarného umění, protože souvisí s konstrukcí způsobu, jakým vidíme a tedy i s pozicí, z níž tvoříme. Tyto deformance máme tendenci přehlížet, protože se jeví jako dané. Podle Crawford patří AI mezi nástroje vidění, které jsou ve skutečnosti konstruovanými nástroji interpretace světa. Tato konstruovanost, která předkládá určitou interpretaci světa, nám ale není zjevná, a naopak tak vidění působí jako přirozené, dané.[5]

Obdobně jako například vynálezy perspektivy nebo fotografie, které také zásadně určily, jak dnes vidíme svět i sebe sama, aniž bychom tyto skutečnosti rozporovali jako vyumělkované.[6] 

Jak moc je vidění konstruované a jak výrazný vliv na přirozené vnímání skutečně má, jsem si uvědomila před lety v Edinburghu. Po hodinách prohlížení rozměrných pláten barokních krajinomaleb v tamní galerii jsem byla překvapena náhlou neschopností vidět odlišný způsob, kterým se vrství listy a láme světlo v korunách stromů venku v parku.

Je to dáno také tím, že vidění a vnímání je přirozeně procesem redukce. Mozek se od narození svého nositele postupně vyvíjí a učí se rozlišovat mezi velkým množstvím podnětů, přičemž upřednostňuje ty, které jsou nějak užitečné pro přežití a pro úspěšné fungování v prostředí a kultuře, ve které daný jedinec žije. Tento proces usnadňují vzorce, které byly postupně zdokonalovány po tisíce let. Je také ovlivňován kulturně, historicky a technologicky podmíněnými narativy, které mohou být již překonané – a tím pádem škodlivé.

Vidění je tedy reduktivní, determinovaná a konstruovaná schopnost, která spoluvytváří prostor, ve kterém žijeme a tvoříme, a je také zásadní pro východiska tvorby vizí naší budoucnosti. Jakkoliv se redukci složitosti a konstruovanosti vidění nelze vyhnout, není jedno s jakými technologiemi a narativy k tomu dochází. Do narativů, které ovlivňují vidění, jsou vepsány etické, politické a kulturní pozice. A právě způsob konstrukce určitých technologií tyto pozice prozrazuje.

You press the button and We do the rest I, 2022, s. f. (MJ), foto: Barbora Trnková.

Teoretik médií Alexander Galloway v textu Are Some Things Unrepresentable tvrdí, že až pomocí nástrojů získávají data formu, jsou (in)formována, tedy vložena do určité formy. Tyto nástroje interpretace však Galloway nevnímá jako nahodilé, ale naopak jako vytvořené z určitých pozic. Například jiné informace o subjektu nabídne lékařka a jiné básnířka (každá reprezentuje jiný set východisek, mají rozdílné cíle), přičemž obě použijí odlišné nástroje (zkonstruované na základě daných cílů). Ve výsledku nejsme tedy informováni o datech – skutečnostech, nýbrž daleko více o nástrojích určených k jejich interpretaci, přičemž tyto nástroje zase prozrazují pozici, z níž byly vytvořeny. Skrytě tedy dochází k reprodukci těchto často zamlčených pozic a jejich východisek. 

Galloway dále upozorňuje, že pokud vytváříme nástroje stále ze stejných pozic, vzniká mnoho variant téhož, a neobjevuje se tedy nic v zásadě originálního, byť to tak může vypadat. Z tohoto úhlu pohledu AI není kreativní, nevytváří nové-neodvozené podněty, ale jen nově-neokoukaně reprodukuje stará východiska, která ale reprodukuje tak efektivně a přímočaře, se zmíněnou reduktivitou, že to již nelze přehlížet – a mluvíme o nich právě jako o předpojatostech, tedy biasech. Například v narativech naší kultury, kde je bohužel stále přítomný rasismus, se prostřednictvím AI explicitně zviditelňuje ve chvíli, kdy k pojmu zloděj opakovaně přiřadí lidi tmavé pleti. Obdobných příkladů existuje celá řada.

AI jako švejkovské zrcadlo společnosti

AI je jazykový model, neučí se na základě reality, ale prostřednictvím jazykové reality člověka, která zmíněné kulturní narativy obsahuje a odráží. Tuto jazykovou realitu AI abstrahuje a může v ní nalézat i ty vzorce a souvislosti, které nám jsou nedostupné. Může poskytnout podrobnější informace o provázanosti mezi pozicemi a jejich perspektivami, které by nám mohly být užitečné k jejich reflexi a případné dekonstrukci. V tomto kontextu lze AI nahlížet jako kreativní, protože může obnažovat souvislosti a vzorce, které jsou pro nás zatím neznámé a poskytují nám nové informace.

Agenda AI se tak ve výsledku podobá Haškově postavě dobrého vojáka Švejka. AI i Švejk neúprosně, téměř nelidsky a často groteskně důsledně plní zadané úkoly, čímž efektivně exponují jejich nesmyslnost a systém předpokladů a narativů, které k nim vedly. AI je v podstatě Švejkovským zrcadlem absurdit a archaismů, jež přetrvávají v naší společnosti.

Vyvolat vlastní pozici proti generované představivosti 

V původu narativů, které se propisují do AI, stojí určující perspektiva vedená z dominantní, podle Rosi Braidotti lidské – apriori mužské, subjektivity.[7] Promptovat tedy znamená s efektivitou a přesností gravitační přitažlivosti vytahovat na světlo zprůměrovaný výsledek predikce vyplývající z převládající představivosti této dominantní subjektivity.[8] Avšak reflektovat a konfrontovat škodlivé aspekty těchto východisek a začít tvořit něco jiného, alternativního, není snadné také proto, že tato subjektivita komplexním způsobem operuje rovněž v nás, na internalizované úrovni. 

V současném umění jsou rozšířeny spekulativní strategie, které často spočívají ve vytváření alternativních narativů k těm vyplývajícím z dominantní perspektivy, čímž tuto perspektivu zpochybňují jako jedinou platnou a následně ji oslabují. Avšak tyto alternativní pohledy nemusíme vytvářet jen spekulativně, protože již existují mezi námi, jen nejsou dostatečně vidět a slyšet (což je pro jejich nositele bolestivá, nespravedlivá a traumatizující skutečnost, která výrazně negativně ovlivňuje jejich životy). Jde o představitele a představitelky perspektiv, které nejrůznějším způsobem nezapadají do normativního kánonu určeného zmíněným subjektem, nebo se staly jeho oběťmi. Může jít o neurodivergentní lidi, lidi s odlišnou sexuální orientací, ty, kterých se týká sociální vyloučení, různým způsobem znevýhodněné, traumatizované apod.

Text to Image generator, mob. aplikace (z výstavy Tváře vystupují z virtuální oblohy v galerii sam83), 2023, s. foto: Barbora Trnková.

Přizvat do diskuse nositele a nositelky odlišných perspektiv není nikterak jednoduché. Abychom mohli jejich perspektivu, z dominantní pozice označenou za jinou, skutečně vnímat, měli bychom jim umožnit vstoupit do našeho horizontu za jejich vlastních podmínek. To je velmi podstatné, protože jinak bychom znovu uplatňovali hierarchizovanou moc subjektu nad objektem, interpretovali je, a riskovali tak často hrubé dezinterpretace.

Inspirativní způsob, jak vyjít jinému naproti nacházím v termínu stávání se jiným od Gilla Deleuzeho a Félixe Guattariho. Stávání se jiným obnáší sérii postupných proměn, mezi kterými nelze přeskakovat – což je velmi důležité. Například dříve, než se člověk může začít stávat zvířetem, je třeba stávat se ženou. Přiblížit se jinému znamená proměnit se v nám nejbližší jiné, přičemž toto jiné nám může být blíž, než si myslíme, jelikož je už stejně většinou součástí nás samotných. Tuto součást lze v sobě aktivovat například glitch feministicky. Glitch feministický přístup navrhuje pozitivní převrácení původně negativně vnímané odchylky od normativu. 

Prostřednictvím emancipace toho, co se převládajícímu kánonu v rámci našich životních zkušeností vymyká a spadá tak do zóny nepatřičnosti, nerozlišenosti a tabu, předkládáme silné svědectví z jiné perspektivy, které dominantní subjektivitu a její narativy usvědčuje.

Your Addiction is The Message, syntetická fotografie (MJ), foto: Barbora Trnková, 2022.

Problematika AI a umění mne tedy jako fotografku vede k podněcování vyvíjení individuálních a osobních nástrojů, jak aktivovat (vyvolat) svědectví (fotografie) zapsané (exponované) do našich těl zkušenostmi, které se nacházejí v neviditelné zóně, protože se vymykají narativům vytvořeným z dominantní subjektivity. 

Efektivní a důsledná AI, podobně jako dobromyslný voják Švejk, může být vnímána jako zrcadlo naší společnosti, které mechanicky neúprosně odhaluje absurdity, mocenské vzorce a předsudky zakořeněné v kulturně a historicky podmíněných narativech, jež jsou vytvářeny z převládající perspektivy. AI tuto perspektivu akceleruje, čímž její obsah exponuje a upozorňuje na způsob, jakým tvarovaly v minulosti – a dodnes tvarují naši realitu. Avšak jejich rozlišení a konfrontování vyžaduje vyvolání vidění z vlastní subjektivity a z ní pramenící perspektivy. Až tento proces v souvislosti s AI lze považovat za umožňující vznik něčeho v zásadě nového, poskytujícího čerstvé základy pro rozvoj inkluzivnější – bohatší představivosti.



[1] Mezi druhy výstupů technologie AI, o kterých zde mluvím, patří zejména textové, obrazové, zvukové, video syntetizátory, ale v mnoha případech také diagnostické výstupy, prediktivní, simulační modely, vizualizace dat, doporučovací modely, virtuální asistenti, atd. a jejich kombinované formy, které se postupně implementují do mnoha různých odvětví lidské činnosti. Takto se stávají významným faktorem ve struktuře naší společnosti.

[2] Dataset je kolekce určitých dat, na nichž je algoritmus AI trénovaný.

[3] Generative Machines and Ground Truth, Prof. Kate Crawford. Online. 2023. Dostupné z: https://www.youtube.com/watch?v=tDjuq6Wxj3s. [cit. 2025-01-17]. 21. min.

[4] Tyto předpoklady v AI operují v režimu takzvaných metaprogramů. Podle filozofa Viléma Flussera jsou aparáty, mezi které lze zařadit také AI, komplexními black boxy, do jejichž vnitřních procesů nevidíme, ale kombinujeme symboly obsažené v jeho programu, přičemž tento program jim byl dodán právě metaprogramem.

[5] Nemáme tendenci vidění vnímat jako vykonstruované, a tedy jakkoliv rozporovat způsob, jakým nahlíží na svět.

[6] Kromě toho, že fotografie zviditelnila minulost, umožnila všímat si prchavosti a dynamiky, přinesla také možnost zachytit předměty s vysokou přesností, což vytvořilo nové standardy toho, co považujeme za pravdivé a objektivní. Avšak fotografický snímek nemůže zachytit kontext, emoce nebo procesy, které vedly k danému okamžiku. Hledáčkem z reality vyřezáváme jen tu část, která se nám líbí, nebo hodí. Fotografie realitu tedy zprostředkovává zavádějícím způsobem, nepravdivě, nebo minimálně velmi zjednodušeně. Ale právě proto, že máme fotografii spojenou s přesností až na důkazné úrovni, jen zřídkakdy máme tendenci její pravdivost rozporovat a fotografický obraz se tedy mylně jeví jako zachycující realitu. Nehledě na to, že snadno umožňuje vyvolat silné emoce a je tedy běžným nástrojem manipulace v rámci propagandy, či reklamy. Selfie kultura je vrcholem přirozené tendence fotografie objektifikovat a estetizovat vše, co se jí dostane do hledáčku. Ve spojení s možností deformace úpravami nastoluje fenomény jako například Snapchat dysmorfie – onemocnění sebepojetí, které jedince vede podstupovat chirurgické zákroky, aby se podobaly svému filtry dotvořenému digitálnímu já.

[7] Filozofka Rosie Braidotti ukazuje, jak koncept „člověka“ slouží jako norma, která vylučuje vše, co je považováno za ne-lidské nebo pod-lidské (zvířata, ženy, kolonizované národy). Tato kategorie je podle ní spojená s ideálem bílého, mužského, západního subjektu.

[8] Promptovat (z anglického slova prompt – výzva) je proces, kdy uživatel zadává vstupní text nebo instrukci do AI programu, aby získal odpověď, nebo výstup.

Barbora Trnková | Barbora Trnková (*1984) vystudovala v Ateliéru tělového designu na Fakultě Výtvarných umění při VUT v Brně. V současné době zde dokončuje doktorské studium. Její aktivity vyplývají ze zájmu o fotografii také v rozšířené podobě na současné technologie. Jako umělkyně tvoří nejčastěji v dvojici s Tomášem Javůrkem pod pseudonymem & na doméně metazoa.org. Je spoluzakladatelkou a kurátorkou online galerie ve spořiči obrazovky ScreenSaverGallery a výzkumnou pracovnicí v projektu Datatata. Je členkou umělecké skupiny zaměřené na performance Marína Abramovič Po Sebe Neupratuje.