Hudba počítačových neuronů

Jak umělá inteligence změní hudební průmysl?

Umělá inteligence je v současné době horkým tématem uměleckých spekulací a patrně povede ke vzniku nové, posthumánní hudby. Například Holly Herndon své letošní album z pětiny vytvořila neurální sítí Spawn. Je proto načase začít přemýšlet, jak tento fenomén změní systém hudební produkce a distribuce, případně samotné pojetí kreativní práce.

Současný nárůst zájmu o témata týkající se umělé inteligence prakticky ve všech oblastech lidské činnosti je těžké přehlédnout. V hudbě může jít o stejný přelom, jakým byl nástup magnetofonového pásku nebo osobního počítače. Možná se ale jedná o příliš komplexní fenomén, než aby ho bylo možné vnímat jako jednotný diskurs geeků, audiofilů, návštěvníků klubů, příznivců vysoké hudby a laické veřejnosti. A ještě jinak s umělou inteligencí nakládají samotní umělci. Každá ze jmenovaných skupin klade své vlastní otázky, přesto je jisté, že s umělou inteligencí v hudbě musíme počítat.

Nejprve je ale nutné objasnit, že umělá inteligence není synonymem pro jakýsi efemérní počítačový mozek, který by dokázal kreativně vytvářet novou hudbu. Je to zastřešující pojem pro množinu systémů nebo myšlenkových konceptů, která zahrnuje „machine learning“, tedy způsob, jakým počítače rozumějí datovým množinám a jak je interpretují. To je aktivita prováděná již celé roky a není na ní v zásadě nic intelektuálně náročného. Jde o algoritmy, které usnadňují počítačům rozklíčování konkrétních podnětů v takovém objemu a rychlosti, jaké jsou člověku nedostupné, a navíc bez konkrétní definice postupů, pouze na základě metody pokus–omyl. Kromě toho však umělá inteligence obnáší i „deep learning“ – sofistikovanější formu strojového učení, které dokáže rozpoznávat a diagnostikovat podněty na základě komplexních vrstev vnímání v neurálních sítích. Ty zpracovávají podněty na mnoha různých rovinách a využívají se například při počítačovém vidění nebo obecně při rozpoznávání objektů, mluveného jazyka, zvuků či písma. Jinak řečeno, současná expanze umělé inteligence v hudbě neznamená nahrazení skladatelů či interpretů automaty. Dovolí ovšem počítačům hudbu lépe poslouchat, analyzovat a na základě tohoto poznání vytvářet její imitace.

 

Automaticky generovaná hudba

Jednou z nejpopulárnějších platforem tohoto typu je otevřená neurální síť MuseNet, která vychází ze stovek tisíc analyzovaných notových zápisů. Zkoumá množství podnětů, zjišťuje, co mají společného a jaké mezi nimi existují vztahy, a na základě toho dokáže celkem přesvědčivě vygenerovat cokoli od Rachmaninova po Rammstein. Genezi hudebních sítí doprovází vznik trhu s automaticky generovanou hudbou, který reprezentují platformy jako Boomy, AIVA, Amper Score, Flow Machines nebo veterán oboru Jukedeck. Ty přitom neprodávají konkrétní skladby, ale použití generátoru, který dokáže pokaždé vytvořit novou, unikátní kompozici. V současnosti se tento nástroj využívá v nízkorozpočtové videoprodukci, herním průmyslu a obecně všude tam, kde potřebují ne­určitou, ale žánrově rozpoznatelnou hudbu sloužící jako zvuková kulisa. Tato produkce, označovaná jako bet music, stock music nebo funkční hudba, má nepříliš složitá pravidla a v uplynulých dekádách byla běžně dostupná na mnohadiskových edicích. Po nástupu umělé inteligence ji ovšem už nikdo nebude komponovat ručně, neboť počítačové systémy to zvládnou stokrát rychleji. A nejen to – dokážou se adaptovat na mnohem sofistikovanější hudební postupy.

Souběžně s rozvojem uměle komponované hudby vyvstává řada etických a právních otázek, například ohledně právní ochrany hudebních stylů či rukopisů. Je­-li tak snadné znít jako Lady Gaga, je opravdu nutné, aby Lady Gaga skládala ještě něco dalšího? Nebo by mělo být možné autorsky chránit samotný styl Lady Gaga? Anebo autorská ochrana přestane dávat smysl? Jak ovšem podotýká publicista Clive Thompson v článku pro dubnové číslo magazínu Mother Jones, tento problém se v první řadě nebude týkat hvězdných interpretů, ale nemalého množství skladatelů v šedé zóně gig ekonomiky, přivydělávajících si spotřební hudbou. Práce těchto tvůrců zanikne a oni budou muset své rodiny živit nějak jinak. Proto je více než aktuální otázka, jakou úlohu bude hrát v celém procesu člověk, a nebude­-li nutné, jako v minulosti už mnohokrát, aby redefinoval svou roli po boku strojů.

 

Nevyslyšené varování?

Přestože umělá inteligence v hudbě má dosud podobu nástrojů či asistivních technologií, v mediálním diskursu rezonují dalekosáhlejší spekulace, spojené se silným metaforickým obrazem emancipovaného oživení technologického parku. Představa o umělé inteligenci – jakkoli banálně to může znít – v sobě zahrnuje imaginární entity, jako jsou HAL z filmu 2001: Vesmírná odysea (1968) nebo kladný i záporný Terminátor. Dotýká se překonávání lidských smyslů (vidí víc, slyší lépe), ohrožení (protože vidí víc, jedná za našimi zády) a akcelerace (udělá to, co my, ale lépe a rychleji). Hudební média tak v posledním roce glosují nástup umělé inteligence jako „varování, které jsme nevyslyšeli“, „naše zotročení algoritmy“ nebo „totální clusterfuck hudební legislativy“. V emocionální diskusi, která není nepodobná zděšení, jaké nastalo po nástupu domácích počítačů, je přitom samotným výstupům umělé produkce věnována jen malá pozornost. Na rozdíl od textů, maleb nebo fotografií generovaných umělou inteligencí se strojově vytvořená hudba zatím nedočkala osočování z podvodu či imitace a s podivnou samozřejmostí se stává součástí hudebního trhu, aniž by bylo jasné, jak k ní kriticky přistupovat. Hudební průmysl nicméně bere umělou inteligenci velmi vážně – své vlastní aplikace vyvíjejí všichni velcí hráči, jako jsou Google, Sony nebo Spotify.

Vše, o čem dosud byla řeč, se netýká výsledné hudební nahrávky, ale jen notového, respektive MIDI záznamu. Ten je při tvorbě podrobován úpravám a revizím nebo je považován za zdrojový materiál. Takto vzniklo údajně první album vytvořené pomocí umělé inteligence: I AM AI (2018) zpěvačky Taryn Southern. Jeho jednotlivé party byly počítačově generovány a bez větších změn použity, aniž by se tento fakt do výsledného zvuku nějak přehnaně otiskl. Nahrávka tak i přes relativně pozitivní recenze působí především jako důkaz, že umělou inteligenci lze použít pro komponování nenáročné hudby.

 

Dítě, které si vychováme

O mnoho zajímavější jsou umělecké projekty využívající umělou inteligenci pro vytváření samotné hudební matérie. Neurální síť Yona íránského producenta Ashe Kooshy, který vydává na značce Ninja Tune, debutovala na nahrávce C (2018). Yona vytváří rytmické textury, MIDI partitury pro vokaloid, harmonie i texty a často dospívá k velmi překvapivým postupům – jakési zjemnělé verzi glitch music, kterou v hudbě samotného Kooshy nenajdeme. Jak ale producent podotýká, naučit neurální síť vyprodukovat něco, co připomíná hudbu, je úkol na několik let. Na rozdíl od komerčních platforem uvažuje Koosha o Yoně nikoli jako o službě, ale jako o personě, křehké poloprůsvitné bytosti připomínající dekonstruované roboty ze současné sci­-fi. Fikci umělé inteligence coby samostatné entity navíc posiluje třeba tím, že s Yonou společně vystupuje (pod názvem Yona featuring Ash Koosha) nebo se o ní v interview vyjadřuje jakožto o tvůrkyni.

Zatímco Yona je výsledkem hledání nové estetiky umělé inteligence, nové album Holly Herndon Proto (2019) klade obecnější a zásadnější otázky. Herndon, která na nahrávce pracovala společně se svým partnerem a pravidelným spolupracovníkem Matem Dryhurstem, pojala album jako volné pokračování předchozí desky Platform (2015; recenze v A2 č. 18/2015), na níž ústřední roli hrály on­-line technologie pojaté jakožto intimní životní prostor. Na novince je opět využit laptop (jako velmi osobní nástroj), ale k němu se přidává neurální sítí Spawn, vytrénovaná hlasem hudebnice. Přestože Spawn vytvořila jen kolem dvaceti procent materiálu alba, dokázala vtisknout nahrávce neopakovatelný charakter (nejrozpoznatelnější je ve skladbě Evening Shades, jež je autentickým záznamem společné improvizace umělé inteligence a pěveckého sboru). Podstatnější je však nová dimenze přemýšlení o umělé inteligenci jako o dítěti, které oba tvůrci několik let vychovávají. Tento přístup obrací perspektivu vnímání umělé inteligence jako něčeho, co nás přišlo zničit. Namísto toho nabízí obraz bytosti, která odráží to, co ji naučíme, a s níž bychom proto měli navázat partnerský vztah. Jak Herndon dokazuje na letošním albu, tento vztah nemusí vyústit jen v novou technoestetiku, ale i ve zvláštní hybrid elektronické kultury, esoterismu a šamanismu. Možná jde o jeden z mála pozitivních způsobů, jak se s nástupem umělé inteligence nejen v hudbě vyrovnat bez výrazných ztrát.

Autor je umělec.