Miénk marad a művészet? – a technológia leválthatja a szobrászokat és a zeneszerzőket is

A művészeti világ – mint szinte minden iparág – egyre inkább küzd a mesterséges intelligencia (MI) térhódításával. A technológia robbanásszerű fejlődése azonban nemcsak a művészek munkáját veszélyezteti, de gyakorlatilag megkérdőjelezi a művészet és a kreativitás évezredek óta megdönthetetlennek tartott definícióit. Az MI immár nem pusztán eszköz, hanem szinte alkotótárs. És egyelőre senki sem tudja pontosan megmondani, hol húzódik a határ a kettő között.


MI a művészetek területén.Kép: Depositphotos/Tihon6

Panelbeszélgetést rendeztek október végén Budapesten, a Science Expón, A mesterséges intelligencia etikus használata a művészetek területén címmel. A Pázmány Péter Katolikus Egyetem és a Soproni Egyetem oktatói elsősorban arra kerestek választ, hogy mitől számít egyedinek egy kép, és vajon mi alapján nevezhetem saját szellemi terméknek az adott alkotást. Az egyetemi tanárok egyetértettek abban, hogy az MI használatá­nak elterjedésével elsősorban már nem a célon van a hangsúly, hanem az oda vezető úton. Véleményük szerint a 21. században már megkerülhetetlen ez a téma, és élni kell a technológia adta lehetőségekkel, ugyanakkor mindezt transzparensen kell tenni. Felvetődött az a kérdés is, vajon mi szükség lesz a művészekre a jövőben, ha egy megfelelő utasítás alapján az MI – akár néhány másodperc alatt – képes megalkotni egy új logót vagy egy képet. A beszélgetés résztvevői személyes tapasztalataikra hivatkozva úgy látják, hogy a technológiának köszönhetően attól még, hogy hihetetlenül gyorsan létrejön egy alkotás, nem biztos, hogy minőséget is képvisel. Úgy vélték, éppen ez az igazi veszély. Mert az avatatlan szem elhiszi, hogy az MI által kreált mű megüti az elvárt szintet. Magyarázatképpen elhangzott az is, hogy a kreativitás ki­zárólag emberi tulajdonság, és arra is figyelmeztettek, hogy az MI csakis korábban megvalósult képek, hangok, szövegek alapján hoz létre új tartalmat. Álláspontjuk sok mindenben megegyezik egy katalán egyetem, az Universitat Oberta de Catalunya idén megjelent tanulmá­nyának megállapításával, mely szerint a generatív mesterséges intelligencia nem helyettesíti az emberi kreativi­tást, hanem kiegészíti – képes növelni az ötletek mennyiségét, segíti a koncepcionális gondolkodást, és automa­tizál bizonyos feladatokat. 

A kutatás ugyanakkor arra is rámutat, hogy az MI bevezetése a művészetekbe etikai aggályokat is felvet olyan kérdésekben, mint az eredeti­ség, a szerzői jogok és a tulajdonlás.

Másol vagy alkot?

A generatív technológia valóban „hozott anyagból” dol­go­zik, ugyanakkor az is tény, hogy a képzés nélkül is rendkí­vül könnyen kezelhető MI-eszközök emberek tíz- és száz­milliói számára érhetők el, és csupán a fantáziájukon mú­lik, hogy milyen témában és stílusban kezdenek el alkotni a technológia segítségével. A mesterséges intelligen­cia ezen a szinten a betáplált mintázatok alapján, a gépi ta­nulás, a neurális hálózatok és a mélytanulás segítsé­gé­vel már eredetinek tűnő tartalmak generálására is képes. Ilyenek például a generatív ellenséges hálóza­tok (Generative Adversarial Network; GAN): ezek a párban álló MI-rendszerek egymást ellenőrizve fejlesztik a tudá­su­kat. A gyakorlatban mindez azt jelenti, hogy az után­zó rend­szer összegyűjti egy kiválasztott festő, például Rembrandt korábbi műveit, elemzi a témaválasztását, stílusjegyeit, szín- és ecsethasználatát, megvizsgálja egyéb művészi sajátosságait, majd elkezdi utánozni. A másik MI-rendszer pedig folyamatosan értékeli ezeket a próbálkozásokat. Ez az utánzás-értékelés folyamat akár több milliószor is megismétlődhet, mígnem a folyamat vé­gén egy Rembrandt festményeihez nagyon-nagyon hasonlót kapunk – avatatlanok számára gyakorlatilag megkülön­böztethetetlen színvonalút. Ugyancsak népszerű technológia a prompt-alapú képgenerálás, amikor már nincs szükség a manuális képességekre, a promptok megfogalmazásának pontosságán múlik minden. A prompt a mesterséges intelligencia rendszereknek adott utasí­­tás, amely alapján az MI tartalmat generál. Minél pontosabban van megfogalmazva a prompt, annál relevánsabb és hasznosabb alkotásra képes a rendszer.

Rembrandt stílusát utánzó festmény.A párban álló MI-rendszerek egymást ellenőrizve fejlesztik a tudásukat. Az utánzó rendszer összegyűjti egy kiválasztott festő, például Rembrandt korábbi műveit, elemzi a témaválasztását, stílusjegyeit, szín- és ecsethasználatát, megvizsgálja egyéb művészi sajátosságait, majd elkezdi utánozni. (Kép: Depositpotos/Klanneke)

A képek és hangok létrehozására alkalmas variációs autoenkóder (Variational Autoencoders; VAE) egy olyan neurális hálózatarchitektúra, amely egyesíti a gépi tanulás megbízhatóságát a kreatív alkotás képességével. Első lépésben egy látens térbe – azaz egy absztraktba, ahol az adatok fontos mintázatai „tömörítve” jelennek meg – kódolja, majd eredeti formájukba dekódolja az adatokat. A rendszer ennek köszönhetően felismeri azok rejtett struktúráját, és ennek alapján generál hasonló tartalmakat. És idesorolhatók még az olyan nagy nyelvi modellek (például a Transformerek), melyek a tanulás során párhuzamosan vizsgálják az adott szöveg összes elemét, súlyozva egymáshoz viszonyított jelentőségüket. Így a korábbi modellekhez képest a Transformer már nem sorban dolgozza fel a szöveget, hanem teljes egészében vizsgálja a bemenetet, ami jelentős gyorsulást és pontosságot eredményezett. A Generative Pre-trained Transformer (GPT) modellek pedig úgy generálnak szöveget, hogy a korábbi szavak alapján jósolják meg a következő szót.

Azzal, hogy a technológia fejlődése egyre több ember számára teremti meg a művészi alkotás lehetősé­gét, átalakítja az alkotói folyamatokat és a művészi kifejezés lehetőségeit, egyben megkérdőjelezi a hivatásos művészek hagyományos szerepét is. Ennek a folyamat­nak a végkimenetelét ma még senki sem ismeri, a művé­szek számára a legfontosabb feladat az alkalmazko­dás, azaz a technológiával való minél hatékonyabb együttműkö­dés lehet. Ezekből is gyűjtöttünk néhányat.

A jövő művészete

Az 1985-ben, Isztambulban született, Los Angelesben élő médiaművész, Refik Anadol 2024 után idén is be­mutathatta mesterséges intelligenciával működő, a glo­bá­lis felmelegedéssel és a környezeti válsággal kapcso­la­tos installációját a Világgazdasági Fórum éves davosi ülésé­nek nyitókoncertjén. Témaválasztása tavaly az esőerdők, azok növény- és állatvilága volt, idén pedig a világ gleccsereinek sorsa került a középpontba. Az MI-alapú művészetek egyik úttörőjének tartott Anadol komoly háttérmunkát végzett: több mint százmillió képet szerzett be online és intézményi archívumokból, csapatával pedig eljutott az Antarktiszra, Grönlandra, Izlandra, Argentíná­ba és Svájcba is, ahol mintegy tízmillió adatpontot, képet és videót vettek fel. Egy speciális mikrofonrendszer segítségével rögzítették a jég repedéseivel és olvadásával járó hangokat – ezzel próbálva megragadni a gleccserek belső világát. Az adatgyűjtés során sikerült begyűjteni még a jégbarlangokból származó friss víz illatát is, melyet Davosban az installáció során, állítólag, érezni is lehe­tett. Anadol a hatalmas adathalmazok elemzésével és feldolgozásával a beszámolók szerint hipnotikus, a gleccserek szépségét és sebezhetőségét ábrázoló vizuális installációt hozott létre.

Refik Anadol installációja.Refik Anadol mesterséges intelligenciával működő installációja a Világgazdasági Fórum 2024. évi davosi ülésének helyszínén. (Kép: WEF)

Ugyancsak érdekes fejlesztés az élő zenei improvizációra épülő ReaLJam: egy zenész és egy Transformer-alapú megerősítéses tanulással (reinforcement learning) kiképzett MI-modell közösen „jamelnek” valós időben. Méghozzá úgy, hogy a modell nemcsak egyszerűen reagál a zenész játékára, hanem képes előre meghatározni, miképp szeretne tovább játszani, ráadásul mindezt vizuálisan kommunikálja is vele. A zenész így azt érzi, hogy nem egy statikus háttérfelvétellel játszik, hanem egy interaktív partnerrel. A ReaLJam hatékonyságáról több kutatás is készült tapasztalt zenészekkel, akik élvezték a közös improvizációt, és elmondásuk szerint zenei szempont­ból érdekes, váratlan összefonódások jöttek létre.

A zenei innováció másik érdekes iránya a Reelmind nevű platform egyik izgalmas projektje a virtuális MI-koncert, ahol mesterséges intelligencia által generált zenészek és énekesek lépnek fel egy virtuális színpadon. Az MI a ze­nét nemcsak komponálja (például OpenAI Jukebox-szerű modellekből), hanem klónozza vagy újraalkotja a vokális stílusokat is. A koncerten a fellépő avatárok 3D grafiká­val jelennek meg, mozgásukat generatív hálózatok kom­binációja formálja, így a digitális szereplők élethűekké válnak. A vizuális élményt dinamikus fény- és effektrendszer egészíti ki: a technológia olyan háttereket generál, amelyek zenei tempóhoz és hangulathoz igazodnak. A közönségnek nem kell a helyszínen lennie: a koncert lehet teljesen virtuális, online platformon, vagy akár VR-környe­zet­ben is megvalósulhat. Mindez lehetőséget ad arra, hogy az alkotók bárhol a világon létrehozhassák inter­ak­tív, látványos előadásaikat az MI-partnereikkel.

A Holo-Artisan egy új digitális múzeumi technológia, amely a hagyományos kiállításokat személyre szabott, holografikus élménnyé alakítja. A rendszer képes egyszerre több látogatót figyelni – például a testtartásukat, arckifejezésüket vagy a kérdéseiket –, és ezek alapján va­­lós időben reagálni. Ezért egy műalkotás vagy történel­mi figura mindenkinek máshogy „elevenedik meg”: beszélhet, mozdulhat vagy akár visszakacsinthat. A működés kulcsa, hogy a számítások nagy része a helyszínen tör­té­nik, így gyorsabb és biztonságosabb az adatkezelés. A mester­séges intelligencia csak a szükséges frissítése­ket küldi a központi rendszernek, ami jelentősen csökkenti a késleltetést és a hálózati terhelést. A végeredmény egy há­romdimenziós, szemüveg nélküli holografikus meg­jelenítés, amely egyszerre közös és mégis személyre sza­bott élményt ad. A fejlesztés célja, hogy a múzeumi láto­ga­tást interaktívabbá, élményszerűbbé és tanulásköz­pon­túbbá tegye úgy, hogy közben a kulturális tartalom mindenki számára elérhetőbbé váljon.

Térjünk át egy másik művészeti ágra. A Lehetetlen Szobor (Impossible Statue) egy úttörő művészeti-technikai projekt, amelyet ugyancsak a mesterséges intelligencia segítségével hoztak létre. A svéd Sandvik mérnöki cég és az AI Framework közösen dolgozott azon, hogy egyetlen szoborban ötvözzék Michelangelo, Rodin, Käthe Kollwitz, Takamura Kotaro és Augusta Savage stílusjegyeit. A folyamat során az MI először digitálisan tanulmányozta az említett művészek szobrainak formavilágát, majd ezek alapján új 3D-modellt generált. Az így létrejött modell finom részleteket is bemutató, mégis erőteljes figurát ábrázol, amely földgömböt tart a kezében – a végső mű rozsdamentes acélból készült. Érdekesség, hogy a gyártásnál az MI nemcsak a formatervezésben segített: digitális szimulációk révén csökkentették az anyagfelhasználást, ezért a szobor kevesebb acélból, fenntarthatóbban készült.

A Sandvik Impossible Statue projektje.A svéd Sandvik mérnöki cég és az AI Framework közösen dolgozott azon, hogy egyetlen szoborban ötvözzék a világ legismertebb szobrászainak stílusjegyeit. Az MI először digitálisan tanulmányozta a mesterek szobrainak formavilágát, majd ezek alapján új 3D-modellt generált. (Kép: home.sandvik)

A nigériai képzőművész, Minne Atairu ugyancsak az MI-t használja ahhoz, hogy 3D-szobrokat hozzon létre, amelyek vizuálisan gazdag kulturális történeteket mesélnek el. Egyik ismert munkájában, a To the Hand címűben, Atairu szöveges leírások alapján teremt digitális formákat két különböző digitális eszköz kombinációjával, majd az elkészült modelleket fizikai szobrokká alakítja: 3D-nyomtatással, illetve korrózióálló anyagokból (például kobalttal kevert kompozitból) készíti el őket.

A művész-alkotó páros, Varvara Guljajeva és Mar Canet Sola létrehozta a Dream Painter installációt, amelyben a látogatók hangosan elmesélik álmaikat, majd az MI robotikus rendszer ezt a beszédet vizuális alko­tás­sá ala­kítja. A rendszer felépítése magában foglal egy inter­ak­ciós állomást (mikrofon), egy festőrobotot, egy mozgat­ható papírszalagot, valamint egy mélytanuló modellt, amely a beszédet „látens térben” dolgozza fel. Ami­kor va­laki mesél az álmáról, az MI-modell elemzi a szavakat, érzéseket, kulcselemeket, utána ezek alapján generál egy szabadvonal-szerű, absztrakt rajzot, amelyet a robot fi­zikailag is megfest a papírra. 

Az egészen biztos, hogy a mesterséges intelligencia teljesen új fejezetet nyitott a művészetben: nem pusztán eszköz, hanem már egyfajta társalkotó, amely jelentő­sen gazdagítja a kreativitást, ugyanakkor komoly felelősséget is ró az alkotókra. Ebben magasabb szintre kell fejlődniük a technológia felhasználóinak.•

Címlapkép: Depositphotos/Tihon6


 
Archívum
 2011  2012  2013  2014  2015  2016  2017  2018  2019  2020  2021  2022  2023  2024  2025
Címkék

Innotéka