„Obsahuje AI“: Měla by být hudba opatřena štítkem?

Ostrakizace AI

Tato horká debata o označování otevírá mnohem filozofičtější otázku: kde je hranice mezi skutečnou hudbou a umělou? Co vlastně definuje umělou hudbu?

Možná si řeknete: to je snadné – pokud zadáte příkaz a model pro vás něco vygeneruje, je to umělé. Ale je to opravdu tak jednoduché? Co když v procesu použijete pouze jeden nástroj AI – je vaše skladba už tím pádem umělá? Hranice je mnohem rozmazanější, než se zdá.

Myšlenkový experiment

Pro tento experiment odložme stranou naše osobní názory. Představte si svět, ve kterém byla vyřešena klíčová otázka současné AI – autorská práva. Budoucnost, ve které společnosti zabývající se AI našly způsob, jak spravedlivě odměnit každého tvůrce, jehož práce přispívá k výstupu AI. Žádné spory, žádné šedé zóny, jen spravedlivá kompenzace zabudovaná do systému

Nyní se vžijte do role zastánce "skutečné hudby", který je proti jakémukoli využití umělé inteligence v hudbě a umění. Účastníte se živé debaty vysílané po celém světě. Vaším protivníkem je generální ředitel známé společnosti zabývající se umělou inteligencí v hudbě a vy musíte obhájit svou tezi:

Hudba generovaná umělou inteligencí není skutečná hudba a měla by být označena.

Moderátor se na vás obrátí a zeptá se: „Jak definujete, kdy je něco umělé – a musí být označeno?“

Místnost ztichne a všechny oči se upírají na váš další krok. Je řada na vás – vaše následující prohlášení může rozhodnout o všem. Máte několik možností. Pomůžu vám vytvořit neprodyšnou argumentaci.

Začněme od nejintuitivnější myšlenky

Skutečná hudba je skutečná, protože ji vytvořil člověk; hudba vytvořená umělou inteligencí je umělá, protože ji vytvořil model.

Zní to dost jasně – dokud se nezamyslíte nad tím, co „vytvořil“ skutečně znamená.

Pokud interpretujeme tvorbu jako ideu, vaše argumentace se již začíná otřásat. Koneckonců, AI se jednoho rána neprobudí a nerozhodne se složit píseň (pokud ji k tomu nenavedeš). Člověk ji k tomu podnítí – zasadí myšlenku – a model ji provede. Takže i v tomto případě je původcem tvorby stále člověk, a to tvé argumentaci příliš nepomáhá.

Pokud však tvorbu vnímáme jako realizaci, věci se ještě více komplikují. Realizace sama o sobě může mít totiž několik významů:

  • Máme na mysli "vytvoření"? Jako když se skladba zrodí z nápadu a prochází všemi fázemi až k finálnímu masteringu? To by se rychle zkomplikovalo. Podle této logiky by skladba, která byla zcela napsána, zkomponována a produkovaná umělcem, ale masterována pomáhā nástroje jako Ozone, který využívá AI k vyvivážení frekvenčí a vylepšení zvukového spektra, musela být stále označena jako "AI hudba". Takže i kdyby všechna kreativní rozhodnutí pocházela od umělce, jednoducché vylepšení pomáhā AI na konci by ji učinilo umělou. To není příliš pevný základ.
  • Myslíme tím "provedena"? Pokud tím myslíme fyzické vystoupení v reálném čase - někdo, kdo skutečně hrá noty - pak by každá skladba naprogramovaná na softwarových nástrojích byla diskvalifikována. Cokoli nakreslené na MIDI mřížce v Abletonu nebo jakemkoli jiném DAW, bez živého hrání, by se nepočítalo. Podle této logiky se rozlučte s elektronickou hudbou jako Deadmau5 nebo Avicii. To není zrovna kopec, na kterém bychom chtěli zemřít.
  • Myslíme tím "slozšené"? Pak by každá skladba vytvořená ze vzorků od jiných umělců nesplňovala podmínky skutečné hudby. Útočíte na skladby jako Somebody That I Used to Know (která sama o sobě sestavá ze sedmi různých vzorkovaných skladeb) nebo na celé dědictví hip-hopu.
  • Pokud požadujeme skladbu obsahující samply za "skutečnou", kde pak máme stanovit hranici? Dalo by se argumentovat, že generování pomocí umělé inteligence je prostě pokročilejjší formou samplóvání - jen v mnohem větším měřítku. Umělá inteligence totiž sama o sobě neví, jak zní klavír nebo co definuje žánr. Naučila se to poslechem milionů skladeb vytvořených lidmi. Generování není originální, je to derivát. Zjednodušme to pomocí metafory s jídlem. Susan a Bob pěstují lahodné jahody a banány. Můžete vzít plátky obou a připravit ovocný salát - to je sampling. Nebo můžete jít na trh a koupit si smoothie vyrobené ze stejného ovoce. Chuť je známá, ale směs je jiná. Smoothie neobsahuje pouze ovoce od Susan a Boba, ale také kousky od nespočtu dalších producentu, které jsou tak jemně smíchány, že při každém doušku nepoznáte, čí ovoce právě ochutnáváte. Přesto jsou ingredience stále stejné a všechny jsou vytvořené lidmi - to je hudba generována umělou inteligencí. Začíná to být složité, že?

 

Generovaný obrázek ovoce

To, co máme, stále nestačí k tomu, abychom mohli rozlišit mezi skutečnou a umělou hudbou, pokud nejsme ochotni začít označovat většinu mistrovských děl „skutečné“ hudby také za umělá.

Zkusme to z jiného úhlu:

Skutečná hudba vyžaduje dovednosti. Do generování hudby pomocí umělé inteligence nejsou vloženy žádné dovednosti, proto je umělá.

To je pravda – ale tato debata je stará jako umění samo. Její nejznámější varianta se vyskytuje ve výtvarném umění: lze plátno s jedním tahem štětcem považovat za umění stejně jako detailní obraz Velásqueze?

VLEVO: Diego Velázquez, Las Meninas - Dvorní dámy (1656). Autorská práva: Public domain 
VPRAVO: Mareike Böhmer, Black Strokes (nd). Copyright: Mareike Böhmer

Názory se liší – někteří říkají: „To bych dokázal i já a nazval bych to uměním“, jako by hodnota tvorby závisela na viditelném úsilí nebo technických dovednostech. Jiní to vidí jinak – smysl nevidí v tom, jak těžké bylo dílo vytvořit, ale v tom, jaké pocity v nich vyvolává – a věří tomu natolik, že jsou ochotni cestovat po světě, aby viděli tato umělecká díla vystavená v muzeích moderního umění.

V hudbě někteří hudebníci tráví roky studiem nástroje, hodiny zdokonalolím svého umění a dokonce měsíce tvarováním jedné jedinné skladby, ale výsledek je na stejné úrovni jako něco, co vzniklo za 10 minut s objektivně mnohem menším nasaníým - virtuozní Rachmaninovuv klavirní koncert na polici vedle repetitivního techno kick drum na zvukové kulise a trapový beat stažený z YouTube, nad kterým někdo mluví s Auto-Tune. Proč tomu tak je? Pro různé uši je každá z těchto skladeb skutečnou hudbou, bez ohledu na dovednosti, které za ní stojí. Samotna dovednost tedy nemůže definovat, co je "skutečné".

Opakuji, to, co máme, stále nestačí k tomu, abychom mohli rozlišit mezi skutečnou a umělou hudbou, pokud nejsme ochotni začít označovat většinu mistrovských děl „skutečné“ hudby také za umělá.

Čas běží

Docházejí vám možnosti a stále jste v debatní místnosti. Nastalo ticho. Uvědomujete si, že to není tak snadné, jak jste si mysleli. Zpanikaříte a rozhodnete se zdvojnásobit své předchozí argumenty v naději, že jeden z nich zabere. Jak se dalo očekávat, váš oponent (samozřejmě s pomocí svého AI asistenta v uchu) jeden po druhém vyvrací oba vaše argumenty. Jste zpátky na začátku. A v tomto okamžiku je jasné, že jakmile začnete rozebírat, skutečné a umělé nejsou dvě protilehlé strany jedné linie – jsou to body na spektru, které se čím více snažíte definovat, tím více se posouvají.

Pak se někdo z publika postaví.

Promiňte, nechci rušit… možná by rozlišení nemělo být o nástrojích, které umělci používají, ale o záměru, který za nimi stojí. Koneckonců, napsat jeden řádek a nechat AI udělat zbytek není nijak zvlášť kreativní – ale stejně tak není kreativní například ruční vytváření skladeb, které kopírují zvuk jiného umělce. Oba technicky produkují hudbu, ale mají nějaký význam?

Vy a váš oponent ztuhnete. Celou debatu jste strávili posedlí tím, co je skutečné a co umělé, ale možná pravda spočívá v samotné definici hudby.

Definice hudby byla vždy předmětem debat. Encyklopedie  Britannica ji popisuje jako umění zabývající se kombinací vokálních nebo instrumentálních zvuků za účelem dosahování krásy formy nebo emocionálního vyjadřování". The Concise Oxford Dictionary ji definuje jako "umění kombinovat vokální nebo instrumentalní zvuky (nebo obojí) za účelem vytvoření krásy formy, harmonie a vyjádření emocí". Cambridge Dictionary má širší pohled a definuje ji jako "vzor zvuků vytvářených hudebními nástroji, hlasy nebo počítači, případně jejich kombinací". Zařazení počítačů mezi nástroje je malým, ale výmluvným znamením toho, jak se tvorba vyvíjí.

Možná tedy skutečná otázka nezní, kdo nebo co hudbu vytváří, ale proč je vytvářena a jaké pocity v nás vyvolává. Skutečná hudba nemusí být definována tím, zda je vytvořena člověkem, algoritmem nebo obojím, ale tím, jak na nás působí.

Možná tedy skutečná otázka nezní, kdo nebo co hudbu vytváří, ale proč je vytvářena a jaké pocity v nás vyvolává. Skutečná hudba nemusí být definována tím, zda je vytvořena člověkem, algoritmem nebo obojím, ale záměrem a emocemi, které za ní stojí – věcmi, které jsou lidé schopni vnímat a na které reagovat.

 

A právě proto by se umělci neměli cítit ohroženi umělou inteligencí. Hodnota jejich práce nikdy nezávisela na nástrojích, které používají, ale na emocích, které dokážou převést do zvuku, a na tom, jak tento zvuk působí na lidi. Pocity, které vkládají do své hudby, lidskost, která vibruje v každé notě, vždy přesáhnou jakoukoli technologii, která jim pomáhá ji utvářet.

Na závěr

Vraťme se k otázce, kterou jsme si položili na začátku: měla by být hudba opatřena štítkem?

Pokud to posluchači chtějí, proč ne. Ale jak jste již asi pochopili, klasifikace hudby jako AI nebo ne-AI neříká o písni celou pravdu. Určitě můžeme vtlačit kouli do čtvercového otvoru (chápete, co tím myslím?) – ale nepředstírejme, že to je tvar, pro který byla určena. Píseň může zahrnovat AI při jejím psaní, produkci, masteringu, nebo vůbec, a každý případ se nachází někde jinde na spektru použití. To, co by opravdu dávalo smysl, není binární označení (AI nebo ne AI), ale multidimenzionální označení – takové, které zachycuje, jak a do jaké míry hrála AI roli v tvůrčím procesu.

A možná je skutečnou otázkou, kterou si musíme položit, „kdybychom měli štítek, co by nám vlastně sděloval?“

Když je na potravině uvedeno „obsahuje přísady“, okamžitě to interpretujeme jako varování – znamení něčeho méně přírodního, méně čistého. Ale má „obsahuje AI“ stejný význam? Naznačuje to, že hudba je nějakým způsobem zkažená, nebo prostě vytvořená jinými prostředky?

Každý z nás na to bude mít jinou odpověď.

Můj názor je, že hudba se nakonec vždy vyvíjela společně se svými nástroji. Model AI vám může pomoci v tvůrčím procesu, ale za obrazovkou jste stále vy – řídíte jej, děláte rozhodnutí a vyjadřujete podstatu lidství.

Možná, pokud to ve vás vyvolává pocity, je to skutečné.

Myslíte si, že byste mohli přijít s argumentem, který by byl dostatečně silný, aby vyhrál tuto debatu? Jsem zvědavý – napište mi to do komentářů.

Překlad článku od Edoardo Pachera


Udio: Konec AI hudební utopie

Udio končí! 

Po měsíce symbolizovalo Udio novou kreativní éru: každý mohl zadat popis skladby a sledovat, jak se díky AI modelu během pár sekund zrodí píseň. Bez omezení, bez povolení – jen zvědavost a experimentování. (Chcete vyzkoušet? Přečtěte si jak vytvářet hudbu pomocí Udio.) Pak se objevil Universal Music Group s právníky a jasným, tvrdým vzkazem: "Svůj model jste trénovali na naší hudbě."

Od té chvíle byl ráj u konce. Udio nebylo koupeno ani zakázáno – pouze kapitulovalo po měsících hašteření. Můžete si přečíst jak okomonetovalo novou dohodu na svém blogu. Podepsalo dohodu s Universalem ještě předtím, než by soud rozhodl, zda automatizovaná tvorba hudby porušuje autorská práva. Za klid musela platforma obětovat to, co ji činilo jedinečnou: svobodu stahovat, sdílet a monetizovat uživatelskou tvorbu. (Obdobné vývoje jsme byli svědky i u dalších AI projektů, jak popisujeme v článku Secrets of Kandahar: Synthwave Opera s podporou na Patreonu.)

Uživatelům byla dána krátká lhůta – od 3. do 5. listopadu – na stahání svých dříve vygenerovaných skladeb. Poté všechny skladby zůstanou uvězněné v systému: přehrávat je půjde, ale není možné je exportovat či využít mimo Udio. Evoluce, která připomíná spíše kapitulaci než průmyslový přechod. Vygeneruj a stáhni co můžeš, dokud to jde..

Tato dohoda neznamená jen porážku jedné firmy – znamená porážku myšlenky: že umělá inteligence může být svobodným rozšířením lidské tvořivosti. Od té chvíle bude moci hudbu s AI tvořit jen ten, kdo bude pod dohledem velkých hráčů, v oploceném prostoru ovládaném smlouvami a licencemi.

Udio prohlášení

Po kliku na stáhnutí vás čeká nepříjemné překvapení.

Je důležité si uvědomit, že toto není izolovaný případ, ale symptom širšího boje o kontrolu nad kulturou v éře umělé inteligence. Hudební průmysl se snaží regulovat, co je "legitimní" vstup do AI modelů, aby ochránil svá aktiva. Ale tato ochrana může znamenat omezení osobní a kolektivní svobody tvořit.

Celá komunita kolem Udio se bouří a kroky, které společnost učinila samozřejmě nadzvihli uživatele ze svých židlí například v komunitě na Reddit, kde se strhla opravdová mela. Uživatelé to vnímají jako zradu a okamžitě ukončili svá členství. V mém případě vím jak tuto věc obejít, ale je to jako bych nasadil na Ferrari kolo ze žebřiňáku. Domnívám se, že Universal Music Group nekoupila Udio jako investici, ale jejím cílem bylo tento skvělý projekt zničit, což se jí s odlivem platících jistě povede. V mém případě budu ještě důslednější a za pomocí Comet od Perplexity, důkladně smažu i svůj obsah, aby po mě UMG v budoucnu nemělo co vymáhat.

Udio - aktivita uživatelů

Uživatelé své rozhořčení dali kreativně najevo.

AI nástroje měly "demokratizovat" tvorbu hudby, otevřít dveře všem tvůrcům, ale nyní se zdá, že se znovu uzavírá za závorkách smluvních podmínek a licencí. Otázkou zůstává: kdo bude vlastnit budoucnost hudby, pokud ji nebudou tvořit lidé, ale stroje? A jak moc budou tyto stroje svobodné?

V diskuzi o umělé inteligenci a kreativitě čelíme paradoxu: zatímco AI může rozšiřovat lidské možnosti, je stále silně závislá na datech, která jsou pod kontrolou stávajících institucí. Ve chvíli, kdy se tato data stávají měnou, vznikají mocenské nerovnosti, které mohou velmi brzy definitivně ovlivnit, jak budou vznikat nové umělecké formy.

Sdílení a remixování hudby, které kdysi poháněly inovace, se nyní stává problematickým nebo nemožným. Udio je jen nejnovějším příkladem toho, jak nové technologie a staré zákony vedou k zablokování potenciálu AI v umění.

Pokud chceme skutečně otevřenou kreativní budoucnost, budeme muset přehodnotit, komu patří práva a jaké hranice připouštíme pro inteligentní stroje, které vytvářejí kulturu. (Tento problém není omezen pouze na hudbu - viz náš článek Za 36 hodin režíserem, hudebním tvůrcem a producentem.) Jinak skončíme tam, kde jsme byli už mnohokrát – kdy tvůrčí svoboda padla pod taktovkou monopolu. Pokud si ale uživatelé platformy Suno myslí, že je takový vývoj mine, tak je musím zklamat. Jsou další na řadě. podle tohoto predensu můžeme očekávat, migrace a úpravy těchto projektů. Zajímavé ale také je, že ElevenLabs spustili novou funkci pro generování hudby a jelikož i já jsem Pro uživatel, tuto funkci nadšeně vítám. Král je mrtev, ať žije král. 

ElevenLbas má novou funkci generování hudby.

Něco pozitivního ale můžu ze své osobní zkušenosti napsat závěrem. Je to spíš takové hezké zakončení piety na tím projektem, nad kterým se pomalu zavírají dveře kremační pece a my se smutným úsměvem zamačkáváme slzu. Já jsem s Udiem zvládl udělat debutové kompletní album Secrets of Kandahar - Circa 1923. A přál bych si, abych ho mohl uvést na svět ve veselejším duchu, protože jsem si dal opravdu záležet a vzalo mi více jak rok života. Tento komplexní New Wave Synthpop - Synthwave je komplexní dílo, které se snad v příštím roce promění na celovečerní snímek. Prozatím si můžete jeho kvality vychutnat jak na YouTube, tak na Spotify. Album s názvem Circa 1923, které nabízí 9 písní a 30 minut kvalitního Synthwave materiálu, můžete zakoupit  na našem eshopu s bonusovým obsahem. Udpočívej v pokoji drahé Udio, jakož i jeho 4000 kreditů, které mi tam zbývají, mé album ti hraje na funusu.

Secrets of Kandahar - logo

Přetvoření videa s Aleph od RunwayML

Jak na RunwayML Aleph

Runway Aleph je nejmodernější kontextový video model, který nastavuje nové standardy v oblasti multitaskingové vizuální generace. Umožňuje provádět širokou škálu úprav vstupního videa, jako je přidávání, odstraňování a transformování objektů, generování libovolného úhlu scény a úpravy stylu a osvětlení, a mnoho dalších úkolů.

Dashboard - All Tools - Aleph

Vytvářejte nové úhly kamery

S Runway Aleph můžete pomocí jednoduchých pokynů vytvářet nové pohledy na stávající scény. Ať už potřebujete zpětný záběr nebo nízký úhel, nyní můžete vytvářet nekonečné množství záběrů.

Klíčová slova:
Wide shot
- Generate a full shot of the subject
Extreme Close-Up - Generate a close-up shot of the subject
Medium Shot - Generate a medium full shot of the subject

Vytvořte další záběr

Vytvořte plynulé pokračování svého příběhu. S Runway Aleph můžete snadno vytvořit další záběr ve své sekvenci pouhým požadavkem.

Klíčové slovo:
Generate a next shot

Použijte jakýkoli styl k převodu do videa

Proměňte jakékoli video podle svých představ. S Runway Aleph můžete snadno aplikovat jakýkoli styl na své záběry pouhým požadavkem.

Klíčové slovo: 
Transfer the style of the video

Změňte prostředí, lokality, roční období a denní dobu

Proměňte běžné záběry v profesionální vizuální efekty. A to vše při zachování tolik nebo tak málo ze zdrojového materiálu, kolik si budete přát. Zde je velká možnost variability prompt engeneeringu.

Klíčové slovo:
Rain - Add rain
Freeze - Freeze the water and add snow
Sandstorm - Change the weather to a strong sand storm. Windy and sand everwhere with a strong orange tint.

City - Change the scene to a city alley

Desert - Change to a dirt road

Přidávejte prvky do scény

Vylepšete své záběry čímkoli, co si dokážete představit. Runway Aleph hladce integruje nové prvky do stávajících scén – přidejte dav do prázdných ulic, umístěte produkty na stoly nebo vložte rekvizity, které jste zapomněli natočit. Stačí popsat, co chcete, nebo poskytnout referenční obrázek, a uvidíte, jak se to přirozeně objeví ve vašem videu s odpovídajícím osvětlením, stíny a perspektivou.

Klíčové slovo:
Add - Fireworks, Palm Trees, Characters

Add the crowd

Odstraňte objekty ze scény

Už se nikdy nemusíte trápit přeplněnými scénami nebo rušivými prvky. S Runway Aleph můžete snadno odstranit nežádoucí objekty a prvky ze záběrů pouhým požadavkem.

Klíčové slovo:
Remove - smoke, person, reflection
Remove the person from the scene
Remove the reflection in the mirror

Změna objektů ve scéně

Runway Aleph vám umožňuje snadno změnit texturu nebo zcela nahradit objekty, předměty a další prvky z existujících videí. Stačí zadat textový příkaz nebo referenční obrázek toho, co chcete ve svém videu vyměnit. Zde nás to podvědomě nutí použít slovo Transform, ale...

Klíčové slovo:
Change - into, material 
Change the car into Chariots with horses
Change the material of the ball to lava

Použijte pohyb videa

Vezměte pohyb libovolného videa a použijte jej na nový první snímek pro jemné ovládání kamery.

Klíčové slovo:
Apply the same motion

Změňte vzhled postavy

Změňte věk a vzhled herců pomocí jednoduchých pokynů. Není třeba složitý praktický make-up ani nákladné vizuální efekty, stačí si říct, co chcete.

Klíčové slovo:
Make
Make him young
Make her as a child
Make him old

Přebarvení prvků scény

Snadno změňte barvu objektů ve scéně zadáním vzorku barvy nebo popisem palety, kterou hledáte. Použijte vyskakovací nabídku nad vaším promptem, která se objeví po dosazení videa a nahrajte buď jednolitou barvu, nebo udělejte skicu.  

Klíčové slovo:
Change
Change the house to red of image

Relight Shots (Opětovné nasvícení záběrů)

Změňte náladu jakékoli scény pomocí zcela nového osvětlení. Natáčeli jste ve špatnou denní dobu? Runway Aleph vám umožní změnit ostré polední světlo na zlatou hodinu, zesvětlit podexponované záběry nebo vytvořit dramatické osvětlení západu slunce z oblačného dne. Osvětlení se přirozeně přizpůsobí celé scéně a aktualizuje stíny, odrazy a barevnou teplotu tak, aby odpovídaly vaší vizi.

Klíčové slovo:
Make - Make it dawn, afternoon, daytime...
Transform - Transform the scene to appear as if it was shot during golden hour.

Zelené pozadí

Vytáhněte jakoukoli osobu nebo objekt ze svého záznamu a umístěte je na čisté pozadí. Runway Aleph automaticky izoluje váš objekt pomocí přesné detekce okrajů a zachová všechny detaily, od pramínků vlasů po průhledné látky. Exportujte se zeleným pozadím, průhledným pozadím nebo jakoukoli plnou barvou pro hladkou integraci do jiných projektů.

Klíčové slovo:
Green screen
Green screen the person
Green screen the object

RunwayML - Základy promptingu