Suno v5.5 - 2 .díl: Prompt Engineering

2. Návod na Suno česky

# Meta tagy, [no vocals], style-of-music pole, MILO-1080 sekvencer, a syntaxe promptu - výzvy. 

Prompt Engineering

V minulém díle jsme si ukázali, co obecně Suno je, co umí a co ne a jak se s ním má pracovat. V pokračování se zaměříme na prompt engeneering, architekturu promptu. Podívejme se, jak v režimu Custom Mode přesně řídit styl, text, strukturu i výsledný charakter skladby. Vysvětluje práci s metatagy, kreativními posuvníky, vokálními deskriptory, vícejazyčným zpěvem a produkčním workflow. Důraz klade na iteraci, správné členění promptu a používání konkrétních hudebních popisů místo obecných zadání.

Rychlé menu
  1. Co je Suno
  2. Začínáme
  3. Modely a verze
  4. Ceny a kredity
  5. Architektura promptu
  6. Pomocník pro vylepšení promptu
  7. Popisy žánrů a stylů
  8. Stylování vokálů
  9. Instrumentální režim
  10. Přehled metatagů
  11. Strukturální tagy
  12. Instrumentální a vokální tagy
  13. Pokročilé vzory metatagů
  14. Creativní slajdry
  15. Editor skladeb
  16. Covery a remixy
  17. Voices
  18. My Taste v5.5
  19. Generační smyčka
  20. Suno Studio DAW
  21. Separace stemů a export
  22. Integrace s DAW
  23. Míchání žánrů
  24. Vícesekční kompozice
  25. Řetězení promptů
  26. Řešení problémů
  27. Komerční licence
  28. Autorské právo a právní souvislosti
  29. Konkurenti a alternativy
  30. Stav API a integrací
  31. Rychlá referenční karta
  32. Seznam změn
  33. Zdroje

Architektura promptu

Režim „Custom Mode“ v aplikaci Suno rozděluje vaše tvůrčí vstupy do tří polí, z nichž každé slouží k jinému účelu. Pochopení toho, co kam patří (a co ne), je klíčem k rozdílu mezi náhodnými výsledky a konzistentním výstupem.

Pole Style

Pole „Style“ určuje hudební charakter generovaného obsahu. Přijímá popisy v přirozeném jazyce týkající se žánru, nálady, tempa, instrumentace, kvality vokálů a stylu produkce

Optimální vzorec:

[Genre] [Subgenre], [Tempo/Energy], [Key instruments], [Vocal style], [Production quality], [Mood]

Příklad:

Indie folk rock, mid-tempo, acoustic guitar and mandolin, warm female vocals, lo-fi production, nostalgic and wistful

Optimální počet deskriptorů: 4–7. Při méně než 4 má Suno příliš velkou volnost. Při více než 7 si deskriptory začnou navzájem konkurovat, což vede k nejasným výsledkům, kde žádná z vlastností nevynikne jasně

Před a po: na přesnosti zadání záleží

Stejný tvůrčí záměr vede k výrazně odlišným výsledkům v závislosti na přesnosti pole „Styl“:

Nejasný zadávací text
(2 popisné prvky):
rock, energic

Výsledek: Běžný pop-rock se standardními bicími, zkreslenou kytarou a mužským zpěvem, který se automaticky přizpůsobuje rádiovému stylu. Suno vyplňuje všechny neurčené parametry svými nejoblíbenějšími výchozími hodnotami. V deseti generacích se žádné dvě skladby zvukově nepodobají.

Přesný zadávací text
(6 popisných prvků): 
Garage rock, raw and aggressive, distorted bass, room mic drums, shouted male vocals, lo-fi production

Výsledek: Jednotný garážový rock s jasně rozpoznatelným lo-fi charakterem. Bicí znějí, jako by byly nahrány pomocí sálového mikrofonu, basová kytara dominuje a vokály jsou syrové. Všech 10 generací sdílí rozpoznatelnou zvukovou identitu. Rozdíly spočívají v melodii a aranžmá, nikoli v základním charakteru.

Proč ten rozdíl: Každý deskriptor omezuje jednu dimenzi výstupu. Samotný „rock“ ponechává tempo, styl zpěvu, kvalitu produkce, vyvážení nástrojů a náladu zcela na Suno. Přidání „garážového“ omezuje konvence subžánru, „lo-fi produkce“ omezuje zvukovou texturu, „křičící mužský zpěv“ omezuje způsob zpěvu. Model má méně prostoru pro výchozí generické volby.

Příliš podrobný zadávací text
(10 a více popisných prvků):
Garage rock, raw and aggressive, distorted bass, room mic drums, shouted male vocals, lo-fi production, 145 BPM, minor key, reverb-heavy, vintage tube amp warmth, 1960s Detroit influence

Výsledek: Nejasný kompromis. Suno nedokáže splnit všechny požadavky najednou, a tak každý z nich splňuje jen částečně. „Vliv Detroitu 60. let“ může být v rozporu s „145 BPM“ a „silný reverb“ se střetává s „lo-fi produkcí“. Výsledek zní spíše zmateně než konkrétně.

Co funguje v poli Style

Typ popisuPříkladyÚčinek
Žánrrock, jazz, hip-hop, EDM, classical, countryZákladní hudební rámec
Subžánrshoegaze, bossa nova, trap, dubstep, baroqueZpřesňuje žánrové konvence
Temposlow, mid-tempo, upbeat, fast, 120 BPMOvlivňuje rychlost skladby. Hodnoty BPM jsou přibližné, ne přesné.
Nástrojeacoustic guitar, synth pad, brass section, stringsNaznačuje instrumentaci, ale nezaručuje ji
Kvalita vokáluraspy male vocals, ethereal female vocals, choirFormuje charakter zpěvu
Produkcelo-fi, polished, raw, overdriven, cleanUrčuje celkovou zvukovou texturu
Náladamelancholic, euphoric, aggressive, dreamy, darkNastavuje emoční tón
Éra80s, 90s grunge, 2000s pop, vintage, modernPřidává dobové hudební konvence

Co v poli „Style“ nefunguje

  • Konkrétní jména interpretů: „Zní to jako Adele“ je nespolehlivé a může být odfiltrováno. Používejte popisné ekvivalenty: „silný ženský hlas, popová balada s klavírem“
  • Technické termíny týkající se mixování: „Sidechainová komprese na basovém bubnu“ je ignorována. Suno neinterpretuje parametry mixování
  • Přesná kontrola BPM: „127 BPM“ je považováno za přibližný údaj, nikoli za pevnou hodnotu metronomu
  • Negativní pokyny: „Žádné bicí“ v poli Styl je nespolehlivé. Pro nežádoucí nástroje a prvky použijte oficiální pole Vyloučit v pokročilých možnostech, přepínač Instrumentální pro strukturu celé skladby nebo metatagy pro ovládání na úrovni sekcí.

Pole Lyrics - Text

Pole Lyrics přijímá text vaší skladby s volitelnými metatagy pro ovládání struktury. Bez metatagů Suno odvozuje strukturu z konců řádků a vzorců obsahu.

Základní text (bez metatagů):

Walking down the empty road
Headlights fading in the rain
Every mile feels like a year
But I keep driving through the pain

Text s metatagy(doporučeno):

[Verse 1]
Walking down the empty road
Headlights fading in the rain

[Chorus]
Keep driving, keep driving
Through the storm and through the night

[Verse 2]
Every mile feels like a year
But the horizon's getting bright

[Chorus]
Keep driving, keep driving
Through the storm and through the night

[Outro]
And the sun comes up again

Vždy používejte metatagy. Bez nich Suno činí strukturální rozhodnutí, která nemusí odpovídat vašim záměrům. Značka [Chorus] zajišťuje opakování a melodický důraz. Značka [Bridge] signalizuje harmonickou změnu. Tyto strukturální signály výrazně zlepšují konzistenci výsledků.

Pole „Název - Title“ slouží k pojmenování vaší generace. Na výsledný zvuk má jen minimální vliv, ale objevuje se v metadatech a v knihovně Suno. Zvolte popisný název, který vám usnadní orientaci.


Chceš víc?

Buď mým petronem

Prompt Enhancement Helper

Nástroj Prompt Enhancement Helper, který byl představen ve verzi 4.5, je funkce využívající umělou inteligenci, která před generováním textu přepracuje zadání v poli „Styl“. Je-li tato funkce zapnutá, Suno rozvine vaše popisné údaje do podrobnějšího zadání, které model dokáže interpretovat přesněji

Jak to funguje

  1. Zadáte stylový popis: indie rock, energic
  2. Helper jej rozvine například takto: Energetic indie rock, driving electric guitars, punchy drums, dynamic bass, bright and raw production, anthemic and youthful
  3. Suno generuje na základě tohoto rozvinutého popisu, nikoli na základě vašeho původního

Kdy jej použít

Krátké, vágní promptyAnoHelper doplní konkrétnost, kterou jsi nezadal
Zkoušení nového žánruAnoNabídne deskriptory, které možná neznáš
Přesné, detailní prompty (5+ deskriptorů)NeHelper může přepsat nebo rozmělnit tvůj záměr
Opakované použití ověřeného Style promptuNeChceš konzistenci, ne reinterpretaci
Důležité informace
  1. Helper funguje nedeterministicky: při každém spuštění generuje odlišný výstup, a to i při stejném vstupu
  2. Po vygenerování si můžete zobrazit rozbalený prompt, abyste zjistili, jaké deskriptory Suno považovalo za užitečné
  3. Rozbalený prompt je užitečným nástrojem pro učení: vygenerujte jednou pomocí Helperu, přečtěte si rozbalený výstup a poté tyto deskriptory použijte přímo v budoucích promptech bez Helperu
  4. V produkčním prostředí, kde potřebujete mít přesnou kontrolu nad tím, co Suno dostává, tuto funkci deaktivujte

Používejte Helper jako pomůcku k učení, ne jako něco, na co se můžete spoléhat. Z jeho návrhů si vybírejte užitečné popisy, zařazujte je do svého slovníku a přesné pokyny si sestavujte sami. Nejlepších výsledků dosáhnete s pokyny, nad nimiž máte plnou kontrolu.


Popisné prvky žánru a stylu

Suno rozpoznává stovky termínů týkajících se žánrů a stylů. Výzkumy ukazují, že přibližně 86 % trénovacích dat pro hudební modely umělé inteligence pochází ze žánrů severní polokoule, přičemž nástroje jako kytara, klavír a bicí tvoří 52–67 % trénovacích ukázek, zatímco regionální nástroje představují méně než 3 %.21 Přesnost rozpoznání žánru se v přímém důsledku toho liší podle konkrétnosti a kulturního původu.

Žánry s vysokou spolehlivostí (konzistentní výsledky)

Tyto žánry poskytují spolehlivě přesné výsledky, protože jsou v trénovacích datech dobře zastoupeny:

ŽánrEfektivní deskriptoryPoznámky
Poppop, synth-pop, indie pop, dream pop, electropopNejsilnější žánr v Suno. Pokud není zadáno nic konkrétního, výchozí chování často směřuje k popu.
Rockrock, indie rock, alt-rock, classic rock, punk rock, post-punkDobré oddělení nástrojů. Kytarové tóny působí přesvědčivě.
Hip-Hop/Raphip-hop, trap, boom bap, lo-fi hip-hop, conscious rapRapové vokály fungují ve V5 dobře. Flow a delivery lze řídit pomocí formátování lyrics.
Electronic/EDMEDM, house, techno, trance, drum and bass, dubstepSilné ve strukturách build-drop. Synth textury jsou pestré.
R&B/SoulR&B, neo-soul, contemporary R&B, motownHladká kvalita vokálu. Dobré pro groove-based aranže.
Countrycountry, country rock, outlaw country, bluegrassAkustické nástroje jsou dobře vykreslené. Pedal steel a banjo jsou rozpoznatelné.
Folkfolk, indie folk, folk rock, AmericanaZaměření na akustický zvuk. Přirozené vokální styly.
Jazzjazz, smooth jazz, jazzVe V5 výrazně vylepšené. Harmonická komplexita je slyšitelně lepší než ve V4.

Žánry se střední mírou jistoty
(vhodné k použití pod dohledem)

ŽánrEfektivní deskriptoryPoznámky
Metalmetal, heavy metal, death metal, black metal, metalcoreZkreslené kytarové tóny fungují dobře. Extrémní vokály (growls, screams) jsou hit-or-miss.
Classicalclassical, orchestral, chamber music, symphonyDobré pro základní orchestral arrangements. Složitý counterpoint je slabší.
Latinreggaeton, salsa, bossa nova, cumbia, bachataRytmické patterny jsou obecně přesné. Instrument specificity se liší.
Afrobeatsafrobeats, afropop, highlifeZlepšuje se. Rhythm accuracy je ve V5 lepší než ve V4.
K-Pop/J-PopK-pop, J-pop, city popProduction style je rozpoznatelný. Vocal language může výchoze přejít do angličtiny, pokud lyrics neurčí jinak.

Žánry s nízkou spolehlivostí
(vyžadují iterace)

ŽánrEfektivní deskriptoryPoznámky
Microtonal/Avant-gardeavant-garde, experimental, noiseNepředvídatelné. Výsledky jsou kreativní, ale jen zřídka odpovídají záměru.
Traditional/Folk (non-Western)gamelan, raga, Tuvan throat singingOmezená trénovací data. Výsledky jsou spíš aproximace než autentické rekonstrukce.
Sound design/SFXambient drone, soundscapeLépe zvládá Stable Audio. Suno optimalizuje pro strukturu skladby.

Styl vokálů

Charakter vokálů patří k nejlépe nastavitelným aspektům výstupu Suno. Verze V5 výrazně vylepšila přirozenost a expresivitu vokálů.

Vokální deskriptory

DeskriptorEfekt
Gender“male vocals”, “female vocals”, “androgynous vocals”
Tone“warm”, “bright”, “dark”, “rich”, “thin”, “breathy”
Technique“raspy”, “smooth”, “vibrato”, “falsetto”, “belt”, “whisper”
Style“soulful”, “punk”, “operatic”, “conversational”, “spoken word”
Processing“reverb-heavy”, “dry vocals”, “auto-tuned”, “distorted”, “lo-fi”
Harmony“harmonized”, “choir”, “backing vocals”, “vocal layering”

Kombinace hlasových deskriptorů

Pro přesné ovládání použijte 2–3 hlasové deskriptory:

Raspy male vocals with subtle vibrato, lo-fi warmth
Ethereal female vocals, breathy and reverb-heavy, choir harmonies
Deep baritone, smooth jazz delivery, minimal processing

Jazyk a vícejazyčný zpěv

Suno V5 podporuje generování vícejazyčného zpěvu. Model odvodí jazyk z vašich textů. U textů v jiném než anglickém jazyce:

  • Napište text v cílovém jazyce do pole „Lyrics“
  • Volitelně přidejte jazyk do pole „Style“: „Japanese city pop, female vocals“
  • Nejlepších výsledků dosáhnete v angličtině, španělštině, portugalštině, francouzštině, japonštině, korejštině a mandarínštině
  • U méně zastoupených jazyků může dojít k přízvuku nebo nepřesné výslovnosti

 

3. Díl - Metatagy a strukturální tagy

Play The Game RfP 2026

Od 10. do 12. června 2026 se v Městské hudební síni v Hradci Králové uskuteční druhý ročník akce PLAY THE GAME, která se jako doprovodný program festivalu Rock for People 2026 zaměří na hudbu, zvuk a moderní technologie ve videohrách. Program je určen nejen návštěvníkům festivalu, ale také veřejnosti, žákům, studentům i celým školním skupinám. Vstup na akci je zdarma a není nutné mít vstupenku na Rock for People.

Součástí programu bude také workshop „Jak na generování hudby pomocí AI“, kterým návštěvníky provede Petr Chroustovský. Workshop proběhne vždy od 9:00 do 10:00 ve dnech 10., 11. a 12. června 2026 a zaměří se na praktický proces tvorby hudby pomocí umělé inteligence — od prvního nápadu přes práci s promptem až po výslednou skladbu. Petr Chroustovský zde naváže na své zkušenosti z oblasti AI tvorby, digitálního obsahu a hudebního projektu Secrets of Kandahar, kde propojuje synthwave, vizuální storytelling a generativní nástroje.

PLAY THE GAME nabídne silnou sestavu osobností z herního a hudebního prostředí. Programem provází známý herní novinář a moderátor Mikoláš Tuček, vystoupí například Jan Valta, skladatel hudby ke Kingdom Come: Deliverance, Vladimír Šimůnek s tématem hudby ke hře Mafia, Maciej Konstańczak ze studia Flying Wild Hog, Juraj Mravec, Pavel Barák, Jaroslav Konáš, Lukáš Kolek z Charles Games nebo streamer Nikolai Lazarev. Hudební ukázky z Kingdom Come: Deliverance a Mafie navíc zazní přímo na varhany v podání Václava Metoděje Uhlíře.

Play The Game HK
Mikoláš Tuček – moderátor programu
Jan Valta – hudba ke Kingdom Come: Deliverance
Vladimír Šimůnek – hudba ke hře Mafia
Maciej Konstańczak – Flying Wild Hog
Lukáš Kolek – Charles Games
Pavel Barák – GDACZ
Jaroslav Konáš – publicista a hudebně-herní dramaturg
Nikolai Lazarev – streamer
Juraj Mravec – zvuk a hudba ve hrách / Cosmo Tales / Peaky Blinders
Petr Chroustovský – workshop „Jak na generování hudby pomocí AI“

„Obsahuje AI“: Měla by být hudba opatřena štítkem?

Ostrakizace AI

Tato horká debata o označování otevírá mnohem filozofičtější otázku: kde je hranice mezi skutečnou hudbou a umělou? Co vlastně definuje umělou hudbu?

Možná si řeknete: to je snadné – pokud zadáte příkaz a model pro vás něco vygeneruje, je to umělé. Ale je to opravdu tak jednoduché? Co když v procesu použijete pouze jeden nástroj AI – je vaše skladba už tím pádem umělá? Hranice je mnohem rozmazanější, než se zdá.

Myšlenkový experiment

Pro tento experiment odložme stranou naše osobní názory. Představte si svět, ve kterém byla vyřešena klíčová otázka současné AI – autorská práva. Budoucnost, ve které společnosti zabývající se AI našly způsob, jak spravedlivě odměnit každého tvůrce, jehož práce přispívá k výstupu AI. Žádné spory, žádné šedé zóny, jen spravedlivá kompenzace zabudovaná do systému

Nyní se vžijte do role zastánce "skutečné hudby", který je proti jakémukoli využití umělé inteligence v hudbě a umění. Účastníte se živé debaty vysílané po celém světě. Vaším protivníkem je generální ředitel známé společnosti zabývající se umělou inteligencí v hudbě a vy musíte obhájit svou tezi:

Hudba generovaná umělou inteligencí není skutečná hudba a měla by být označena.

Moderátor se na vás obrátí a zeptá se: „Jak definujete, kdy je něco umělé – a musí být označeno?“

Místnost ztichne a všechny oči se upírají na váš další krok. Je řada na vás – vaše následující prohlášení může rozhodnout o všem. Máte několik možností. Pomůžu vám vytvořit neprodyšnou argumentaci.

Začněme od nejintuitivnější myšlenky

Skutečná hudba je skutečná, protože ji vytvořil člověk; hudba vytvořená umělou inteligencí je umělá, protože ji vytvořil model.

Zní to dost jasně – dokud se nezamyslíte nad tím, co „vytvořil“ skutečně znamená.

Pokud interpretujeme tvorbu jako ideu, vaše argumentace se již začíná otřásat. Koneckonců, AI se jednoho rána neprobudí a nerozhodne se složit píseň (pokud ji k tomu nenavedeš). Člověk ji k tomu podnítí – zasadí myšlenku – a model ji provede. Takže i v tomto případě je původcem tvorby stále člověk, a to tvé argumentaci příliš nepomáhá.

Pokud však tvorbu vnímáme jako realizaci, věci se ještě více komplikují. Realizace sama o sobě může mít totiž několik významů:

  • Máme na mysli "vytvoření"? Jako když se skladba zrodí z nápadu a prochází všemi fázemi až k finálnímu masteringu? To by se rychle zkomplikovalo. Podle této logiky by skladba, která byla zcela napsána, zkomponována a produkovaná umělcem, ale masterována pomáhā nástroje jako Ozone, který využívá AI k vyvivážení frekvenčí a vylepšení zvukového spektra, musela být stále označena jako "AI hudba". Takže i kdyby všechna kreativní rozhodnutí pocházela od umělce, jednoducché vylepšení pomáhā AI na konci by ji učinilo umělou. To není příliš pevný základ.
  • Myslíme tím "provedena"? Pokud tím myslíme fyzické vystoupení v reálném čase - někdo, kdo skutečně hrá noty - pak by každá skladba naprogramovaná na softwarových nástrojích byla diskvalifikována. Cokoli nakreslené na MIDI mřížce v Abletonu nebo jakemkoli jiném DAW, bez živého hrání, by se nepočítalo. Podle této logiky se rozlučte s elektronickou hudbou jako Deadmau5 nebo Avicii. To není zrovna kopec, na kterém bychom chtěli zemřít.
  • Myslíme tím "složené"? Pak by každá skladba vytvořená ze vzorků od jiných umělců nesplňovala podmínky skutečné hudby. Útočíte na skladby jako Somebody That I Used to Know (která sama o sobě sestavá ze sedmi různých vzorkovaných skladeb) nebo na celé dědictví hip-hopu.
  • Pokud požadujeme skladbu obsahující samply za "skutečnou", kde pak máme stanovit hranici? Dalo by se argumentovat, že generování pomocí umělé inteligence je prostě pokročilejší formou samplování - jen v mnohem větším měřítku. Umělá inteligence totiž sama o sobě neví, jak zní klavír nebo co definuje žánr. Naučila se to poslechem milionů skladeb vytvořených lidmi. Generování není originální, je to derivát. Zjednodušme to pomocí metafory s jídlem. Susan a Bob pěstují lahodné jahody a banány. Můžete vzít plátky obou a připravit ovocný salát - to je sampling. Nebo můžete jít na trh a koupit si smoothie vyrobené ze stejného ovoce. Chuť je známá, ale směs je jiná. Smoothie neobsahuje pouze ovoce od Susan a Boba, ale také kousky od nespočtu dalších producentu, které jsou tak jemně smíchány, že při každém doušku nepoznáte, čí ovoce právě ochutnáváte. Přesto jsou ingredience stále stejné a všechny jsou vytvořené lidmi - to je hudba generována umělou inteligencí. Začíná to být složité, že?

 

Zdravé ovoce a smoothie - jahody, banán a nápoj - ilustrace

To, co máme, stále nestačí k tomu, abychom mohli rozlišit mezi skutečnou a umělou hudbou, pokud nejsme ochotni začít označovat většinu mistrovských děl „skutečné“ hudby také za umělá.

Zkusme to z jiného úhlu:

Skutečná hudba vyžaduje dovednosti. Do generování hudby pomocí umělé inteligence nejsou vloženy žádné dovednosti, proto je umělá.

To je pravda – ale tato debata je stará jako umění samo. Její nejznámější varianta se vyskytuje ve výtvarném umění: lze plátno s jedním tahem štětcem považovat za umění stejně jako detailní obraz Velásqueze?

VLEVO: Diego Velázquez, Las Meninas - Dvorní dámy (1656). Autorská práva: Public domain 
VPRAVO: Mareike Böhmer, Black Strokes (nd). Copyright: Mareike Böhmer

Názory se liší – někteří říkají: „To bych dokázal i já a nazval bych to uměním“, jako by hodnota tvorby závisela na viditelném úsilí nebo technických dovednostech. Jiní to vidí jinak – smysl nevidí v tom, jak těžké bylo dílo vytvořit, ale v tom, jaké pocity v nich vyvolává – a věří tomu natolik, že jsou ochotni cestovat po světě, aby viděli tato umělecká díla vystavená v muzeích moderního umění.

V hudbě někteří hudebníci tráví roky studiem nástroje, hodiny zdokonalím svého umění a dokonce měsíce tvarováním jedné jediné skladby, ale výsledek je na stejné úrovni jako něco, co vzniklo za 10 minut s objektivně mnohem menším nasazením - virtuozní Rachmaninovuv klavirní koncert na polici vedle repetitivního techno kick drum na zvukové kulise a trapový beat stažený z YouTube, nad kterým někdo mluví s Auto-Tune. Proč tomu tak je? Pro různé uši je každá z těchto skladeb skutečnou hudbou, bez ohledu na dovednosti, které za ní stojí. Samotná dovednost tedy nemůže definovat, co je "skutečné".

Opakuji, to, co máme, stále nestačí k tomu, abychom mohli rozlišit mezi skutečnou a umělou hudbou, pokud nejsme ochotni začít označovat většinu mistrovských děl „skutečné“ hudby také za umělá.

Čas běží

Docházejí vám možnosti a stále jste v debatní místnosti. Nastalo ticho. Uvědomujete si, že to není tak snadné, jak jste si mysleli. Zpanikaříte a rozhodnete se zdvojnásobit své předchozí argumenty v naději, že jeden z nich zabere. Jak se dalo očekávat, váš oponent (samozřejmě s pomocí svého AI asistenta v uchu) jeden po druhém vyvrací oba vaše argumenty. Jste zpátky na začátku. A v tomto okamžiku je jasné, že jakmile začnete rozebírat, skutečné a umělé nejsou dvě protilehlé strany jedné linie – jsou to body na spektru, které se čím více snažíte definovat, tím více se posouvají.

Pak se někdo z publika postaví.

Promiňte, nechci rušit… možná by rozlišení nemělo být o nástrojích, které umělci používají, ale o záměru, který za nimi stojí. Koneckonců, napsat jeden řádek a nechat AI udělat zbytek není nijak zvlášť kreativní – ale stejně tak není kreativní například ruční vytváření skladeb, které kopírují zvuk jiného umělce. Oba technicky produkují hudbu, ale mají nějaký význam?

Vy a váš oponent ztuhnete. Celou debatu jste strávili posedlí tím, co je skutečné a co umělé, ale možná pravda spočívá v samotné definici hudby.

Definice hudby byla vždy předmětem debat. Encyklopedie  Britannica ji popisuje jako umění zabývající se kombinací vokálních nebo instrumentálních zvuků za účelem dosahování krásy formy nebo emocionálního vyjadřování". The Concise Oxford Dictionary ji definuje jako "umění kombinovat vokální nebo instrumentální zvuky (nebo obojí) za účelem vytvoření krásy formy, harmonie a vyjádření emocí". Cambridge Dictionary má širší pohled a definuje ji jako "vzor zvuků vytvářených hudebními nástroji, hlasy nebo počítači, případně jejich kombinací". Zařazení počítačů mezi nástroje je malým, ale výmluvným znamením toho, jak se tvorba vyvíjí.

Možná tedy skutečná otázka nezní, kdo nebo co hudbu vytváří, ale proč je vytvářena a jaké pocity v nás vyvolává. Skutečná hudba nemusí být definována tím, zda je vytvořena člověkem, algoritmem nebo obojím, ale tím, jak na nás působí.

Možná tedy skutečná otázka nezní, kdo nebo co hudbu vytváří, ale proč je vytvářena a jaké pocity v nás vyvolává. Skutečná hudba nemusí být definována tím, zda je vytvořena člověkem, algoritmem nebo obojím, ale záměrem a emocemi, které za ní stojí – věcmi, které jsou lidé schopni vnímat a na které reagovat.

 

A právě proto by se umělci neměli cítit ohroženi umělou inteligencí. Hodnota jejich práce nikdy nezávisela na nástrojích, které používají, ale na emocích, které dokážou převést do zvuku, a na tom, jak tento zvuk působí na lidi. Pocity, které vkládají do své hudby, lidskost, která vibruje v každé notě, vždy přesáhnou jakoukoli technologii, která jim pomáhá ji utvářet.

Na závěr

Vraťme se k otázce, kterou jsme si položili na začátku: měla by být hudba opatřena štítkem?

Pokud to posluchači chtějí, proč ne. Ale jak jste již asi pochopili, klasifikace hudby jako AI nebo ne-AI neříká o písni celou pravdu. Určitě můžeme vtlačit kouli do čtvercového otvoru (chápete, co tím myslím?) – ale nepředstírejme, že to je tvar, pro který byla určena. Píseň může zahrnovat AI při jejím psaní, produkci, masteringu, nebo vůbec, a každý případ se nachází někde jinde na spektru použití. To, co by opravdu dávalo smysl, není binární označení (AI nebo ne AI), ale multidimenzionální označení – takové, které zachycuje, jak a do jaké míry hrála AI roli v tvůrčím procesu.

A možná je skutečnou otázkou, kterou si musíme položit, „kdybychom měli štítek, co by nám vlastně sděloval?“

Když je na potravině uvedeno „obsahuje přísady“, okamžitě to interpretujeme jako varování – znamení něčeho méně přírodního, méně čistého. Ale má „obsahuje AI“ stejný význam? Naznačuje to, že hudba je nějakým způsobem zkažená, nebo prostě vytvořená jinými prostředky?

Každý z nás na to bude mít jinou odpověď.

Můj názor je, že hudba se nakonec vždy vyvíjela společně se svými nástroji. Model AI vám může pomoci v tvůrčím procesu, ale za obrazovkou jste stále vy – řídíte jej, děláte rozhodnutí a vyjadřujete podstatu lidství.

Možná, pokud to ve vás vyvolává pocity, je to skutečné.

Myslíte si, že byste mohli přijít s argumentem, který by byl dostatečně silný, aby vyhrál tuto debatu? Jsem zvědavý – napište mi to do komentářů.

Překlad článku od Edoardo Pachera