Suno návod česky - 2. díl: Prompt Engineering

Suno v5.5 - 2 .díl: Prompt Engineering

2. Návod na Suno česky

# Meta tagy, [no vocals], style-of-music pole, MILO-1080 sekvencer, a syntaxe promptu - výzvy.

Prompt Engineering

V minulém díle jsme si ukázali, co obecně Suno je, co umí a co ne a jak se s ním má pracovat. V pokračování se zaměříme na prompt engeneering, architekturu promptu. Podívejme se, jak v režimu Custom Mode přesně řídit styl, text, strukturu i výsledný charakter skladby. Vysvětluje práci s metatagy, kreativními posuvníky, vokálními deskriptory, vícejazyčným zpěvem a produkčním workflow. Důraz klade na iteraci, správné členění promptu a používání konkrétních hudebních popisů místo obecných zadání.

Rychlé menu

Co je Suno
Začínáme
Modely a verze
Ceny a kredity
Architektura promptu
Pomocník pro vylepšení promptu
Popisy žánrů a stylů
Stylování vokálů
Instrumentální režim
Přehled metatagů
Strukturální tagy
Instrumentální a vokální tagy
Pokročilé vzory metatagů
Creativní slajdry
Editor skladeb
Covery a remixy
Voices
My Taste v5.5
Generační smyčka
Suno Studio DAW
Separace stemů a export
Integrace s DAW
Míchání žánrů
Vícesekční kompozice
Řetězení promptů
Řešení problémů
Komerční licence
Autorské právo a právní souvislosti
Konkurenti a alternativy
Stav API a integrací
Rychlá referenční karta
Seznam změn
Zdroje

Architektura promptu

Režim „Custom Mode“ v aplikaci Suno rozděluje vaše tvůrčí vstupy do tří polí, z nichž každé slouží k jinému účelu. Pochopení toho, co kam patří (a co ne), je klíčem k rozdílu mezi náhodnými výsledky a konzistentním výstupem.

Pole Style

Pole „Style“ určuje hudební charakter generovaného obsahu. Přijímá popisy v přirozeném jazyce týkající se žánru, nálady, tempa, instrumentace, kvality vokálů a stylu produkce

Optimální vzorec:

[Genre] [Subgenre], [Tempo/Energy], [Key instruments], [Vocal style], [Production quality], [Mood]

Příklad:

Indie folk rock, mid-tempo, acoustic guitar and mandolin, warm female vocals, lo-fi production, nostalgic and wistful

Optimální počet deskriptorů: 4–7. Při méně než 4 má Suno příliš velkou volnost. Při více než 7 si deskriptory začnou navzájem konkurovat, což vede k nejasným výsledkům, kde žádná z vlastností nevynikne jasně

Před a po: na přesnosti zadání záleží

Stejný tvůrčí záměr vede k výrazně odlišným výsledkům v závislosti na přesnosti pole „Styl“:

Nejasný zadávací text
(2 popisné prvky):

rock, energic

Výsledek: Běžný pop-rock se standardními bicími, zkreslenou kytarou a mužským zpěvem, který se automaticky přizpůsobuje rádiovému stylu. Suno vyplňuje všechny neurčené parametry svými nejoblíbenějšími výchozími hodnotami. V deseti generacích se žádné dvě skladby zvukově nepodobají.

Přesný zadávací text
(6 popisných prvků):

Garage rock, raw and aggressive, distorted bass, room mic drums, shouted male vocals, lo-fi production

Výsledek: Jednotný garážový rock s jasně rozpoznatelným lo-fi charakterem. Bicí znějí, jako by byly nahrány pomocí sálového mikrofonu, basová kytara dominuje a vokály jsou syrové. Všech 10 generací sdílí rozpoznatelnou zvukovou identitu. Rozdíly spočívají v melodii a aranžmá, nikoli v základním charakteru.

Proč ten rozdíl: Každý deskriptor omezuje jednu dimenzi výstupu. Samotný „rock“ ponechává tempo, styl zpěvu, kvalitu produkce, vyvážení nástrojů a náladu zcela na Suno. Přidání „garážového“ omezuje konvence subžánru, „lo-fi produkce“ omezuje zvukovou texturu, „křičící mužský zpěv“ omezuje způsob zpěvu. Model má méně prostoru pro výchozí generické volby.

Příliš podrobný zadávací text
(10 a více popisných prvků):

Garage rock, raw and aggressive, distorted bass, room mic drums, shouted male vocals, lo-fi production, 145 BPM, minor key, reverb-heavy, vintage tube amp warmth, 1960s Detroit influence

Výsledek: Nejasný kompromis. Suno nedokáže splnit všechny požadavky najednou, a tak každý z nich splňuje jen částečně. „Vliv Detroitu 60. let“ může být v rozporu s „145 BPM“ a „silný reverb“ se střetává s „lo-fi produkcí“. Výsledek zní spíše zmateně než konkrétně.

Co funguje v poli Style

Typ popisu	Příklady	Účinek
Žánr	rock, jazz, hip-hop, EDM, classical, country	Základní hudební rámec
Subžánr	shoegaze, bossa nova, trap, dubstep, baroque	Zpřesňuje žánrové konvence
Tempo	slow, mid-tempo, upbeat, fast, 120 BPM	Ovlivňuje rychlost skladby. Hodnoty BPM jsou přibližné, ne přesné.
Nástroje	acoustic guitar, synth pad, brass section, strings	Naznačuje instrumentaci, ale nezaručuje ji
Kvalita vokálu	raspy male vocals, ethereal female vocals, choir	Formuje charakter zpěvu
Produkce	lo-fi, polished, raw, overdriven, clean	Určuje celkovou zvukovou texturu
Nálada	melancholic, euphoric, aggressive, dreamy, dark	Nastavuje emoční tón
Éra	80s, 90s grunge, 2000s pop, vintage, modern	Přidává dobové hudební konvence

Co v poli „Style“ nefunguje

Konkrétní jména interpretů: „Zní to jako Adele“ je nespolehlivé a může být odfiltrováno. Používejte popisné ekvivalenty: „silný ženský hlas, popová balada s klavírem“
Technické termíny týkající se mixování: „Sidechainová komprese na basovém bubnu“ je ignorována. Suno neinterpretuje parametry mixování
Přesná kontrola BPM: „127 BPM“ je považováno za přibližný údaj, nikoli za pevnou hodnotu metronomu
Negativní pokyny: „Žádné bicí“ v poli Styl je nespolehlivé. Pro nežádoucí nástroje a prvky použijte oficiální pole Vyloučit v pokročilých možnostech, přepínač Instrumentální pro strukturu celé skladby nebo metatagy pro ovládání na úrovni sekcí.

Pole Lyrics - Text

Pole Lyrics přijímá text vaší skladby s volitelnými metatagy pro ovládání struktury. Bez metatagů Suno odvozuje strukturu z konců řádků a vzorců obsahu.

Základní text (bez metatagů):

Walking down the empty road
Headlights fading in the rain
Every mile feels like a year
But I keep driving through the pain

Text s metatagy(doporučeno):

[Verse 1]
Walking down the empty road
Headlights fading in the rain
[Chorus]
Keep driving, keep driving
Through the storm and through the night
[Verse 2]
Every mile feels like a year
But the horizon's getting bright
[Chorus]
Keep driving, keep driving
Through the storm and through the night
[Outro]
And the sun comes up again

Vždy používejte metatagy. Bez nich Suno činí strukturální rozhodnutí, která nemusí odpovídat vašim záměrům. Značka [Chorus] zajišťuje opakování a melodický důraz. Značka [Bridge] signalizuje harmonickou změnu. Tyto strukturální signály výrazně zlepšují konzistenci výsledků.

Pole „Název - Title“ slouží k pojmenování vaší generace. Na výsledný zvuk má jen minimální vliv, ale objevuje se v metadatech a v knihovně Suno. Zvolte popisný název, který vám usnadní orientaci.

Chceš víc?

Buď mým petronem

Prompt Enhancement Helper

Nástroj Prompt Enhancement Helper, který byl představen ve verzi 4.5, je funkce využívající umělou inteligenci, která před generováním textu přepracuje zadání v poli „Styl“. Je-li tato funkce zapnutá, Suno rozvine vaše popisné údaje do podrobnějšího zadání, které model dokáže interpretovat přesněji

Jak to funguje

Zadáte stylový popis: indie rock, energic
Helper jej rozvine například takto: Energetic indie rock, driving electric guitars, punchy drums, dynamic bass, bright and raw production, anthemic and youthful
Suno generuje na základě tohoto rozvinutého popisu, nikoli na základě vašeho původního

Kdy jej použít

Krátké, vágní prompty	Ano	Helper doplní konkrétnost, kterou jsi nezadal
Zkoušení nového žánru	Ano	Nabídne deskriptory, které možná neznáš
Přesné, detailní prompty (5+ deskriptorů)	Ne	Helper může přepsat nebo rozmělnit tvůj záměr
Opakované použití ověřeného Style promptu	Ne	Chceš konzistenci, ne reinterpretaci

Důležité informace

Helper funguje nedeterministicky: při každém spuštění generuje odlišný výstup, a to i při stejném vstupu
Po vygenerování si můžete zobrazit rozbalený prompt, abyste zjistili, jaké deskriptory Suno považovalo za užitečné
Rozbalený prompt je užitečným nástrojem pro učení: vygenerujte jednou pomocí Helperu, přečtěte si rozbalený výstup a poté tyto deskriptory použijte přímo v budoucích promptech bez Helperu
V produkčním prostředí, kde potřebujete mít přesnou kontrolu nad tím, co Suno dostává, tuto funkci deaktivujte

Používejte Helper jako pomůcku k učení, ne jako něco, na co se můžete spoléhat. Z jeho návrhů si vybírejte užitečné popisy, zařazujte je do svého slovníku a přesné pokyny si sestavujte sami. Nejlepších výsledků dosáhnete s pokyny, nad nimiž máte plnou kontrolu.

Popisné prvky žánru a stylu

Suno rozpoznává stovky termínů týkajících se žánrů a stylů. Výzkumy ukazují, že přibližně 86 % trénovacích dat pro hudební modely umělé inteligence pochází ze žánrů severní polokoule, přičemž nástroje jako kytara, klavír a bicí tvoří 52–67 % trénovacích ukázek, zatímco regionální nástroje představují méně než 3 %.21 Přesnost rozpoznání žánru se v přímém důsledku toho liší podle konkrétnosti a kulturního původu.

Žánry s vysokou spolehlivostí (konzistentní výsledky)

Tyto žánry poskytují spolehlivě přesné výsledky, protože jsou v trénovacích datech dobře zastoupeny:

Žánr	Efektivní deskriptory	Poznámky
Pop	pop, synth-pop, indie pop, dream pop, electropop	Nejsilnější žánr v Suno. Pokud není zadáno nic konkrétního, výchozí chování často směřuje k popu.
Rock	rock, indie rock, alt-rock, classic rock, punk rock, post-punk	Dobré oddělení nástrojů. Kytarové tóny působí přesvědčivě.
Hip-Hop/Rap	hip-hop, trap, boom bap, lo-fi hip-hop, conscious rap	Rapové vokály fungují ve V5 dobře. Flow a delivery lze řídit pomocí formátování lyrics.
Electronic/EDM	EDM, house, techno, trance, drum and bass, dubstep	Silné ve strukturách build-drop. Synth textury jsou pestré.
R&B/Soul	R&B, neo-soul, contemporary R&B, motown	Hladká kvalita vokálu. Dobré pro groove-based aranže.
Country	country, country rock, outlaw country, bluegrass	Akustické nástroje jsou dobře vykreslené. Pedal steel a banjo jsou rozpoznatelné.
Folk	folk, indie folk, folk rock, Americana	Zaměření na akustický zvuk. Přirozené vokální styly.
Jazz	jazz, smooth jazz, jazz	Ve V5 výrazně vylepšené. Harmonická komplexita je slyšitelně lepší než ve V4.

Žánry se střední mírou jistoty
(vhodné k použití pod dohledem)

Žánr	Efektivní deskriptory	Poznámky
Metal	metal, heavy metal, death metal, black metal, metalcore	Zkreslené kytarové tóny fungují dobře. Extrémní vokály (growls, screams) jsou hit-or-miss.
Classical	classical, orchestral, chamber music, symphony	Dobré pro základní orchestral arrangements. Složitý counterpoint je slabší.
Latin	reggaeton, salsa, bossa nova, cumbia, bachata	Rytmické patterny jsou obecně přesné. Instrument specificity se liší.
Afrobeats	afrobeats, afropop, highlife	Zlepšuje se. Rhythm accuracy je ve V5 lepší než ve V4.
K-Pop/J-Pop	K-pop, J-pop, city pop	Production style je rozpoznatelný. Vocal language může výchoze přejít do angličtiny, pokud lyrics neurčí jinak.

Žánry s nízkou spolehlivostí
(vyžadují iterace)

Žánr	Efektivní deskriptory	Poznámky
Microtonal/Avant-garde	avant-garde, experimental, noise	Nepředvídatelné. Výsledky jsou kreativní, ale jen zřídka odpovídají záměru.
Traditional/Folk (non-Western)	gamelan, raga, Tuvan throat singing	Omezená trénovací data. Výsledky jsou spíš aproximace než autentické rekonstrukce.
Sound design/SFX	ambient drone, soundscape	Lépe zvládá Stable Audio. Suno optimalizuje pro strukturu skladby.

Styl vokálů

Charakter vokálů patří k nejlépe nastavitelným aspektům výstupu Suno. Verze V5 výrazně vylepšila přirozenost a expresivitu vokálů.

Vokální deskriptory

Deskriptor	Efekt
Gender	“male vocals”, “female vocals”, “androgynous vocals”
Tone	“warm”, “bright”, “dark”, “rich”, “thin”, “breathy”
Technique	“raspy”, “smooth”, “vibrato”, “falsetto”, “belt”, “whisper”
Style	“soulful”, “punk”, “operatic”, “conversational”, “spoken word”
Processing	“reverb-heavy”, “dry vocals”, “auto-tuned”, “distorted”, “lo-fi”
Harmony	“harmonized”, “choir”, “backing vocals”, “vocal layering”

Kombinace hlasových deskriptorů

Pro přesné ovládání použijte 2–3 hlasové deskriptory:

Raspy male vocals with subtle vibrato, lo-fi warmth

Ethereal female vocals, breathy and reverb-heavy, choir harmonies

Deep baritone, smooth jazz delivery, minimal processing

Jazyk a vícejazyčný zpěv

Suno V5 podporuje generování vícejazyčného zpěvu. Model odvodí jazyk z vašich textů. U textů v jiném než anglickém jazyce:

Napište text v cílovém jazyce do pole „Lyrics“
Volitelně přidejte jazyk do pole „Style“: „Japanese city pop, female vocals“
Nejlepších výsledků dosáhnete v angličtině, španělštině, portugalštině, francouzštině, japonštině, korejštině a mandarínštině
U méně zastoupených jazyků může dojít k přízvuku nebo nepřesné výslovnosti

3. Díl - Metatagy a strukturální tagy

Play The Game RfP 2026

Od 10. do 12. června 2026 se v Městské hudební síni v Hradci Králové uskuteční druhý ročník akce PLAY THE GAME, která se jako doprovodný program festivalu Rock for People 2026 zaměří na hudbu, zvuk a moderní technologie ve videohrách. Program je určen nejen návštěvníkům festivalu, ale také veřejnosti, žákům, studentům i celým školním skupinám. Vstup na akci je zdarma a není nutné mít vstupenku na Rock for People.

Součástí programu bude také workshop „Jak na generování hudby pomocí AI“, kterým návštěvníky provede Petr Chroustovský. Workshop proběhne vždy od 9:00 do 10:00 ve dnech 10., 11. a 12. června 2026 a zaměří se na praktický proces tvorby hudby pomocí umělé inteligence — od prvního nápadu přes práci s promptem až po výslednou skladbu. Petr Chroustovský zde naváže na své zkušenosti z oblasti AI tvorby, digitálního obsahu a hudebního projektu Secrets of Kandahar, kde propojuje synthwave, vizuální storytelling a generativní nástroje.

PLAY THE GAME nabídne silnou sestavu osobností z herního a hudebního prostředí. Programem provází známý herní novinář a moderátor Mikoláš Tuček, vystoupí například Jan Valta, skladatel hudby ke Kingdom Come: Deliverance, Vladimír Šimůnek s tématem hudby ke hře Mafia, Maciej Konstańczak ze studia Flying Wild Hog, Juraj Mravec, Pavel Barák, Jaroslav Konáš, Lukáš Kolek z Charles Games nebo streamer Nikolai Lazarev. Hudební ukázky z Kingdom Come: Deliverance a Mafie navíc zazní přímo na varhany v podání Václava Metoděje Uhlíře.

Mikoláš Tuček – moderátor programu
Jan Valta – hudba ke Kingdom Come: Deliverance
Vladimír Šimůnek – hudba ke hře Mafia
Maciej Konstańczak – Flying Wild Hog
Lukáš Kolek – Charles Games
Pavel Barák – GDACZ
Jaroslav Konáš – publicista a hudebně-herní dramaturg
Nikolai Lazarev – streamer
Juraj Mravec – zvuk a hudba ve hrách / Cosmo Tales / Peaky Blinders
Petr Chroustovský – workshop „Jak na generování hudby pomocí AI“

Fake Band - Contains AI - hudební CD s označením umělé inteligence

„Obsahuje AI“: Měla by být hudba opatřena štítkem?

Ostrakizace AI

Tato horká debata o označování otevírá mnohem filozofičtější otázku: kde je hranice mezi skutečnou hudbou a umělou? Co vlastně definuje umělou hudbu?

Možná si řeknete: to je snadné – pokud zadáte příkaz a model pro vás něco vygeneruje, je to umělé. Ale je to opravdu tak jednoduché? Co když v procesu použijete pouze jeden nástroj AI – je vaše skladba už tím pádem umělá? Hranice je mnohem rozmazanější, než se zdá.

Myšlenkový experiment

Pro tento experiment odložme stranou naše osobní názory. Představte si svět, ve kterém byla vyřešena klíčová otázka současné AI – autorská práva. Budoucnost, ve které společnosti zabývající se AI našly způsob, jak spravedlivě odměnit každého tvůrce, jehož práce přispívá k výstupu AI. Žádné spory, žádné šedé zóny, jen spravedlivá kompenzace zabudovaná do systému

Nyní se vžijte do role zastánce "skutečné hudby", který je proti jakémukoli využití umělé inteligence v hudbě a umění. Účastníte se živé debaty vysílané po celém světě. Vaším protivníkem je generální ředitel známé společnosti zabývající se umělou inteligencí v hudbě a vy musíte obhájit svou tezi:

Hudba generovaná umělou inteligencí není skutečná hudba a měla by být označena.

Moderátor se na vás obrátí a zeptá se: „Jak definujete, kdy je něco umělé – a musí být označeno?“

Místnost ztichne a všechny oči se upírají na váš další krok. Je řada na vás – vaše následující prohlášení může rozhodnout o všem. Máte několik možností. Pomůžu vám vytvořit neprodyšnou argumentaci.

Začněme od nejintuitivnější myšlenky

Skutečná hudba je skutečná, protože ji vytvořil člověk; hudba vytvořená umělou inteligencí je umělá, protože ji vytvořil model.

Zní to dost jasně – dokud se nezamyslíte nad tím, co „vytvořil“ skutečně znamená.

Pokud interpretujeme tvorbu jako ideu, vaše argumentace se již začíná otřásat. Koneckonců, AI se jednoho rána neprobudí a nerozhodne se složit píseň (pokud ji k tomu nenavedeš). Člověk ji k tomu podnítí – zasadí myšlenku – a model ji provede. Takže i v tomto případě je původcem tvorby stále člověk, a to tvé argumentaci příliš nepomáhá.

Pokud však tvorbu vnímáme jako realizaci, věci se ještě více komplikují. Realizace sama o sobě může mít totiž několik významů:

Máme na mysli "vytvoření"? Jako když se skladba zrodí z nápadu a prochází všemi fázemi až k finálnímu masteringu? To by se rychle zkomplikovalo. Podle této logiky by skladba, která byla zcela napsána, zkomponována a produkovaná umělcem, ale masterována pomáhā nástroje jako Ozone, který využívá AI k vyvivážení frekvenčí a vylepšení zvukového spektra, musela být stále označena jako "AI hudba". Takže i kdyby všechna kreativní rozhodnutí pocházela od umělce, jednoducché vylepšení pomáhā AI na konci by ji učinilo umělou. To není příliš pevný základ.
Myslíme tím "provedena"? Pokud tím myslíme fyzické vystoupení v reálném čase - někdo, kdo skutečně hrá noty - pak by každá skladba naprogramovaná na softwarových nástrojích byla diskvalifikována. Cokoli nakreslené na MIDI mřížce v Abletonu nebo jakemkoli jiném DAW, bez živého hrání, by se nepočítalo. Podle této logiky se rozlučte s elektronickou hudbou jako Deadmau5 nebo Avicii. To není zrovna kopec, na kterém bychom chtěli zemřít.
Myslíme tím "složené"? Pak by každá skladba vytvořená ze vzorků od jiných umělců nesplňovala podmínky skutečné hudby. Útočíte na skladby jako Somebody That I Used to Know (která sama o sobě sestavá ze sedmi různých vzorkovaných skladeb) nebo na celé dědictví hip-hopu.
Pokud požadujeme skladbu obsahující samply za "skutečnou", kde pak máme stanovit hranici? Dalo by se argumentovat, že generování pomocí umělé inteligence je prostě pokročilejší formou samplování - jen v mnohem větším měřítku. Umělá inteligence totiž sama o sobě neví, jak zní klavír nebo co definuje žánr. Naučila se to poslechem milionů skladeb vytvořených lidmi. Generování není originální, je to derivát. Zjednodušme to pomocí metafory s jídlem. Susan a Bob pěstují lahodné jahody a banány. Můžete vzít plátky obou a připravit ovocný salát - to je sampling. Nebo můžete jít na trh a koupit si smoothie vyrobené ze stejného ovoce. Chuť je známá, ale směs je jiná. Smoothie neobsahuje pouze ovoce od Susan a Boba, ale také kousky od nespočtu dalších producentu, které jsou tak jemně smíchány, že při každém doušku nepoznáte, čí ovoce právě ochutnáváte. Přesto jsou ingredience stále stejné a všechny jsou vytvořené lidmi - to je hudba generována umělou inteligencí. Začíná to být složité, že?

Zdravé ovoce a smoothie - jahody, banán a nápoj - ilustrace

To, co máme, stále nestačí k tomu, abychom mohli rozlišit mezi skutečnou a umělou hudbou, pokud nejsme ochotni začít označovat většinu mistrovských děl „skutečné“ hudby také za umělá.

Zkusme to z jiného úhlu:

Skutečná hudba vyžaduje dovednosti. Do generování hudby pomocí umělé inteligence nejsou vloženy žádné dovednosti, proto je umělá.

To je pravda – ale tato debata je stará jako umění samo. Její nejznámější varianta se vyskytuje ve výtvarném umění: lze plátno s jedním tahem štětcem považovat za umění stejně jako detailní obraz Velásqueze?

Las Meninas - Diego Velázquez 1656 - slavný španělský barokní obraz

Abstraktní černo-bílý obraz Black Strokes - Mareike Böhmer

VLEVO: Diego Velázquez, Las Meninas - Dvorní dámy (1656). Autorská práva: Public domain
VPRAVO: Mareike Böhmer, Black Strokes (nd). Copyright: Mareike Böhmer

Názory se liší – někteří říkají: „To bych dokázal i já a nazval bych to uměním“, jako by hodnota tvorby závisela na viditelném úsilí nebo technických dovednostech. Jiní to vidí jinak – smysl nevidí v tom, jak těžké bylo dílo vytvořit, ale v tom, jaké pocity v nich vyvolává – a věří tomu natolik, že jsou ochotni cestovat po světě, aby viděli tato umělecká díla vystavená v muzeích moderního umění.

V hudbě někteří hudebníci tráví roky studiem nástroje, hodiny zdokonalím svého umění a dokonce měsíce tvarováním jedné jediné skladby, ale výsledek je na stejné úrovni jako něco, co vzniklo za 10 minut s objektivně mnohem menším nasazením - virtuozní Rachmaninovuv klavirní koncert na polici vedle repetitivního techno kick drum na zvukové kulise a trapový beat stažený z YouTube, nad kterým někdo mluví s Auto-Tune. Proč tomu tak je? Pro různé uši je každá z těchto skladeb skutečnou hudbou, bez ohledu na dovednosti, které za ní stojí. Samotná dovednost tedy nemůže definovat, co je "skutečné".

Opakuji, to, co máme, stále nestačí k tomu, abychom mohli rozlišit mezi skutečnou a umělou hudbou, pokud nejsme ochotni začít označovat většinu mistrovských děl „skutečné“ hudby také za umělá.

Čas běží

Docházejí vám možnosti a stále jste v debatní místnosti. Nastalo ticho. Uvědomujete si, že to není tak snadné, jak jste si mysleli. Zpanikaříte a rozhodnete se zdvojnásobit své předchozí argumenty v naději, že jeden z nich zabere. Jak se dalo očekávat, váš oponent (samozřejmě s pomocí svého AI asistenta v uchu) jeden po druhém vyvrací oba vaše argumenty. Jste zpátky na začátku. A v tomto okamžiku je jasné, že jakmile začnete rozebírat, skutečné a umělé nejsou dvě protilehlé strany jedné linie – jsou to body na spektru, které se čím více snažíte definovat, tím více se posouvají.

Pak se někdo z publika postaví.

Promiňte, nechci rušit… možná by rozlišení nemělo být o nástrojích, které umělci používají, ale o záměru, který za nimi stojí. Koneckonců, napsat jeden řádek a nechat AI udělat zbytek není nijak zvlášť kreativní – ale stejně tak není kreativní například ruční vytváření skladeb, které kopírují zvuk jiného umělce. Oba technicky produkují hudbu, ale mají nějaký význam?

Vy a váš oponent ztuhnete. Celou debatu jste strávili posedlí tím, co je skutečné a co umělé, ale možná pravda spočívá v samotné definici hudby.

Definice hudby byla vždy předmětem debat. Encyklopedie Britannica ji popisuje jako umění zabývající se kombinací vokálních nebo instrumentálních zvuků za účelem dosahování krásy formy nebo emocionálního vyjadřování". The Concise Oxford Dictionary ji definuje jako "umění kombinovat vokální nebo instrumentální zvuky (nebo obojí) za účelem vytvoření krásy formy, harmonie a vyjádření emocí". Cambridge Dictionary má širší pohled a definuje ji jako "vzor zvuků vytvářených hudebními nástroji, hlasy nebo počítači, případně jejich kombinací". Zařazení počítačů mezi nástroje je malým, ale výmluvným znamením toho, jak se tvorba vyvíjí.

Možná tedy skutečná otázka nezní, kdo nebo co hudbu vytváří, ale proč je vytvářena a jaké pocity v nás vyvolává. Skutečná hudba nemusí být definována tím, zda je vytvořena člověkem, algoritmem nebo obojím, ale tím, jak na nás působí.

A právě proto by se umělci neměli cítit ohroženi umělou inteligencí. Hodnota jejich práce nikdy nezávisela na nástrojích, které používají, ale na emocích, které dokážou převést do zvuku, a na tom, jak tento zvuk působí na lidi. Pocity, které vkládají do své hudby, lidskost, která vibruje v každé notě, vždy přesáhnou jakoukoli technologii, která jim pomáhá ji utvářet.

Na závěr

Vraťme se k otázce, kterou jsme si položili na začátku: měla by být hudba opatřena štítkem?

Pokud to posluchači chtějí, proč ne. Ale jak jste již asi pochopili, klasifikace hudby jako AI nebo ne-AI neříká o písni celou pravdu. Určitě můžeme vtlačit kouli do čtvercového otvoru (chápete, co tím myslím?) – ale nepředstírejme, že to je tvar, pro který byla určena. Píseň může zahrnovat AI při jejím psaní, produkci, masteringu, nebo vůbec, a každý případ se nachází někde jinde na spektru použití. To, co by opravdu dávalo smysl, není binární označení (AI nebo ne AI), ale multidimenzionální označení – takové, které zachycuje, jak a do jaké míry hrála AI roli v tvůrčím procesu.

A možná je skutečnou otázkou, kterou si musíme položit, „kdybychom měli štítek, co by nám vlastně sděloval?“

Když je na potravině uvedeno „obsahuje přísady“, okamžitě to interpretujeme jako varování – znamení něčeho méně přírodního, méně čistého. Ale má „obsahuje AI“ stejný význam? Naznačuje to, že hudba je nějakým způsobem zkažená, nebo prostě vytvořená jinými prostředky?

Každý z nás na to bude mít jinou odpověď.

Můj názor je, že hudba se nakonec vždy vyvíjela společně se svými nástroji. Model AI vám může pomoci v tvůrčím procesu, ale za obrazovkou jste stále vy – řídíte jej, děláte rozhodnutí a vyjadřujete podstatu lidství.

Možná, pokud to ve vás vyvolává pocity, je to skutečné.

Myslíte si, že byste mohli přijít s argumentem, který by byl dostatečně silný, aby vyhrál tuto debatu? Jsem zvědavý – napište mi to do komentářů.

Překlad článku od Edoardo Pachera