Personalizace pro MidJourney V6 je tady!

Udělejte si vlastní stylizace v Midjourney a získejte fast hour zdarma.

Na webu Midjourney můžete použít vlastní stylizaci přizpůsobení pomocí hodnocení obrázků a navíc získat nějaké fast hours zdarma. Až dosud měla každá verze Midjourney vlastní interní estetiku založenou na tréninku umělé inteligence s určitým vstupem preferencí uživatelů z procesu řazení. Nyní můžete vystoupit z řady a používat vlastní personalizaci založenou na vlastním hodnocení.

Co je ranking (pořadí)

Hodnocení neboli ranking je výběr jednoho z dvou obrázků, kterému dáváte přednost. Odkaz na něj najdete na webových stránkách midjourney.com v levém postranním panelu pod položkou Úkoly (Tasks). K dispozici máte vždy dva obrázky a můžete si zobrazit výzvu k jejich výběru. Vpravo nahoře je tlačítko pro přeskočení, pokud se nemůžete rozhodnout nebo vás nezajímá výběr jednoho z nich.

Nejlepší na tom je, že vám to nejen pomůže s personalizací, ale pokud se v daný den umístíte mezi prvními 2000 lidmi, kteří se umístili, budete odměněni rychlou hodinou zdarma. Pokud to budete dělat denně, můžete získat dalších 30 hodin měsíčně! Tímto způsobem vám Midjourney děkuje za to, že jim pomáháte trénovat umělou inteligenci v tom, co se nám opravdu líbí.

Byl jsem velmi skeptický, že tato personalizace bude fungovat, ale v mém případě má Midjourney alespoň moje číslo! Aby personalizace fungovala, musíte zařadit alespoň 200 párů obrázků.  Více je lepší. Kolik jste jich ohodnotili, můžete zjistit pomocí příkazu /info na serveru Discord, kde generujete obrázky.

Při řazení si vyberte ten, který se vám líbí více. Nedělejte si starosti s tím, jak to ovlivní vaši personalizaci, a příliš se nezabývejte tím, zda obrázky odpovídají výzvě; pokud jsou tam prsty navíc apod. prostě si vyberte to, co se vám líbí. Rád si pročítám podněty, abych získal nápady, jak lidé tvoří. Můžete dokonce ovládat (nebo příkazem) kliknutí na obrázek, čímž se obrázek zobrazí na nové kartě. Díky tomu si ho můžete prohlédnout ve větší velikosti; můžete dokonce kliknout na jméno tvůrce a zobrazit si jeho galerii, pokud je veřejná.

Někdy se zobrazí jeden nebo oba tyto obrázky, abyste zabránili náhodnému klikání nebo jakémukoli automatizování procesu. Neklikejte na křížek, pokud tak učiníte, budete muset ověřit, že jste člověk, a ztrácet tím čas. Za opakovaná chybná kliknutí  nezískáte rychlou hodinu (fast hour) pro daný den.

Jak spustit personalizovanou výzvu

Jakmile máte za sebou dostatečný počet hodnocení (alespoň 200), můžete začít používat parametr --p. Při jeho použití se vyplní ID osobního stylu; každý uživatel má své jedinečné. Pokud byste jej chtěli mít zapnutý neustále, použijte příkaz /settings na Discordu, nebo pokud používáte webové stránky, klikněte na ikonu nastavení vpravo od panelu představení. Když ji tam zapnete, nebudete muset pokaždé zadávat příkaz --p.

Discord

Website

Můžete také použít stylize - s 100 v rozsahu 0-1000, přičemž 100 je výchozí hodnota, pokud do výzvy nepřidáte žádné --s #.

Pokud nechcete mít toto nastavení trvale zapnuté, jednoduše přidejte --p a chcete-li navíc stylize --s # do výzvy, bude to fungovat také dobře.

A little girl having a tea party with her favorite dolls --p --s 100

A little girl having a tea party with her favorite dolls --p --s 1000

Jako příklad jsem si vybral svůj krátký podnět. Parametr --p zapíná personalizaci výzvy pomocí mého osobního kódu (který se doplní při generování obrázku) a parametr --s 1000 říká: „Zvyšte to na maximum“, abyste viděli co největší efekt.

 

Vlevo moje personalizace se stylizací 100 (výchozí) a vpravo na 1000 (maximální)

Líbí se mi styl chromolitografie, který je na mých personalizovaných obrázcích ve srovnání s výchozím stylem Midjourney dost viditelný. Pro srovnání jsem spustil stejnou výzvu bez personalizace, abychom viděli čistě interní estetický styl Midjourney:

Jak mohu zjistit, co dělá moje personalizace?

Jedním z rychlých způsobů, jak zjistit, k jakým druhům personalizace obrázků dochází, je spustit následující příkaz:

"" --p --s 1000

Vypadá to trochu šíleně, že? To, co spouštíte pomocí této výzvy, je prázdná výzva. Prázdný prompt není možné odeslat jinak než pomocí prázdné dvojice uvozovek. To doslova znamená „nic“, a když ho použijete, Midjourney vám bude halekat něco zajímavého. Níže jsou obrázky, které jsem dostal se zapnutou personalizací a kliknutím na stylizaci 1000.

"Prázdná" personalizace na stylize 1000

"Prázdná" personalizace na stylize 1000

Opět jsem pro srovnání provedl stejný test bez personalizace, abychom viděli pole, které získáme přímo z deffaultní stylizace Midjourney:

"" --p --s 1000

Výchozí stylizace Midjourney založená na interní estetice

Abyste si mohli udělat širší představu o tom, jak se mohou styly personalizace lišit, vytvořil jsem podobné sady s prázdnou výzvou a 1000 stylizací od několika svých přátel. Kód stylu můžete sdílet s přáteli a oni ho mohou sdílet s vámi, pokud si ho chcete vyzkoušet sami. Jakmile použijete --p, budete moci vidět svůj vlastní kód ve vypsaných obrázkových výzvách.

Ukázka jiného stylu personalizace

Překvapilo mě, jak moc se můj osobní styl liší od stylu mých různých přátel na serveru Midjourney! Myslím, že tento průřez ukázal, jak zajímavé a rozmanité mohou být styly. Musím říct, že ze všech se mi ten můj líbí nejvíc, a o to úplně jde!

Důležité poznámky

Byla oznámena nová funkce personalizace a výslovně bylo uvedeno, že je v pohybu, takže očekávejte, že bude mít pár výkyvů, než se vyřeší chyby.

Personalizace není v tuto chvíli stabilní funkcí, bude se měnit s tím, jak budete provádět více párových hodnocení (nenápadně), a je možné, že v příštích několika týdnech budeme vydávat aktualizace algoritmu. Takže předpokládejte, že je to „zábavná funkce, která se neustále mění“.

Závěrem

Funkce personalizace nemusí být šálkem čaje pro každého, ale přestože jsem byl zpočátku skeptický, jsem docela ohromen tím, jak dobře Midjourney vystihla to, co se mi líbí na základě mého hodnocení. Nečekal jsem, že to, jak jsem hodnotil výtvory ostatních lidí, bude tak dobrým ukazatelem mých preferencí, ale zdá se, že to funguje. Zkuste to a uvidíte, jak to dopadne u vás!

Překlad článku od PromptDervish na BootCamp Medium.com


Jak vytvářet hudbu pomocí Udio?

Návod na generování AI hudby pomocí Udio Beta

Obsah návodu

Automatické dokončování
Navrhované značky
Tipy pro zadávání podnětů
Vlastní texty a instrumentální skladby
Manuální režim
Extend - Rozšíření stop
Remixování skladeb
Inpainting - Přetvoření části
Pokročilé funkce
Autorská práva

Základy

Vytváření skladeb pomocí aplikace Udio je snadné. Stačí zadat popis toho, co chcete vytvořit, do pole pro výzvu a kliknout na tlačítko Vytvořit - Create. Například zadejte "a jazz song about New York" (jazzová skladba o New Yorku).

UDIO - AI generování hudby - návod česky - základy a automatické generování textu

„píseň o letním dešti“ (a song about summer rain) je volná část a ‚jazz‘, ‚mellow‘, ‚warm‘ jsou tagy. Všimněte si, že různé části výzvy jsou od sebe odděleny čárkami (,), středníky (;) nebo tečkami (.). Výzva může obsahovat libovolný počet volných částí a značek v libovolném pořadí.

Kromě toho může výzva obsahovat odkaz na styl umělce, což usnadňuje popis hudby, kterou chcete vytvořit. Například výše uvedenou výzvu můžete rozšířit na:

"a song about summer rain, jazz, mellow, warm, in the style of Billie Holiday"
„píseň o letním dešti, jazzová, jemná, teplá, ve stylu Billie Holiday“.

Všimněte si, že Udio negeneruje skladby pomocí hlasů umělců a pod kapotou je odkaz na styl nahrazen sadou příslušných značek. Abyste si mohli s výzvou pomoci, najdete pod textovým vstupem dva typy navrhovaných značek, na které můžete kliknout a přidat je do výzvy.

 

Auto-completions - Automatické dokončování:

UDIO - AI generování hudby - návod česky - automatické dokončování

Jedná se o navrhované doplňky tagů pro aktuální slovo.

Pozor! Můžete přesunout kurzor na libovolnou část výzvy, čímž se odpovídajícím způsobem změní doplnění.

Navrhované značky (šedé pozadí):

UDIO - AI generování hudby - návod česky - podněty a výzvy

Navrhované značky, které doplňují aktuální sadu značek, seřazené podle relevance. Navržené značky jsou příjemným nástrojem pro průzkum, který vás může přivést k zajímavým kombinacím, zejména pokud jste ochotni je procházet.

Bez ohledu na to, jak podrobné jsou textové podněty, nemohou plně definovat skutečnou hudební skladbu - stejný text popisuje nekonečné množství možných zvukových stop. Proto chcete-li se přiblížit hudební představě, kterou máte v hlavě, možná budete chtít vytvořit více klipů se stejnými nápovědami (a dalšími nastaveními). Udio ve výchozím nastavení vytváří dva výstupy pro každý vstup, který modelu poskytnete. Ale ani to často nestačí, proto se stav pole s nápovědou po klepnutí na tlačítko Vytvořit neresetuje. To usnadňuje řazení dalších generací do fronty s úpravami nebo bez nich.

Pokud se vám nechce pokračovat v práci na stejné výzvě, klikněte na tlačítko Resetovat - okno výzvy se vrátí do výchozího prázdného stavu. Dobrá příležitost vyzkoušet něco jiného a nového!

Tipy pro zadávání podnětů

Nenechte se odradit, pokud Udio nevytvoří přesně to, co jste chtěli, na první pokus. Stiskněte tlačítko Vytvořit - je pravděpodobné, že jedna z výsledných skladeb bude úžasná.

Některé méně obvyklé kombinace značek může být o něco těžší zprovoznit. Pokud nepomůže převzorkování, můžete prozkoumat jiné způsoby míchání stylů - pomocí rozšíření stopy nebo remixování.

Vlastní texty a instrumentální hudba

Ve výchozím nastavení Udio automaticky vybírá vhodné texty pro vaši výzvu (včetně tvorby instrumentálních skladeb, kde to dává smysl). Pokud chcete použít vlastní texty, vyberte v části textů v poli výzvy možnost Vlastní režim a vložte svůj text do textového vstupu takto:

UDIO - AI generování hudby - návod česky - text a instruměntální hudba bez zpěvu

Lorem Ipsum is simply dummy text of the printing and typesetting industry. Lorem Ipsum has been the industrys standard dummy text ever since the 1500s, when an unknown printer took a galley of type and scrambled it to make a type specimen book.

Chcete-li své výtvory ozvláštnit, zkuste přidat speciální popisky, například [Verse], [Chorus], [Hook], [Guitar Solo] nebo [Drop]. Pomocí závorek můžete také určit doprovodné vokály.

Texty nemusí být v angličtině. Některé z jazyků, které Udio rozpoznává, jsou: Udio rozeznává čínštinu, japonštinu, ruštinu, polštinu, němčinu, francouzštinu a italštinu. Vyzkoušejte to - je to zábava!

Pokud si všimnete, že model špatně vyslovuje nějaké slovo, můžete ho rozdělit na jednodušší hlásky. Dalším problémem, na který můžete narazit, je, že model klade důraz na špatnou slabiku. To lze zmírnit zdůrazněním správné slabiky přímo v textu (např. v ruštině zkuste místo бето́номешалка napsat бетономешалка).

Mějte na paměti, že Udio vytváří 30 sekundové zvukové klipy, takže množství textu by mělo odpovídat délce trvání - pro většinu žánrů asi 6 řádků, pro pomalejší písně méně a pro rychlejší více. Popřípadě můžete použít placenou verzi udio-130, která vytváří dvouminutové písně.

Chcete-li vynutit, aby skladba byla instrumentální, vyberte možnost Instrumentální režim. Upozorňujeme, že tento režim není stoprocentně spolehlivý a občas se mohou objevit zvuky připomínající hlas.

Do výzvy můžete přidat značky instrumentace. Zkuste například přidat „akustická kytara“, „housle“, „flétna“ nebo „syntezátor“  (“acoustic guitar”, “violin”, “flute”, “synthesizer”) (nebo všechny - uvidíte, co se stane). Automatické dokončování je dobrý způsob, jak zjistit, zda Udio rozumí určitému nástroji.

Manuální režim

Ve výchozím nastavení projde vaše výzva po kliknutí na tlačítko Vytvořit výrazným následným zpracováním. To se provádí jednak proto, aby se výzva obohatila o relevantnější údaje, a také proto, aby se převedla do podoby, která je pro základní model srozumitelnější. Díky tomu můžete bez námahy dosáhnout dobrých výsledků, aniž byste se museli starat o drobnosti nízkoúrovňových výzev.

V některých případech však můžete chtít mít větší kontrolu nad tím, co se do modelu dostane, nebo nemusíte být plně spokojeni s tím, jak Udio vaši výzvu přepíše. V tomto případě se hodí ruční režim. Můžete jej zapnout klepnutím na přepínač Ruční režim v poli výzvy.

V ručním režimu jsou všechny potřebné přepisy vypnuty a výzva se do modelu dostane z velké části nezměněná. To znamená, že musíte být při tvorbě popisu skladby pečlivější - povoleny jsou pouze značky a žádný volný text. I v ručním režimu můžete samozřejmě zkusit napsat prakticky cokoli, ale je pravděpodobné, že Udio nebude schopno vaši výzvu správně interpretovat. S ohledem na tuto skutečnost můžete začít experimentovat s některými složitými kombinacemi značek pomocí automatického dokončování a návrhů značek pod hlavním vstupem výzvy. Udělejte si tuto výzvu skutečně vlastní!

Do výzvy můžete přidat značky instrumentace. Zkuste například přidat “acoustic guitar”, “violin”, “flute”, “synthesizer” (nebo všechny - uvidíte, co se stane). Automatické dokončování je dobrý způsob, jak zjistit, zda Udio rozumí určitému nástroji.

Zkuste míchat různé nebo dokonce zdánlivě neslučitelné žánry („eurodance“ a „black metal“ - proč ne?). Buďte trpěliví a připravte se na to, že budete muset několikrát kliknout na tlačítko Vytvořit, aby tato kombinace konečně fungovala.

Někdy můžete zvýšit vliv určité značky tím, že ji ve výzvě několikrát zopakujete.

Všimněte si, že v ručním režimu není ve výzvě žádný volný text, model tedy nemá možnost zjistit téma textu skladby, takže se pokusí vykouzlit nějaké téma na základě zadaných značek. To často vede k poměrně obecným textům, takže při práci v ručním režimu je vhodné prozatím zůstat u vlastních textů.

Rozšíření stop

Udio generuje hudbu po 32s sekcích. Můžete tak poměrně rychle projít několik možností a rozhodnout se, kterou z nich se vyplatí prodloužit. Do režimu Rozšíření se dostanete buď kliknutím na tlačítko Extend na stránce skladby, nebo výběrem možnosti Extend track v kontextové nabídce (kliknutím pravým tlačítkem myši na skladbu nebo kliknutím na ikonu .... V tomto režimu se změní vzhled okna výzvy a zpřístupní se další ovládací prvky:

UDIO - AI generování hudby - návod česky - rozšiřování - extend

Jedním z nových prvků, kterých si můžete všimnout, je oblast zobrazující původní klip, který právě prodlužujete:

Originální prompt u Extend Track

Kromě toho, že vám tato oblast usnadní přehled o tom, na čem pracujete, můžete také zkopírovat výzvu použitou k vytvoření původního klipu kliknutím na ikonu kopie napravo od stopy. Všimněte si, že ve výchozím nastavení je hlavní vstup pro výzvu předvyplněn původní výzvou. Tím je zajištěno, že rozšíření, které se chystáte vytvořit, bude stylem odpovídat originálu. Přesto můžete výzvu změnit na cokoli a někdy to vede k velmi zajímavým výsledkům. Například můžete chtít rozvinout skladbu z mírné akustické kytarové linky na řvoucí kytarové sólo doprovázené těžkými zkreslenými power-akordy - toho lze snadno dosáhnout použitím různých žánrů a značek instrumentace pro různé části skladby.

Režim rozšíření - Extension mode můžete kdykoli opustit a vrátit se do běžného režimu vytváření kliknutím na tlačítko Vytvořit nový - Create New.

Pokud se vám úpravy výzvy kdykoli znelíbí, můžete se pomocí funkce kopírování vrátit k původní výzvě.

Nejjednodušší pracovní postup pro vytvoření 1,5minutové samostatné skladby je následující:

  • Vygenerujte střední (hlavní) část pomocí běžného režimu tvorby. To je „maso“ vaší skladby, nejzajímavější část.
  • Vstupte do režimu rozšíření pro právě vytvořenou část.
  • V oblasti Umístění rozšíření vyberte možnost Přidat intro a klikněte na tlačítko Rozšířit. Tím vytvoříte náběh na hlavní část. Výsledná dvousekční skladba má nyní délku 1 minuty.
  • Vstupte do režimu Rozšíření pro 1minutovou stopu.
  • Vyberte možnost Add Outro a klikněte na tlačítko Extend. To je vše - nyní jste vytvořili hudební skladbu, která má správný začátek a závěr. A je jen vaše!

 

Můžete rozšířit skladby původně vytvořené jinými uživateli.

Remixování skladeb

Další skvělou funkcí služby Udio je remixování. Remix je jemná nebo nepříliš jemná obměna existujícího klipu. Chcete-li jej vytvořit, vyberte nejprve vhodnou skladbu (prozatím můžete remixovat pouze třicátnické skladby) a klikněte na tlačítko Remix buď na stránce skladby, nebo v kontextové nabídce.

Oproti standardnímu režimu tvorby je v okně s výzvou jedna nová oblast:

UDIO - AI generování hudby - návod česky - Remixování a variace

Levá strana je totožná s oblastí původního klipu v režimu Rozšíření a posuvník v pravé části umožňuje ovládat sílu efektu remixování (Variance). V nejslabším bodě, kdy je posuvník zcela vlevo, remixování nemění původní zvuk. Jakmile jej posunete doprava (kliknutím na tlačítko Remix po nastavení polohy posuvníku), efekt se stane zřetelnějším - určité aspekty klipu se začnou měnit. Nízké hodnoty síly většinou ovlivňují jemné detaily, zatímco celková struktura a harmonie originálu zůstává nedotčena. Můžete si například všimnout, že se jemně mění barvy nástrojů a hlasů nebo se mírně mění vzor bicích nástrojů. Vyšší hodnoty síly přinášejí výraznější změny, přičemž nejpravější poloha posuvníku přináší výsledky, které se původnímu klipu téměř nepodobají.

Ve výchozím nastavení je podobně jako v režimu Rozšíření počáteční text výzvy převzat z původní skladby. To je užitečné, pokud chcete, aby byl remix v podobném stylu jako originál. Skutečně zajímavým se však remixování stává, když se pokusíte výzvu buď upravit, nebo napsat zcela novou. Tímto způsobem můžete například přidat nový nástroj nebo se odvázat a vytvořit zcela nový žánrový crossover. Možnosti jsou neomezené.

Kromě změny výzvy můžete stejně jako v jiných režimech tvorby měnit také text. Aby to však dobře fungovalo, možná budete muset použít poměrně vysokou hodnotu Variance, zejména pokud text výrazně změníte.

Remixování je užitečné pro opravu drobných chyb ve výslovnosti.

Zkuste vytvořit několik remixů pro stejnou hodnotu odchylky. Každý z nich se bude od sebe lišit, ale bude mít zhruba stejnou míru podobnosti s originálem.

Inpainting

Při vytváření skladby se někdy vyskytnou drobné chyby, které chcete opravit, nebo lokální úpravy, které byste rádi provedli při zachování celkové hudební struktury. V tomto případě je užitečná funkce inpainting. K funkci inpainting můžete přistupovat prostřednictvím stránky skladby nebo kontextové nabídky.

Inpainting je v současné době k dispozici pouze pro placené předplatitele.

Jakmile vyberete stopu pro inpainting, zobrazí se v okně s výzvou nová část, která obsahuje dva průběhy. Spodní průběh představuje celou stopu a okno zobrazuje aktuální pracovní oblast pro inpainting. Horní průběh zobrazuje tuto zvětšenou pracovní oblast.

UDIO - AI generování hudby - návod česky - Inpaiting - Přepsání

V rámci pracovní oblasti můžete přidat až čtyři oblasti inpaintingu. Tyto oblasti inpaintingu jsou úseky, pro které bude zvuk přegenerován, přičemž vše ostatní v pracovní oblasti a zbytku stopy zůstane stejné.

Při inpaintingu mohou hrát důležitou roli úpravy textů. Například můžete chtít použít inpainting pro jemné úpravy vokálů. Toho dosáhnete tak, že texty písní, které odpovídají celkové pracovní oblasti, ohraničíte třemi hvězdičkami na obou stranách. V rámci těchto textů můžete provádět změny, ale měli byste také zajistit, aby oblasti pro inpainting odpovídaly upraveným textům.

Pozor! Texty, které odpovídají pracovní oblasti, musíte stále opatřit třemi hvězdičkami, i když inpaintujete pouze instrumentální oblasti.

Uveďme si příklad. Nejprve klikněte na tlačítko „Inpaint“ na stránce stopy. Tím se otevře okno s uživatelským rozhraním pro inpainting UI.

Poté vyberte pracovní oblast přetažením okna na dolní křivce (pracovní oblast označená pomocí oranžových šipek níže). Poté upravte oblast inpaintingu v horním průběhu tak, aby pokrývala úsek, který chcete přebarvit (označen pomocí žluté šipky níže). Můžete přidat až čtyři takové oblasti inpaintingu.

V tomto případě řekněme, že chcete upravit jednu vokální linku. Upravte okno inpaintingu tak, aby pokrývalo úsek, který obsahuje právě tuto vokální linku. Poté uzavřete text celé pracovní oblasti pomocí tří hvězdiček, včetně řádku, který má být změněn. Tato shoda je vyznačena pomocí oranžových a žlutých šipek níže. Nakonec řádek upravte a klikněte na tlačítko „Create“.

UDIO - AI generování hudby - návod česky - Inpaint - přepsání

Pokročilé funkce

Pokud v okně výzvy přepnete rozevírací nabídku Pokročilé funkce, zobrazí se několik dalších možností:

  • Můžete nastavit náhodný seed, aby bylo možné klipy reprodukovat (v ručním režimu - Manual mode). Použití stejného seedu při změně výzvy nebo textu může někdy pomoci zachovat určité vlastnosti klipu, aniž by se tyto vlastnosti musely výslovně vyžadovat.
  • Můžete nastavit sílu výzvy nebo textu a ovlivnit tak, jak moc tyto vstupy ovlivní výstup. Vyšší síla podnětu zlepšuje dodržování, ale může vést k méně přirozenému zvuku hudby. Nižší síla textu může vést k přirozenějšímu zpěvu, ale někdy může být text ignorován.
  • Pomocí položky Čas začátku klipu lze řídit, kde má generovaný klip začínat v kontextu celé skladby. Například 0 % odpovídá začátku, 50 % středu a 90 % klipu z konce skladby. To je užitečné zejména v kombinaci s funkcí prodloužení, ale také to znamená, že můžete vždy začít skladbu například od intra.
  • Posuvník kvality generování umožňuje vyměnit kvalitu za rychlost generování a naopak. To vám může umožnit prozkoumávat rychleji, aniž byste obětovali příliš mnoho kvality, takže doufáme, že to vyzkoušíte.
Udio-130 advenced features seed

Seed-Sada: U verze Udio-130 umožňuje uživateli použít při generování hudebních klipů stejnou náhodnou sadu (0-∞), čímž se generované klipy opakují. Použití stejného čísla sady umožňuje zachovat určité specifické vlastnosti při každém generování, i když se změní tag-značka nebo text písně. Můžete použít sadu již vygenerované sady, zkopírovat sadu tlačítkem copy, kolečkem repeat nastavit hodnu -1 (náhodné číslo), nebo zkusit štěstí kostkami - číslo závisí na olajkovaných písních.

Autorská práva

Často se můžeme setkat s otázkou jak je to s autorskými právy u generované AI hudby. I když můžeme narazit na polemiku o tom, že autorská práva platí v každé zemi jinak, odpověď je zcela prostá. Syntetický obsah na internetu je zatím a díky bohu divoký západ. Nicméně Udio samo říká v originální příručce, že píseň je jen vaše a tím pádem se vzdává jakéhokoliv autorství. Je dobré podotknout, že je slušností a nikoliv nutností, poznamenat autorství třeba slovy "Created by Petr Chroustovsky & Udio". Pro nás Evropany zatím také platí povinnost označovat syntetický obsah štítkem AI na sociálních sítích dle Nařízení 2024/1689.

Autorska prava

Za 36 hodin režisérem, hudebním tvůrcem a producentem.

Jak se díky AI posunout tam, kde to bylo dříve nemožné.

Tento příběh je inspirací pro všechny, kdo touží po nových způsobech vyjádření, a ukazuje, že s AI je možné dosáhnout úspěchu i tam, kde by to dříve bylo nemožné. Výsledkem je nejen umělecké dílo, ale také nové přístupy k tvorbě, které mění pravidla hry v oblasti umění a kultury.

Je rok 2021 a já se začínám učit s umělou inteligencí. Zatím nevím, co s ní nakonec budu dělat, ale pevně věřím, že to bude mít velký potenciál. Vzdálená vidina je, že mi pomůže udělat pokračovaní mé horrorové adventury s názvem Dark Disharmony, ale jak to tak u mě bývá, věci se vždycky vyvinou trochu jinak, než předpokládám.

Dark Disharmony

Prošel jsem si hromady projektů, a nakonec jsem zůstal u MidJourney pro generování grafiky, které jsem pro náš malý český národ přeložil kompletní příručku. Vždycky u mě fungovalo, že jestli se chci něco naučit musím si udělat zápisky, a tak na svém blogu d3arts.cz vydávám.

Díky mé hlavní práci, kterou je ISP ve společnostni Best-Net si mohu dovolit konečně zakoupit pořádnou grafickou kartu, abych na lokální pracovní stanici mohl rozjet Stable Diffusion a dovolit si ten luxus generovat grafiku bez cenzury a pouze za cenu propálené elektřiny. Díky nastudovaní práce se Stable Diffusion vytvářím za pomocí LoRA modelu a SDXL checkpointů svoji konzistentní AI postavu - ai modelku. Předlohy jsem pro LoRA model jsem si předgeneroval v MidJourney za pomocí obrázkových podnětů - z rrůzných úhlů. Z těchto předloh vytvářím Lenku Baier. Půvabnou blondýnku, která vyhovuje mému estetickému citu.

Lenka Baierová - naše instagramová fitness modelka

Z dalších vytvořených generací zdokonaluji svůj AI model a někdy se snížím i ke faceswapu pomocí ReActor pluginu. Lenka ožívá na sociální síti Instagram, kde mate nové sledující poměrně dráždivým obsahem, abych pak zjistil, že hrát si na influencera a psát si s bandou nadržených followerů není něco, co by mě zrovna naplňovalo. Mimochodem jedem z přátel se do mé modelky zamiloval, a tak jsem přišel o kamaráda, který nerozdýchal to, že Lenka Baier je můj výtvor. V práci s AI se dále vzdělávám a objevuji na Facebooku různé komunity.

Jedna z nich je skupina Cursed AI, kde se lidé baví bizárem, který AI umí vyplivnout. Sám vytvářím vlastní komunitu AI grafici. S rozvojem umělé inteligence různí fantasti a tvůrci clickbaitů, kteří vytváří mysteriózní fotografie z minulosti, a tak se dostáváme k jádru mé nynější tvorby a tím je prompt:

Giant *something*, Kandahar circa 1923

...kterým se skupina Cursed AI baví do té míry, až se stavá toto téma bannovaným a na čas díky těmto restrikcím se stává zapomenutým. Mě ale tato estetika nemyslitelného natolik uchvátila, že jsem pokračoval v jejím rozvíjení.

V roce 2024 spolu s Petrem Marešem a Martino Jurčekovou čistě náhodou pořádáme výstavu AI Galerii Moderního Umění v Hradci Králové – 2045: Human Expiration, kde žiju a vyměňujeme si dojmy a znalosti z AI. Tak jsem se stal součástí umělecké skupiny Homo Digitalis 3.2.1. Výstava má nečekaný úspěch a píše se o nás třeba v české verzi Wired. Petr, je kromě své spisovatelské kariéry také hudebníkem, a tak se dostávám ke generování hudby prostřednictví Udio, se kterým se mi myslím poměrně daří generovat můj oblíbený mikro-žánr a tím je synthwave, což je mix 90-kového diska a nové vlny elektronické hudby. Martina experimentuje s RunwayML pro generování videí. A tak se během volných chvílích, které mi žena poskytuje plně ponořuji do studia těchto projektů.

Human Expiration: 2045 exhibition Hradec Kralove - Wired - Petr Chroustovsky

Díky nástroji Image to Video a dobře vypracovaným promptům si nejdříve v MidJourney předgeneruji databázi obrázků, většinou si vytvořím až dvě sta generací, ze kterých pak prostřednictví RunwayML vytvářím pohyblivé obrázky. A tak se dostáváme k prvnímu singlu s názvem Secrets of Kandahar - Circa 1923. Kde s verzí Gen-2 vytvářím kompletní videoklip a umísťuji jej na svůj YouTube kanál.  

Vítejte ve fantastickém světě Kandaháru. Hudební video realizované za pomoci nástrojů umělé inteligence, kde se nemyslitelně mísí prvky dokumentárních záběrů arabské kultury s bizarně vypadající technologií, hyperkýčem, dadaismem a techno mystikou. 

Jelikož mám za sebou dvě umělecké Školy Aplikované Kybernetiky v HK, terminologie i technologie mi nedělají problém a vytvořené věci jsou už pouze záležitostí mého vlastního vkusu. Nenechte se mýlit, že všechno je jen záležitostí promtů. Dost často sahám do Photoshopu, abych pro nástroj Image to Video vytvořil ideální předlohu rovné mé představě a někdy to sakra bolí. Něž takový záběr použiji předchází mu asi kolem padesáti generací, než jsem spokojený.

Z toho důvodu jsem si spočítal, že u RunwayML se mi vyplatí jít do verze  Unlimited a tak dávám poměrně slušnou sumu na oltář AI, aby se mi dařili opravdu kvalitní výstupy. U MidJourney a Udio je to podobné, a tak jsem se rozhodl, že vytvořím kompletní album. Nicméně představte si, že byste měli vytvořit kompletní klip s normálním štábem a počítačovou grafikou a vytvořit něco podobného klasickou cestou. To jsou úplně jiná čísla.

AI je skvělá, ale nesmíte se bát do ni neinvestovat čas a peníze.

 V Udio Beta projíždím ostatní autory, a koukám na jejich prompty Text to Music a zjišťuji, že je dobré přesně specifikovat hudební nástroje, či syntetizátory, požívat kombinovaní pomocí „Synthwave& Synthpop“ - což není nikde uváděno. Užít „In style of *jméno umělce*“  a používat remixy Inpaint fází skladby, které se mi nezdají. Také je dobré použít konkrétní syntetizátory a jmenovat je jako "synthetizer OB-X, synthetizer CS-80". Rytmičtější skladby mohou mít 128 až 140 BPM, tedy počet úderů za minutu - tepovka, což je dobré jmenovat. Také je dobré specifikova náladovost skladby "playful, passionate, warm, lush, uplifting, lonely" atd. Pokud chcete ovládat zpěv použijte Custom nebo Autogenerated lyrics - "Female/Male vocalist". Opět k dobrému kusu docházím kolem osmdesáti generací, než tam to světýlko cítím. 

Díky zpětné vazbě se taky dozvídám, že existuje něco jako Tísnivé Údolí, a že některé neopodstatněné hejty a zpětné vazby jsou způsobené prostě tím, že téměř dokonalé generace vlastně lidi děsí. Což právě není můj případ naštěstí, a proto je dobré na to pamatovat a umělecky se k tomu postavit tím, že některé věci prostě přiznávám. Mimochodem tento fenomén nám pomáhá přežít, nacházet kazy ve vzoru a zkoumat nesrovnalosti, či vynalézat na základně nesrovnalostí.

Nicméně zpětná vazba mě v následujícím klipu donutila vypracovat příběh a zapojit moji AI modelku jako zpěvačku. Pomocí nástroje Lalal.ai – rozdělovače zvukových stop, oddělím z Udiem vytvořené skladby samotný zpěv. Určitou stopu, pak využiji k Lip-Sync, který RunwayML Gen3-Alpha umí a tak z generovaného videa modelky vpravím do jejich rtů zpěv.

Pomocí distribučních platforem jako je DistroKid dané skladby dostanu na všechny možné hudební paltformy jako jsou.. vezmu to popořadě:  Amazon, Anghami,  iTunes, Apple Music, MediaNet, Boomplay, Deezer, Instagram, Facebook, Adaptr, Flo,  YouTube Music iHeartRadio, Clar Música, JooBox, Kuck Media, NetEase, Qobuz, Pandora, Saavn, Spotify, Tencentu, Tridal, TikTok Music. A odnož distribuční platfomy  DistroVid – platforma pro hudební klipy zase na Vevo, iTunes Video, Apple Music, TikTok Music, Tridal a Boomplay.

Nakonec to nejzajímavější, co se distribuce týče je dostat takové dílo na nějaký festival. S tím pomůže platforma Filmfreeway.com, kde se vyplatí zaplatit si zlaté členství  a po zadání AI do vyhledávání si vybrat festival, kde s trochou štěstí vaše dílo vyberou a zaplatit za přihlášku o něco méně. Já se osobně těším na festival Czech International AI_Film Festival v Praze, které bude letos po třetí v kině Atlas. Popřejte mi štěstí.

Ať se vám to líbí, nebo ne, (r)evoluce ve filmové tvorbě je tady a je poháněna umělou inteligencí.

Jestli jste všestranný umělec, který raději pracuje sám AI se stane vaším nejlepším kolegou, který enormně zvýší vaši produktivitu a doslova zvládne vycucnout veškeré vaše nápady a inspirace. Proto si myslím, že nastává doba „malých“ šikovných lidí, kteří tak dokáží vytvořit opravdu originální a kvalitní díla v nezvykle velkém množství. Já už přidám jen poslední dílo, kterým je singl Giants a na klipu ještě pracuji. 

Jak řekl jeden můj profesor: „Nikdy nevíte, kam vás vítr zavane, a proto se učte všechno.“ A měl pravdu, protože nutná dávka obecné přehledu, dějin umění a termínů je něco, co vás oddělí od ostatních, co pracují s AI stejně jako u vytváření her potřebujete nutné znalosti pokročilé matematiky, protože AI za vás nápad nevymyslí, ale rozhodně ho pomůže vydatně realizovat a já se sní snad jednou dostanu k Dark Disharmony 2. Já už se pomalu teď stávám díky AI Meta-člověkem (kterým se zabýváme na naší výstavě), protože už teď jsem díky ní odstranil spoustu mých nedostatků jako jsou jazyková bariéra, slabé schopnosti programování i nedostatek času na kvalitní tvorbu, který rozděluju i mezi starost o svou rodinu. I tak se mi daří najít čas a posunout tuto AI artovou tvorbou o kousek dál, jak v novém klipu s názvem Saucers.