Příručka pro Runway - 1. Základy promtingu

RunwayML - základy práce generování videí s metodou text to video s verzí Gen3- Alpha. 

Ještě něž vás uvedu do zádkladů podněcovaní a práci s umělou inteligencí pro generování filmu a videa s RunwayML, řekněme si nejdříve několik důležitých faktů a tipů. Jak si můžeme všimnout zkratky v názvu ML, což znamená strojové učení (machine learning) Runway je jedna z nejlepší platforem, která se velmi rychle vyvíjí. To znamená, že pokud nezvládla udělat nějaký záběr dnes, zkuste to zítra, možná už se to naučila. Dalším postřehem ke konzistentnosti vašich videí je možnost používat obrázkové výzvy, kde zadáte první a poslední snímek záběru a Runway vám generuje to mezi obrázky na základě vašeho textového podnětu. Tím se můžete dostat k velice konkrétním realizací vaší představy nebo scénáře.

Pro generování obrázkových podnětů stále doporučuju online platformu MidJourney - návod na blogu najdete. Stejně jako MJ, Runway nechápe gramatiku, takže s vysvětlováním pomocí gramatických oslích můstků typu na "začátku udělej něco a pak udělej tohle" příliš nepochodíte. Její NLP (Natural Language Processing) může porozumět textu na základě analýzy vstupu pro extrakci významu, klíčových slov nebo sentimentu.

Další praktickou informací, která vám ušetří dost peněz je, že na hraní tu není moc prostor. Hraní je za paywallem. Nemá smysl kupovat si kredity, protože ty vystřílíte zázračně rychle. Nekupujte si kredity. Jestli to s Runway myslíte vážně, zaplaťte si Unlimited přístup na celý rok a naučte se s ní dokonale. Garantuju vám, že nebudete mít okousané nehty od toho, jestli se generování povede (pro mě je jeden úspěšný záběr 10-20 generování) a navíc můžete používat režim Gen3-Turbo, což ušetří i spoustu času. Toť zatím vše pojďme se podívat, jak funguje promting. 

K zadávání obvykle raději používám překladač Deepl, potom si přeložené zadání upraví do pro AI srozumitelnější iterace.

Gen-3 Alpha má poměrně nekonečný potenciál, abyste mohli realizovat své umělecké vize. Vytvoření silného podnětu- promptu, který zprostředkuje scénu, je klíčem ke generování videa v souladu s vaším konceptem.
Tento článek se zabývá různými ukázkovými strukturami, klíčovými slovy a tipy na podněty, které vám pomohou začít pracovat s Gen-3 Alpha. Jedná se pouze o příklady - nebojte se při uvádění svých nápadů do života experimentovat.

Struktury podnětů

Základní textový podnět

Pouze textové podněty jsou nejúčinnější, pokud se řídí jasnou strukturou, která rozděluje podrobnosti o scéně, objektu a pohybu kamery do samostatných částí. Použití následující struktury by mělo pomoci zajistit konzistentní výsledky při seznamování se s aplikací Gen-3 Alpha:

[pohyb kamery]: [vytvoření scény]. [doplňující informace].
[camera movement]: [establishing scene]. [additional details].

Při použití této struktury by vaše výzva pro ženu stojící v tropickém deštném pralese mohla vypadat takto:

Statický záběr z nízkého úhlu: Kamera je natočena pod úhlem na ženu v oranžovém oblečení, která stojí v tropickém deštném pralese s barevnou flórou. Dramatická obloha je zatažená a šedá.
Low angle static shot: The camera is angled up at a woman wearing all orange as she stands in a tropical rainforest with colorful flora. The dramatic sky is overcast and gray.

Opakování nebo posilování klíčových slov a myšlenek v různých částech podnětu může pomoci zvýšit efekt ve výstupu. Můžete například poznamenat, že kamera rychle prolétá scénami v hyper-rychlém záběru. Snažte se, aby váš podnět byl zaměřen na to, co by mělo být ve scéně. Například byste mohli vyzvat k zobrazení jasné oblohy spíše než oblohy bez mraků.

Základní výzva obrázek + text

Při použití vstupních obrázků se zaměřte spíše na popis pohybu, který byste chtěli na výstupu vidět, než na obsah obrázku. Například při použití vstupního obrázku, který obsahuje postavu, můžete zkusit následující výzvu:

Subjekt vesele pózuje, její ruce tvoří znak míru.
Subject cheerfully poses, her hands forming a peace sign.

Použití textového podnětu, který se výrazně liší od vstupního obrázku, může vést k neočekávaným výsledkům. Mějte na paměti, že složité přechody scén mohou vyžadovat více iterací k dosažení požadovaného výstupu. 

Iterace je proces opakování určitého postupu nebo operace, obvykle za účelem přiblížení se k nějakému cíli nebo dosažení určitého výsledku

Ukázkové výzvy

Plynulé přechody

Nepřetržité záběry FPV v hyperrychlosti: Kamera plynule prolétá ledovcovým kaňonem do zasněné krajiny mraků.
Continuous hyperspeed FPV footage: The camera seamlessly flies through a glacial canyon to a dreamy cloudscape.

Pohyb kamery

Svítící oceán v noci s bioluminiscenčními tvory pod vodou. Kamera začíná makro záběrem svítící medúzy zblízka a poté se rozšíří a odhalí celý oceán osvětlený různými svítícími barvami pod hvězdnou oblohou. Pohyb kamery: Začněte makro záběrem medúzy a poté se jemně stáhněte dozadu a nahoru, abyste ukázali svítící oceán.
A glowing ocean at night time with bioluminescent creatures under water. The camera starts with a macro close-up of a glowing jellyfish and then expands to reveal the entire ocean lit up with various glowing colors under a starry sky. Camera Movement: Begin with a macro shot of the jellyfish, then gently pull back and up to showcase the glowing ocean.

Textové titulní karty

Titulní obrazovka s dynamickým pohybem. Scéna začíná u stěny pokryté barevnými barvami. Náhle se na zeď vylije černá barva a vytvoří slovo „Runway“. Kapající barva je detailní a texturovaná, vycentrovaná, vynikající filmové osvětlení.
A title screen with dynamic movement. The scene starts at a colorful paint-covered wall. Suddenly, black paint pours on the wall to form the word "Runway". The dripping paint is detailed and textured, centered, superb cinematic lighting.

 

Klíčová slova podnětů

Klíčová slova mohou být přínosná pro dosažení specifických stylů ve vašem výstupu. Zajistěte, aby klíčová slova byla v souladu s vaší celkovou výzvou, díky čemuž budou ve vašem výstupu lépe patrná.

Například zařazení klíčových slov o struktuře pleti by nebylo přínosné pro širokoúhlý záběr, kde kamera není úzce zaměřena na obličej. Širokoúhlému záběru by naopak mohly prospět další podrobnosti o prostředí.

Při zachování této soudržnosti jsou níže uvedena různá klíčová slova, se kterými můžete při přípravě podnětů experimentovat.

Úhly záběru kamery

Optika objektivu

Nízký úhel

Low angle

RunwayML - klíčové slovo: low angle, nízký úhel (úhly záběru kamery)

Vysoký úhel

High angle

RunwayML - klíčové slovo: high angle, vysoký úhel (úhly záběru kamery)

Nadhled

Overhead

RunwayML - klíčové slovo: overhead, nadhled (úhly záběru kamery)

Pohled první osoby

FPV

RunwayML - klíčové slovo: FPV, pohled z první osoby (úhly záběru kamery)

Záběr z ruky

Hand held

RunwayML - klíčové slovo: hand held, z ruky (úhly záběru kamery)

Širokoúhlý

Wide angle

RunwayML - klíčové slovo: Širokoúhlý, Wide angle (úhly záběru kamery)

Detail - Z blízka

Close up

RunwayML - klíčové slovo: close up, detail, zblízka (úhly záběru kamery)

Detail - Makro

Macro cinematography

RunwayML - klíčové slovo: Makro (úhly záběru kamery)

Zezadu

Over the shoulder

RunwayML - klíčové slovo: zezadu, over the shoulders (úhly záběru kamery)

Sledování objektu

Tracking

RunwayML - klíčové slovo: Sledování objektu, Tracking (úhly záběru kamery)

Široký záběr

Establishing wide

RunwayML - klíčové slovo: Široký záběr, Establishing wide (úhly záběru kamery)

Perspektiva lidského oka

50mm lens

RunwayML - klíčové slovo: 50 mm lens (úhly záběru kamery)

Akční kamera -selfie

SnorriCam

RunwayML - klíčové slovo: akční kamera, snorricam, gopro (úhly záběru kamery)

Dokumentární

Realistic documentary

RunwayML - klíčové slovo: Dokumentární, Realistic documentary, (úhly záběru kamery)

Domácí video

Camcoder

RunwayML - klíčové slovo: DV kamera, camcoder, (úhly záběru kamery)

Styl osvětlení

Rozptýlené světlo

Diffused lighting

 

RunwayML - klíčové slovo: (osvětlení)

Silueta

Silhouette

RunwayML - klíčové slovo: silueta, Silhouette (osvětlení)

Odlesk objektivu

Lens flare

RunwayML - klíčové slovo: Odlesk objektivu, Lens flare (osvětlení)

Svícení zezadu

Back lit

RunwayML - klíčové slovo: Svícení zezadu, Back lit (osvětlení)

Nasvícení z boku

Side lit

RunwayML - klíčové slovo: Nasvícení z boku, Side lit (osvětlení)

Barevný filtr

[color] gel lighting

RunwayML - klíčové slovo: Barevný filtr, [color] gel ighting (osvětlení)

Ben8tsk0 sv2tlo

Venetian lighting

RunwayML - klíčové slovo: benátské světlo, venetian light (osvětlení)

Rychlost pohybu

camera movement

Velmi rychlý pohyb 

Dynamic motion

 

RunwayML - klíčové slovo: dynamic motion, dynamický (rychlost pohybu a času)

Zpomalený

Slow motion

RunwayML - klíčové slovo: slow motion, zpomalený (rychlost pohybu a času)

Rychlý pohyb

Fast motion

RunwayML - klíčové slovo: Fast motion (rychlost pohybu a času)

Časosběr

Timelapse

RunwayML - klíčové slovo: (rychlost pohybu a času)

Typ pohybu (vzhledem k objektu)

movement type

Růst

Grows

 

RunwayML - klíčové slovo: Zjevení, Emerges (typ pohybu)

Zjevení

Emerges

RunwayML - klíčové slovo: Zjevení, objevení, Emerges (typ pohybu)

Výbuch

Explodes

RunwayML - klíčové slovo: Výbuch, Explodes (typ pohybu)

Vznášení

Ascends

RunwayML - klíčové slovo: Vznášení ,Ascends, létání (typ pohybu)

Vlnící se

Undulates

RunwayML - klíčové slovo: vlnící se, undulates (typ pohybu)

Deformace

Warps

RunwayML - klíčové slovo: Deformace, Warps (typ pohybu)

Proměna

Transforms

RunwayML - klíčové slovo: Proměna, Transforms (typ pohybu)

Zvlnění

Ripples

RunwayML - klíčové slovo: Zvlnění, Ripples (typ pohybu)

Roztříštění

Shatters

RunwayML - klíčové slovo: Roztříštění, Shatters (typ pohybu)

Rozložení

Unfolds

RunwayML - klíčové slovo: Rozložení, Unfolds (typ pohybu)

Vír

Vortex

RunwayML - klíčové slovo: Vortex, Vír (typ pohybu)

Styl a Estetika

Náladový

Moody

 

RunwayML - klíčové slovo: Náladový, Moody (styl a estetika)

Dramatický

Cinematic

RunwayML - klíčové slovo: Dramatický, Cinematic (styl a estetika)

Duhový

Iridiscent

RunwayML - klíčové slovo: duhový, Iridiscent (styl a estetika)

Staré domácí video, retro

Home video a VHS

RunwayML - klíčové slovo: (styl a estetika)

Poruchový

Glitchcore

RunwayML - klíčové slovo: glitch, porucha obrazu (styl a estetika)

Styly textu (font)

Tučně

Bold

 

RunwayML - klíčové slovo: Tučně, Bold (font)

Pouliční grafika

Graffiti

RunwayML - klíčové slovo: Pouliční grafika, Graffiti (font)

Neonové fluorescenční lampy

Neon

RunwayML - klíčové slovo: Neonové fluorescenční lampy, Neon (font)

Univerzita, sport

Varsity

RunwayML - klíčové slovo: Univerzita, sport, varsity (font)

Výšivka

Ebroidery

RunwayML - klíčové slovo: Výšivka, Ebroidery (font)

Zástupné symboly

v zalomených závorkách []

Pro vytváření vlastních předvoleb, které lze snadno opakovaně použít, můžete také část výzvy umístit do závorek a nahradit text jedním kliknutím. Například:

Fotoaparát plynule prolétne [místo předmětu].
The camera seamlessly flies through a [subject location]

Po uložení jako předvolba vám to umožní 1 kliknutím nahradit oblast závorek a začít psát text, kdykoli ji znovu použijete.


Jak vytvářet hudbu pomocí Udio?

Návod na generování AI hudby pomocí Udio Beta

Obsah návodu

Automatické dokončování
Navrhované značky
Tipy pro zadávání podnětů
Vlastní texty a instrumentální skladby
Manuální režim
Extend - Rozšíření stop
Remixování skladeb
Inpainting - Přetvoření části
Pokročilé funkce
Autorská práva

Základy

Vytváření skladeb pomocí aplikace Udio je snadné. Stačí zadat popis toho, co chcete vytvořit, do pole pro výzvu a kliknout na tlačítko Vytvořit - Create. Například zadejte "a jazz song about New York" (jazzová skladba o New Yorku).

UDIO - AI generování hudby - návod česky - základy a automatické generování textu

„píseň o letním dešti“ (a song about summer rain) je volná část a ‚jazz‘, ‚mellow‘, ‚warm‘ jsou tagy. Všimněte si, že různé části výzvy jsou od sebe odděleny čárkami (,), středníky (;) nebo tečkami (.). Výzva může obsahovat libovolný počet volných částí a značek v libovolném pořadí.

Kromě toho může výzva obsahovat odkaz na styl umělce, což usnadňuje popis hudby, kterou chcete vytvořit. Například výše uvedenou výzvu můžete rozšířit na:

"a song about summer rain, jazz, mellow, warm, in the style of Billie Holiday"
„píseň o letním dešti, jazzová, jemná, teplá, ve stylu Billie Holiday“.

Všimněte si, že Udio negeneruje skladby pomocí hlasů umělců a pod kapotou je odkaz na styl nahrazen sadou příslušných značek. Abyste si mohli s výzvou pomoci, najdete pod textovým vstupem dva typy navrhovaných značek, na které můžete kliknout a přidat je do výzvy.

 

Auto-completions - Automatické dokončování:

UDIO - AI generování hudby - návod česky - automatické dokončování

Jedná se o navrhované doplňky tagů pro aktuální slovo.

Pozor! Můžete přesunout kurzor na libovolnou část výzvy, čímž se odpovídajícím způsobem změní doplnění.

Navrhované značky (šedé pozadí):

UDIO - AI generování hudby - návod česky - podněty a výzvy

Navrhované značky, které doplňují aktuální sadu značek, seřazené podle relevance. Navržené značky jsou příjemným nástrojem pro průzkum, který vás může přivést k zajímavým kombinacím, zejména pokud jste ochotni je procházet.

Bez ohledu na to, jak podrobné jsou textové podněty, nemohou plně definovat skutečnou hudební skladbu - stejný text popisuje nekonečné množství možných zvukových stop. Proto chcete-li se přiblížit hudební představě, kterou máte v hlavě, možná budete chtít vytvořit více klipů se stejnými nápovědami (a dalšími nastaveními). Udio ve výchozím nastavení vytváří dva výstupy pro každý vstup, který modelu poskytnete. Ale ani to často nestačí, proto se stav pole s nápovědou po klepnutí na tlačítko Vytvořit neresetuje. To usnadňuje řazení dalších generací do fronty s úpravami nebo bez nich.

Pokud se vám nechce pokračovat v práci na stejné výzvě, klikněte na tlačítko Resetovat - okno výzvy se vrátí do výchozího prázdného stavu. Dobrá příležitost vyzkoušet něco jiného a nového!

Tipy pro zadávání podnětů

Nenechte se odradit, pokud Udio nevytvoří přesně to, co jste chtěli, na první pokus. Stiskněte tlačítko Vytvořit - je pravděpodobné, že jedna z výsledných skladeb bude úžasná.

Některé méně obvyklé kombinace značek může být o něco těžší zprovoznit. Pokud nepomůže převzorkování, můžete prozkoumat jiné způsoby míchání stylů - pomocí rozšíření stopy nebo remixování.

Vlastní texty a instrumentální hudba

Ve výchozím nastavení Udio automaticky vybírá vhodné texty pro vaši výzvu (včetně tvorby instrumentálních skladeb, kde to dává smysl). Pokud chcete použít vlastní texty, vyberte v části textů v poli výzvy možnost Vlastní režim a vložte svůj text do textového vstupu takto:

UDIO - AI generování hudby - návod česky - text a instruměntální hudba bez zpěvu

Lorem Ipsum is simply dummy text of the printing and typesetting industry. Lorem Ipsum has been the industrys standard dummy text ever since the 1500s, when an unknown printer took a galley of type and scrambled it to make a type specimen book.

Chcete-li své výtvory ozvláštnit, zkuste přidat speciální popisky, například [Verse], [Chorus], [Hook], [Guitar Solo] nebo [Drop]. Pomocí závorek můžete také určit doprovodné vokály.

Texty nemusí být v angličtině. Některé z jazyků, které Udio rozpoznává, jsou: Udio rozeznává čínštinu, japonštinu, ruštinu, polštinu, němčinu, francouzštinu a italštinu. Vyzkoušejte to - je to zábava!

Pokud si všimnete, že model špatně vyslovuje nějaké slovo, můžete ho rozdělit na jednodušší hlásky. Dalším problémem, na který můžete narazit, je, že model klade důraz na špatnou slabiku. To lze zmírnit zdůrazněním správné slabiky přímo v textu (např. v ruštině zkuste místo бето́номешалка napsat бетономешалка).

Mějte na paměti, že Udio vytváří 30 sekundové zvukové klipy, takže množství textu by mělo odpovídat délce trvání - pro většinu žánrů asi 6 řádků, pro pomalejší písně méně a pro rychlejší více. Popřípadě můžete použít placenou verzi udio-130, která vytváří dvouminutové písně.

Chcete-li vynutit, aby skladba byla instrumentální, vyberte možnost Instrumentální režim. Upozorňujeme, že tento režim není stoprocentně spolehlivý a občas se mohou objevit zvuky připomínající hlas.

Do výzvy můžete přidat značky instrumentace. Zkuste například přidat „akustická kytara“, „housle“, „flétna“ nebo „syntezátor“  (“acoustic guitar”, “violin”, “flute”, “synthesizer”) (nebo všechny - uvidíte, co se stane). Automatické dokončování je dobrý způsob, jak zjistit, zda Udio rozumí určitému nástroji.

Manuální režim

Ve výchozím nastavení projde vaše výzva po kliknutí na tlačítko Vytvořit výrazným následným zpracováním. To se provádí jednak proto, aby se výzva obohatila o relevantnější údaje, a také proto, aby se převedla do podoby, která je pro základní model srozumitelnější. Díky tomu můžete bez námahy dosáhnout dobrých výsledků, aniž byste se museli starat o drobnosti nízkoúrovňových výzev.

V některých případech však můžete chtít mít větší kontrolu nad tím, co se do modelu dostane, nebo nemusíte být plně spokojeni s tím, jak Udio vaši výzvu přepíše. V tomto případě se hodí ruční režim. Můžete jej zapnout klepnutím na přepínač Ruční režim v poli výzvy.

V ručním režimu jsou všechny potřebné přepisy vypnuty a výzva se do modelu dostane z velké části nezměněná. To znamená, že musíte být při tvorbě popisu skladby pečlivější - povoleny jsou pouze značky a žádný volný text. I v ručním režimu můžete samozřejmě zkusit napsat prakticky cokoli, ale je pravděpodobné, že Udio nebude schopno vaši výzvu správně interpretovat. S ohledem na tuto skutečnost můžete začít experimentovat s některými složitými kombinacemi značek pomocí automatického dokončování a návrhů značek pod hlavním vstupem výzvy. Udělejte si tuto výzvu skutečně vlastní!

Do výzvy můžete přidat značky instrumentace. Zkuste například přidat “acoustic guitar”, “violin”, “flute”, “synthesizer” (nebo všechny - uvidíte, co se stane). Automatické dokončování je dobrý způsob, jak zjistit, zda Udio rozumí určitému nástroji.

Zkuste míchat různé nebo dokonce zdánlivě neslučitelné žánry („eurodance“ a „black metal“ - proč ne?). Buďte trpěliví a připravte se na to, že budete muset několikrát kliknout na tlačítko Vytvořit, aby tato kombinace konečně fungovala.

Někdy můžete zvýšit vliv určité značky tím, že ji ve výzvě několikrát zopakujete.

Všimněte si, že v ručním režimu není ve výzvě žádný volný text, model tedy nemá možnost zjistit téma textu skladby, takže se pokusí vykouzlit nějaké téma na základě zadaných značek. To často vede k poměrně obecným textům, takže při práci v ručním režimu je vhodné prozatím zůstat u vlastních textů.

Rozšíření stop

Udio generuje hudbu po 32s sekcích. Můžete tak poměrně rychle projít několik možností a rozhodnout se, kterou z nich se vyplatí prodloužit. Do režimu Rozšíření se dostanete buď kliknutím na tlačítko Extend na stránce skladby, nebo výběrem možnosti Extend track v kontextové nabídce (kliknutím pravým tlačítkem myši na skladbu nebo kliknutím na ikonu .... V tomto režimu se změní vzhled okna výzvy a zpřístupní se další ovládací prvky:

UDIO - AI generování hudby - návod česky - rozšiřování - extend

Jedním z nových prvků, kterých si můžete všimnout, je oblast zobrazující původní klip, který právě prodlužujete:

Originální prompt u Extend Track

Kromě toho, že vám tato oblast usnadní přehled o tom, na čem pracujete, můžete také zkopírovat výzvu použitou k vytvoření původního klipu kliknutím na ikonu kopie napravo od stopy. Všimněte si, že ve výchozím nastavení je hlavní vstup pro výzvu předvyplněn původní výzvou. Tím je zajištěno, že rozšíření, které se chystáte vytvořit, bude stylem odpovídat originálu. Přesto můžete výzvu změnit na cokoli a někdy to vede k velmi zajímavým výsledkům. Například můžete chtít rozvinout skladbu z mírné akustické kytarové linky na řvoucí kytarové sólo doprovázené těžkými zkreslenými power-akordy - toho lze snadno dosáhnout použitím různých žánrů a značek instrumentace pro různé části skladby.

Režim rozšíření - Extension mode můžete kdykoli opustit a vrátit se do běžného režimu vytváření kliknutím na tlačítko Vytvořit nový - Create New.

Pokud se vám úpravy výzvy kdykoli znelíbí, můžete se pomocí funkce kopírování vrátit k původní výzvě.

Nejjednodušší pracovní postup pro vytvoření 1,5minutové samostatné skladby je následující:

  • Vygenerujte střední (hlavní) část pomocí běžného režimu tvorby. To je „maso“ vaší skladby, nejzajímavější část.
  • Vstupte do režimu rozšíření pro právě vytvořenou část.
  • V oblasti Umístění rozšíření vyberte možnost Přidat intro a klikněte na tlačítko Rozšířit. Tím vytvoříte náběh na hlavní část. Výsledná dvousekční skladba má nyní délku 1 minuty.
  • Vstupte do režimu Rozšíření pro 1minutovou stopu.
  • Vyberte možnost Add Outro a klikněte na tlačítko Extend. To je vše - nyní jste vytvořili hudební skladbu, která má správný začátek a závěr. A je jen vaše!

 

Můžete rozšířit skladby původně vytvořené jinými uživateli.

Remixování skladeb

Další skvělou funkcí služby Udio je remixování. Remix je jemná nebo nepříliš jemná obměna existujícího klipu. Chcete-li jej vytvořit, vyberte nejprve vhodnou skladbu (prozatím můžete remixovat pouze třicátnické skladby) a klikněte na tlačítko Remix buď na stránce skladby, nebo v kontextové nabídce.

Oproti standardnímu režimu tvorby je v okně s výzvou jedna nová oblast:

UDIO - AI generování hudby - návod česky - Remixování a variace

Levá strana je totožná s oblastí původního klipu v režimu Rozšíření a posuvník v pravé části umožňuje ovládat sílu efektu remixování (Variance). V nejslabším bodě, kdy je posuvník zcela vlevo, remixování nemění původní zvuk. Jakmile jej posunete doprava (kliknutím na tlačítko Remix po nastavení polohy posuvníku), efekt se stane zřetelnějším - určité aspekty klipu se začnou měnit. Nízké hodnoty síly většinou ovlivňují jemné detaily, zatímco celková struktura a harmonie originálu zůstává nedotčena. Můžete si například všimnout, že se jemně mění barvy nástrojů a hlasů nebo se mírně mění vzor bicích nástrojů. Vyšší hodnoty síly přinášejí výraznější změny, přičemž nejpravější poloha posuvníku přináší výsledky, které se původnímu klipu téměř nepodobají.

Ve výchozím nastavení je podobně jako v režimu Rozšíření počáteční text výzvy převzat z původní skladby. To je užitečné, pokud chcete, aby byl remix v podobném stylu jako originál. Skutečně zajímavým se však remixování stává, když se pokusíte výzvu buď upravit, nebo napsat zcela novou. Tímto způsobem můžete například přidat nový nástroj nebo se odvázat a vytvořit zcela nový žánrový crossover. Možnosti jsou neomezené.

Kromě změny výzvy můžete stejně jako v jiných režimech tvorby měnit také text. Aby to však dobře fungovalo, možná budete muset použít poměrně vysokou hodnotu Variance, zejména pokud text výrazně změníte.

Remixování je užitečné pro opravu drobných chyb ve výslovnosti.

Zkuste vytvořit několik remixů pro stejnou hodnotu odchylky. Každý z nich se bude od sebe lišit, ale bude mít zhruba stejnou míru podobnosti s originálem.

Inpainting

Při vytváření skladby se někdy vyskytnou drobné chyby, které chcete opravit, nebo lokální úpravy, které byste rádi provedli při zachování celkové hudební struktury. V tomto případě je užitečná funkce inpainting. K funkci inpainting můžete přistupovat prostřednictvím stránky skladby nebo kontextové nabídky.

Inpainting je v současné době k dispozici pouze pro placené předplatitele.

Jakmile vyberete stopu pro inpainting, zobrazí se v okně s výzvou nová část, která obsahuje dva průběhy. Spodní průběh představuje celou stopu a okno zobrazuje aktuální pracovní oblast pro inpainting. Horní průběh zobrazuje tuto zvětšenou pracovní oblast.

UDIO - AI generování hudby - návod česky - Inpaiting - Přepsání

V rámci pracovní oblasti můžete přidat až čtyři oblasti inpaintingu. Tyto oblasti inpaintingu jsou úseky, pro které bude zvuk přegenerován, přičemž vše ostatní v pracovní oblasti a zbytku stopy zůstane stejné.

Při inpaintingu mohou hrát důležitou roli úpravy textů. Například můžete chtít použít inpainting pro jemné úpravy vokálů. Toho dosáhnete tak, že texty písní, které odpovídají celkové pracovní oblasti, ohraničíte třemi hvězdičkami na obou stranách. V rámci těchto textů můžete provádět změny, ale měli byste také zajistit, aby oblasti pro inpainting odpovídaly upraveným textům.

Pozor! Texty, které odpovídají pracovní oblasti, musíte stále opatřit třemi hvězdičkami, i když inpaintujete pouze instrumentální oblasti.

Uveďme si příklad. Nejprve klikněte na tlačítko „Inpaint“ na stránce stopy. Tím se otevře okno s uživatelským rozhraním pro inpainting UI.

Poté vyberte pracovní oblast přetažením okna na dolní křivce (pracovní oblast označená pomocí oranžových šipek níže). Poté upravte oblast inpaintingu v horním průběhu tak, aby pokrývala úsek, který chcete přebarvit (označen pomocí žluté šipky níže). Můžete přidat až čtyři takové oblasti inpaintingu.

V tomto případě řekněme, že chcete upravit jednu vokální linku. Upravte okno inpaintingu tak, aby pokrývalo úsek, který obsahuje právě tuto vokální linku. Poté uzavřete text celé pracovní oblasti pomocí tří hvězdiček, včetně řádku, který má být změněn. Tato shoda je vyznačena pomocí oranžových a žlutých šipek níže. Nakonec řádek upravte a klikněte na tlačítko „Create“.

UDIO - AI generování hudby - návod česky - Inpaint - přepsání

Pokročilé funkce

Pokud v okně výzvy přepnete rozevírací nabídku Pokročilé funkce, zobrazí se několik dalších možností:

  • Můžete nastavit náhodný seed, aby bylo možné klipy reprodukovat (v ručním režimu - Manual mode). Použití stejného seedu při změně výzvy nebo textu může někdy pomoci zachovat určité vlastnosti klipu, aniž by se tyto vlastnosti musely výslovně vyžadovat.
  • Můžete nastavit sílu výzvy nebo textu a ovlivnit tak, jak moc tyto vstupy ovlivní výstup. Vyšší síla podnětu zlepšuje dodržování, ale může vést k méně přirozenému zvuku hudby. Nižší síla textu může vést k přirozenějšímu zpěvu, ale někdy může být text ignorován.
  • Pomocí položky Čas začátku klipu lze řídit, kde má generovaný klip začínat v kontextu celé skladby. Například 0 % odpovídá začátku, 50 % středu a 90 % klipu z konce skladby. To je užitečné zejména v kombinaci s funkcí prodloužení, ale také to znamená, že můžete vždy začít skladbu například od intra.
  • Posuvník kvality generování umožňuje vyměnit kvalitu za rychlost generování a naopak. To vám může umožnit prozkoumávat rychleji, aniž byste obětovali příliš mnoho kvality, takže doufáme, že to vyzkoušíte.
Udio-130 advenced features seed

Seed-Sada: U verze Udio-130 umožňuje uživateli použít při generování hudebních klipů stejnou náhodnou sadu (0-∞), čímž se generované klipy opakují. Použití stejného čísla sady umožňuje zachovat určité specifické vlastnosti při každém generování, i když se změní tag-značka nebo text písně. Můžete použít sadu již vygenerované sady, zkopírovat sadu tlačítkem copy, kolečkem repeat nastavit hodnu -1 (náhodné číslo), nebo zkusit štěstí kostkami - číslo závisí na olajkovaných písních.

Autorská práva

Často se můžeme setkat s otázkou jak je to s autorskými právy u generované AI hudby. I když můžeme narazit na polemiku o tom, že autorská práva platí v každé zemi jinak, odpověď je zcela prostá. Syntetický obsah na internetu je zatím a díky bohu divoký západ. Nicméně Udio samo říká v originální příručce, že píseň je jen vaše a tím pádem se vzdává jakéhokoliv autorství. Je dobré podotknout, že je slušností a nikoliv nutností, poznamenat autorství třeba slovy "Created by Petr Chroustovsky & Udio". Pro nás Evropany zatím také platí povinnost označovat syntetický obsah štítkem AI na sociálních sítích dle Nařízení 2024/1689.

Autorska prava

MidJourney Bot AI návod česky 4. díl – Seznam příkazů, popisovaní a zkracování

Jak funguje MidJourney Bot AI v češtině 4. díl – příkazy, popisování, zkracování

V předposledním díle o Midjourney AI, která slouží jako cloudový generátor obrázků, se podíváme na list všech příkazů a souhrn jejich funkcí. Pod lupu si také vezmeme konterolu úloh a její seed. Zkontrolujeme volby přednastavení a nově se naučíme jako upravovat  a zjednodušovat samotné zadání podnětu. Také nám ale MJ může poslad podněty na základě obrázku tzv. popisováním.

Seznam příkazů

S botem Midjourney můžete na Discordu komunikovat zadáním příkazu. Příkazy slouží k vytváření obrázků, změně výchozího nastavení, sledování informací o uživateli a provádění dalších užitečných úkolů.

Příkazy Midjourney lze použít v jakémkoli kanálu Bota, na soukromých serverech Discord, kde má Bot Midjourney povoleno pracovat, nebo v přímé zprávě s Botem Midjourney.

Kanály Bota jsou kanály Discordu, kde má Bot Midjourney povoleno zpracovávat příkazy Slash. Na oficiálním Discordu Midjourney jsou všechny kanály v kategoriích Newcomer Rooms, Thread Channels, Themed Image Gen a General Image Gen kanály Bota.

Příkazy

/ask

Získejte odpověď na otázku.

/blend

Snadné prolínání dvou obrázků.

/daily_theme

Přepínání upozornění na pingy pro aktualizaci kanálu #daily-theme.

/docs

Použijte na oficiálním serveru Midjourney Discord k rychlému vygenerování odkazu na témata obsažená v této uživatelské příručce.

/describe

Napíše čtyři příklady výzev na základě nahraného obrázku.

/faq

Použijte na oficiálním serveru Midjourney Discord k rychlému vygenerování odkazu na oblíbený kanál FAQ (Často kladené otázky).

/fast

Přepněte na rychlý režim.

/help

Zobrazuje užitečné základní informace a tipy o Midjourney Bot.



/imagine

Generování obrázku pomocí výzvy.

/info

Zobrazení informací o svém účtu a všech úlohách ve frontě nebo spuštěných úlohách.

/stealth

Pro předplatitele plánu Pro: přepnutí do skrytého režimu.

/public

Pro předplatitele plánu Pro: přepnutí do veřejného režimu.

/subscribe

Generování osobního odkazu pro stránku účtu uživatele.

/settings

Zobrazení a úprava nastavení Midjourney Bota.

/prefer option

Vytvoření nebo správa vlastní možností.

/prefer option list

Zobrazte si aktuální vlastní možnosti.

/prefer suffix

Zadejte příponu, která se přidá na konec každého podnětu.

/show

K regeneraci úlohy v aplikaci Discord použijte ID úlohy s obrázky.

/relax

Přepněte do režimu Relax.

/remix

Přepnutí režimu Remix.


Vyřazené

/private (nahrazeno výrazem '/stealth')
/pixels
/idea



Informace pro uživatele

Pomocí příkazu /info můžete zobrazit informace o aktuálních úlohách ve frontě a spuštěných úlohách, typu předplatného, datu obnovení a další.

Obrázek zobrazující vyskakovací okno s informacemi o uživateli vygenerované po použití příkazu /info

Předplatné (Subscription)

V části Předplatné se zobrazuje, který tarif máte předplacený, a datum příštího obnovení.

Pomocí příkazu /subscribe vygenerujte osobní odkaz na stránku pro odběr.
Nebo přejděte na stránku Midjourney.com/account.
Nebo po přihlášení na webové stránky Midjourney vyberte v postranním panelu možnost Manage Sub.
Ceník předplatného

Režim úlohy (Job Mode)

Zobrazuje, zda jste aktuálně v Rychlém nebo Uvolněném režimu. Uvolněný režim je k dispozici pouze pro předplatitele tarifů Standard a Pro.

Režim viditelnosti (Visibility Mode)

Zobrazuje, zda jste aktuálně v režimu Veřejné nebo Skryté. Režim Stealth je dostupný pouze pro předplatitele tarifu Pro.

Zbývající čas rychlého režimu (Fast Time Remaining)

Zobrazuje zbývající čas Fast GPU pro daný měsíc. Čas Fast GPU se měsíčně resetuje a nepřenáší se.

Využití za celou dobu životnosti (Lifetime Usage)

Zobrazuje vaše celoživotní statistiky Midjourney. Obrázky zahrnují všechny typy generací (počáteční mřížky obrázků, upscales, variace, remix atd.).

Uvolněné používání (Relaxed Usage)

Zobrazuje vaše využití v režimu Relax za daný měsíc. Silní uživatelé Relaxačního režimu zaznamenají o něco pomalejší časy ve frontě. Množství využití Relaxed se každý měsíc resetuje.

Úlohy ve frontě (Queued Jobs)

Zobrazuje seznam všech úloh, které jsou zařazeny do fronty ke spuštění. Ve frontě může být současně maximálně sedm úloh.


Použití příkazu Info

Zadejte /info do libovolného kanálu Bota nebo do přímých zpráv. Pouze vy budete moci vidět vyskakovací okno s informacemi.

Animovaný gif ukazující, jak používat příkaz Info - Midjourney


Nastavení a předvolby

Příkaz /settings obsahuje přepínací tlačítka pro běžné možnosti, jako je verze modelu, hodnota stylu, hodnota kvality a verze upscaleru. Nastavení obsahuje také přepínače pro příkazy /stealth a /public.



Parametry přidané na konec výzvy přepíší volby provedené pomocí /settings.


Rozbalovací seznam verze modelu

Vyberte verzi modelu Midjourney, která se má použít při generování obrázků. Použít Nejnovější model je výchozí volba a vždy se použije nejnovější verze modelu Midjourney.

Use the latest Model (V5.2)Mjourney Model V5.2Mjourney Model V5.1Niji Model V5Mjourney Model V5.0Niji Model V4Mjourney Model V4Mjourney Model V3Mjourney Model V2Mjourney Model V1

Styl Surový parametr

Model Midjourney verzí 5.1 a 5.2 lze jemně doladit pomocí parametru --style raw parameter, který snižuje výchozí estetický vzhled Midjourney. Tento přepínač není k dispozici, pokud jsou vybrány jiné verze modelu.

Raw Mode

Stylizovat parametr

Midjourney Bot byl vycvičen k vytváření obrázků, které upřednostňují umělecké barvy, kompozici a formy. Parametr --stylize nebo --s parameter ovlivňuje, jak silně se toto školení uplatní. Nízké hodnoty stylizace vytvářejí obrázky, které přesně odpovídají zadání, ale jsou méně umělecké. Vysoké hodnoty stylizace vytvářejí obrázky, které jsou velmi umělecké, ale méně souvisejí s výzvou.

Stylize LowStylize MedStylize High Stylize Very High 

Stylize Low = --s 50, Stylize Med = --s 100, Stylize High = --s 250, Stylize Very High = --s 750,

Veřejný a skrytý režim

Přepínání mezi veřejným a skrytým režimem. Odpovídá příkazům /public a /stealth.

Public

Režim Remix

Pomocí režimu Remix mode můžete měnit výzvy, parametry, verze modelů nebo poměry stran mezi variantami. Remix převezme obecnou kompozici výchozího obrázku a použije ji jako součást nové úlohy. Remixování může pomoci změnit nastavení nebo osvětlení snímku, rozvinout objekt nebo dosáhnout složitých kompozic.

Remix

Režim vysoké a nízké variace

Přepínání mezi režimem High Variation a Low Variation.

High Variation Mode Low Variation Mode 

Turbo, rychlý a klidový režim

Přepínání mezi režimy Turbo, Rychlý a Relaxační. Odpovídá příkazům /turbo, /fast a /relax a parametrům--turbo--fast,--relax.

Turbo Mode Fast ModeRelax Mode 

Obnovení nastavení

Návrat k výchozímu nastavení.
Reset Settings


Vlastní předvolby

Vytvářejte vlastní volby pomocí příkazů prefer, které automaticky přidávají běžně používané parametry na konec výzev.
/prefer auto_dm Dokončené úlohy jsou automaticky odesílány do přímé zprávy
/prefer option Vytvoření nebo správa vlastní volby.
/prefer option list Zobrazení aktuálních vlastních možností.
/prefer suffix zadejte příponu, která se přidá na konec každé výzvy.




Preferovaná možnost

/prefer option set Vytvoří vlastní parametr, který můžete použít k rychlému přidání více parametrů na konec podnětu.

Volba /prefer option set mine --hd --ar 7:4vytvoří volbu "mine", která se překládá jako --hd --ar 7:4.

Použití příkazu /imagine prompt vibrant California poppies --mine se interpretuje jako /imagine prompt vibrant California poppies --hd --ar 7:4.

/prefer option list vypíše všechny volby vytvořené s nastavenou volbou prefer option set. Uživatelé mohou mít až 20 vlastních možností.

Chcete-li odstranit vlastní možnost, použijte /prefer option set  a pole hodnoty ponechte prázdné.


Preferovaná přípona

/prefer suffix automaticky připojí zadanou příponu za všechny podněty.
Chcete-li preferovanou příponu vymazat, použijte příkaz /settings a vyberte možnost Reset Settings pro obnovení nastavení.

Příklad příkazu: /prefer suffix --uplight --video

Pouze parametry lze použít s příponou /prefer suffix,
prefer suffix --no orange není akceptována oranžová barva.
prefer suffix orange::-1 není akceptován.


Najdi úlohu ID (Job ID)

ID úlohy jsou jedinečné identifikátory používané pro každý obrázek vygenerovaný nástrojem Midjourney.  ID úloh vypadají takto: 9333dcd0-681e-4840-a29c-801e502ae424a lze je nalézt v první části názvů všech obrázků, v adresách URL na webových stránkách a v názvu souboru obrázku.

Na webu

ID úlohy jakéhokoli obrázku v členské galerii zjistíte výběrem možnosti ... Copy...  Job ID.

Obrázek ukazuje, jak zjistit ID úlohy Midjourney z názvu souboru

Z URL

ID úlohy jsou poslední částí adresy URL při zobrazení obrázku v galerii MJ. https://www.midjourney.com/app/users/381590592095911946/?jobId=9333dcd0-681e-4840-a29c-801e502ae424.

Z názvu souboru

ID úlohy je poslední část názvu souboru při prohlížení obrázku staženého z galerie.
User_cat_cloud_spirit_9333dcd0-681e-4840-a29c-801e502ae424.png

Použitím emoji reakce v aplikaci Discord

Reagujte pomocí emoji obálky ✉️ a odešlete dokončenou úlohu do přímých zpráv. Přímá zpráva bude obsahovat číslo seedu obrázku a ID úlohy. Reakce ✉️ funguje pouze s vašimi vlastními úlohami.

Obrázek ukazuje, jak použít reakci s obálkou Emoji Discord k odeslání ID úlohy do přímých zpráv.



Jak používat funkci Zobrazit/Show

Use the /show in any Bot Channel to revive a Job.

MJ příkaz Show -Zobrazit úlohu



Popisování

Příkaz /describe umožňuje nahrát obrázek a na jeho základě vygenerovat čtyři možné výzvy. Pomocí příkazu /describe můžete prozkoumat novou slovní zásobu a estetické pohyby..

/describe generuje podněty, které jsou inspirativní a sugestivní, nelze jej však použít k přesnému obnovení nahraného obrázku.  /describe vrací poměr stran nahraných obrázků.


Zkracování

Příkaz /shorten analyzuje vaši výzvu, zvýrazní některá nejvlivnější slova výzvy a navrhne nepotřebná slova, která byste mohli odstranit. Pomocí tohoto příkazu můžete optimalizovat svou výzvu tím, že se zaměříte na podstatné výrazy.

/shorten

není kompatibilní s více výzvami  multi prompts nebo parametrem --no.


Analýza podnětu pomocí /Shorten

Bot Midjourney analyzuje vaši výzvu tak, že ji rozdělí na menší jednotky známé jako tokeny. Tyto tokeny mohou být fráze, slova nebo dokonce slabiky. Bot Midjourney tyto tokeny převede do formátu, kterému rozumí. Používá je spolu s asociacemi a vzory, které se naučil během svého tréninku, k tomu, aby řídil způsob generování vašeho obrázku. Tokeny si představte jako stavební kameny, které botovi Midjourney pomáhají pochopit smysl vstupu a vytvořit požadovaný vizuální výstup.

Dlouhé podněty se zbytečnými slovy, dlouhé popisy, poetické fráze nebo přímé oslovení bota ("Vytvořte mi prosím obrázek", "Děkuji za pomoc, bote Midjourney!") mohou vést k tomu, že se do obrázků přidají neočekávané prvky.

Příkaz /shorten vám pomůže odhalit nejdůležitější slova ve vaší výzvě a zjistit, která slova můžete vynechat.

Příklad příkazu zkrácení

Pokud chcete vytvořit hromadu koblih s posypem, můžete zkusit tuto výzvu: Please create a whimsical majestic tower of donuts, intricately crafted and adorned with a mesmerizing array of colorful sprinkles. Bring this sugary masterpiece to life, ensuring every detail is rendered in stunning magical realism. Thank you!

Midjourney Obrázek zobrazující věž z koblih.

Pokud použijete příkaz /shorten s výše uvedenou výzvou, Midjourney Bot vrátí následující informace:

IMPORTANT TOKENS
Please create a whimsical majestic tower of donuts, intricately crafted and adorned with a mesmerizing array of colorful sprinkles. Bring this sugary masterpiece to life, ensuring every detail is rendered in stunning magical realismThank you!
SHORTENED PROMPTS
5 Please, majestic tower of donuts, crafted, array of colorful sprinkles, sugary masterpiece, rendered, magical realism
4 Please, majestic tower of donuts, colorful sprinkles, sugary masterpiece, rendered, magical realism
3 majestic tower of donuts, colorful sprinkles, sugary, magical realism
2 majestic tower of donuts, colorful sprinkles, magical
1 tower of donuts, sprinkles

Nejdůležitější tokeny v zadání jsou zvýrazněny tučně, nejméně důležité jsou přeskrtnuty. Na základě těchto informací dostanete také 5 možných kratších podnětů


Příkladový obrázek obrázku Midjourney vytvořený na základě výzvy: Prosím, majestátní věž z koblihZkrácená možnost 1️⃣

Prosím, majestátní věž z koblih, vytvořená, řada barevných posypů, cukrové mistrovské dílo, vykreslená, magický realismus

Příkladový obrázek obrázku Midjourney vytvořený na základě výzvy: Prosím, majestátní věž z koblihZkrácená možnost 2️⃣

Prosím, majestátní věž koblih, barevné posypky, cukrové mistrovské dílo, vykreslené, magický realismus

Příkladový obrázek obrázku Midjourney vytvořený na základě výzvy: Prosím, majestátní věž z koblihZkrácená možnost 3️⃣

majestátní věž z koblih, barevné posypky, sladké, magický realismus

Příkladový obrázek obrázku Midjourney vytvořený na základě výzvy: Prosím, majestátní věž z koblihZkrácená možnost 4️⃣

majestátní věž z koblih, barevný posyp, kouzelná

Příkladový obrázek obrázku Midjourney vytvořený na základě výzvy: Prosím, majestátní věž z koblihZkrácená možnost 5️⃣

věž z koblih, posyp



Analýza výsledků

Nejkratší výzva, možnost Možnost 5 : věž z koblih, posypky  přinesla obrázek, který se nejvíce blížil původnímu cíli. Mnoho výplňových slov jako "rozmarný", "fascinující" a "mistrovské dílo" bylo možné vynechat. Poznatek, že slova "věž" a "kouzelná" byla považována za důležité žetony, pomáhá vysvětlit, proč byly vygenerovány některé obrázky s prvky pohádkového hradu. Poznatek poskytl vodítko, že "kouzelný" by měl být z výzvy odstraněn, pokud bylo cílem vytvořit hromadu lahodných koblih.

Příkaz  /shorten je nástroj, který vám pomůže prozkoumat, jak Midjourney Bot interpretuje tokeny, a experimentovat se slovy, ale nemusí fungovat pro všechna témata a styly výzev.


Jak používat funkci Shorten

Příkazem /shorten  v libovolném kanálu Bot získáte informace o své výzvě.

Kanály Bota jsou kanály Discordu, kde má Bot Midjourney povoleno zpracovávat příkazy Slash. Na oficiálním Discordu Midjourney jsou všechny kanály v kategoriích Newcomer Rooms, Thread Channels, Themed Image Gen a General Image Gen kanály Bota.