Jak na mix kódů sref, personalizaci a vlastní stylistiku v MidJourney

Jak na mix kódů sref a personalizace v MidJourney

Po vydání aplikace Midjourney Personalization and Style Reference máte větší kontrolu nad stylem a estetikou. Právě dnes přidali další pokročilé možnosti. Midjourney umožňuje kombinovat kódy --sref a --p a vytvářet tak novou estetiku! Můžete také upravit váhu stylu a používat kódy s odkazem na styl. Podívejme se, jak na to. Případně zapátrejte v mojí aktualiziované referenční příručce.

Prolínání kódů style

Co je to kód --sref

Namísto použití obrázku jako odkazu na styl můžete použít číslo spolu s parametrem --sref. Každý kód "sref" představuje konkrétní styl.

  • Použití: Za textovou výzvu napište --sref a číselný seed
  • Podnět: --sref 123

Dříve bylo možné použít vždy pouze jeden kód sref, který ovlivňoval estetiku obrázku, jako je tomu níže.

Zde jsou tři způsoby, jak prozkoumat nové vizuály.

Nyní můžete kombinovat více kódů --sref dohromady. Smícháním dvou kódů sref můžete spojit estetiku dvou stylů a vytvořit novou estetiku.

  • Formát: podnět --sref 123 456

Níže jsou zobrazeny tři různé obrázky s použitím jediného kódu sref a kombinací dvou dohromady.

Zde jsou další příklady prolínání stylů.

Nedávno jsem objevil zdroj, který sestavil seznam "Sref kódů", určitě se podívejte na tuto úžasnou webovou stránku midjourneysref.com

Druhý typ prolnutí referenčního obrázku stylu a kódů sref

Můžete také smíchat adresy URL referenčních obrázků stylu a náhodné kódy sref dohromady, jak je uvedeno níže.

Formát: podnět --sref 123 url

Zde je výsledek

Míchání typu tři: Směšování kódů a důležitosti (weight --iw)

Můžete použít váhu : : individualních stylů.

Co je podnět Weights

Pokud je dvojitá dvojtečka :: použita k rozdělení výzvy na různé části, můžete bezprostředně za dvojitou dvojtečku přidat číslo, které přiřadí dané části výzvy relativní důležitost.

Pro "odkazy na styl - Style references" můžeme použít důležitost přidáním čísla za adresu URL, abychom určili relativní důležitost referenčního obrázku.

Pro úpravu stylů můžete přiřadit relativní váhy, například: --sref 123::2 456::1

Výsedky příkladu

Směšování personalizačních kódů

Personalizace modelu umožňuje uživatelům vyladit model umělé inteligence podle svých uměleckých stylů a preferencí.

  • Přizpůsobení: Výběr uživatelských preferencí ve srovnání s výchozím modelem Midjourney
  • Použití: Přidejte --p do podnětu nebo povolte personalizaci v nastavení.

Nyní můžete také kombinovat více personalizačních kódů modelu dohromady, například --p ab12ad3 cd34gl.

Na rozdíl od kódu sref neurčuje personalizace styl, ale je spíše pocitem.

Stejně jako u kódu sref můžete styl ovlivnit také pomocí vah, například takto 
--p ab12ad3::2 cd34gl::1

Prolnutí personalizačních a sref kódů

Můžete také kombinovat více personalizačních kódů a sref kódů dohromady. O personalizaci najdete informace v našem předchozím článku Personalizace pro MidJourney V6 je tady! a také refernční příručce.

  • Textový podnět --sref 123 456 --p codeA codeB

Zde je příklad s kódem sref a bez něj

Překlad článku od Christie C. na Medium.com 


Personalizace pro MidJourney V6 je tady!

Udělejte si vlastní stylizace v Midjourney a získejte fast hour zdarma.

Na webu Midjourney můžete použít vlastní stylizaci přizpůsobení pomocí hodnocení obrázků a navíc získat nějaké fast hours zdarma. Až dosud měla každá verze Midjourney vlastní interní estetiku založenou na tréninku umělé inteligence s určitým vstupem preferencí uživatelů z procesu řazení. Nyní můžete vystoupit z řady a používat vlastní personalizaci založenou na vlastním hodnocení.

Co je ranking (pořadí)

Hodnocení neboli ranking je výběr jednoho z dvou obrázků, kterému dáváte přednost. Odkaz na něj najdete na webových stránkách midjourney.com v levém postranním panelu pod položkou Úkoly (Tasks). K dispozici máte vždy dva obrázky a můžete si zobrazit výzvu k jejich výběru. Vpravo nahoře je tlačítko pro přeskočení, pokud se nemůžete rozhodnout nebo vás nezajímá výběr jednoho z nich.

Nejlepší na tom je, že vám to nejen pomůže s personalizací, ale pokud se v daný den umístíte mezi prvními 2000 lidmi, kteří se umístili, budete odměněni rychlou hodinou zdarma. Pokud to budete dělat denně, můžete získat dalších 30 hodin měsíčně! Tímto způsobem vám Midjourney děkuje za to, že jim pomáháte trénovat umělou inteligenci v tom, co se nám opravdu líbí.



Byl jsem velmi skeptický, že tato personalizace bude fungovat, ale v mém případě má Midjourney alespoň moje číslo! Aby personalizace fungovala, musíte zařadit alespoň 200 párů obrázků.  Více je lepší. Kolik jste jich ohodnotili, můžete zjistit pomocí příkazu /info na serveru Discord, kde generujete obrázky.

Při řazení si vyberte ten, který se vám líbí více. Nedělejte si starosti s tím, jak to ovlivní vaši personalizaci, a příliš se nezabývejte tím, zda obrázky odpovídají výzvě; pokud jsou tam prsty navíc apod. prostě si vyberte to, co se vám líbí. Rád si pročítám podněty, abych získal nápady, jak lidé tvoří. Můžete dokonce ovládat (nebo příkazem) kliknutí na obrázek, čímž se obrázek zobrazí na nové kartě. Díky tomu si ho můžete prohlédnout ve větší velikosti; můžete dokonce kliknout na jméno tvůrce a zobrazit si jeho galerii, pokud je veřejná.

Někdy se zobrazí jeden nebo oba tyto obrázky, abyste zabránili náhodnému klikání nebo jakémukoli automatizování procesu. Neklikejte na křížek, pokud tak učiníte, budete muset ověřit, že jste člověk, a ztrácet tím čas. Za opakovaná chybná kliknutí  nezískáte rychlou hodinu (fast hour) pro daný den.

Jak spustit personalizovanou výzvu

Jakmile máte za sebou dostatečný počet hodnocení (alespoň 200), můžete začít používat parametr --p. Při jeho použití se vyplní ID osobního stylu; každý uživatel má své jedinečné. Pokud byste jej chtěli mít zapnutý neustále, použijte příkaz /settings na Discordu, nebo pokud používáte webové stránky, klikněte na ikonu nastavení vpravo od panelu představení. Když ji tam zapnete, nebudete muset pokaždé zadávat příkaz --p.

Discord



Website

Můžete také použít stylize - s 100 v rozsahu 0-1000, přičemž 100 je výchozí hodnota, pokud do výzvy nepřidáte žádné --s #.

Pokud nechcete mít toto nastavení trvale zapnuté, jednoduše přidejte --p a chcete-li navíc stylize --s # do výzvy, bude to fungovat také dobře.

A little girl having a tea party with her favorite dolls --p --s 100

A little girl having a tea party with her favorite dolls --p --s 1000

Jako příklad jsem si vybral svůj krátký podnět. Parametr --p zapíná personalizaci výzvy pomocí mého osobního kódu (který se doplní při generování obrázku) a parametr --s 1000 říká: „Zvyšte to na maximum“, abyste viděli co největší efekt.

 

Vlevo moje personalizace se stylizací 100 (výchozí) a vpravo na 1000 (maximální)

Líbí se mi styl chromolitografie, který je na mých personalizovaných obrázcích ve srovnání s výchozím stylem Midjourney dost viditelný. Pro srovnání jsem spustil stejnou výzvu bez personalizace, abychom viděli čistě interní estetický styl Midjourney:



Jak mohu zjistit, co dělá moje personalizace?

Jedním z rychlých způsobů, jak zjistit, k jakým druhům personalizace obrázků dochází, je spustit následující příkaz:

"" --p --s 1000

Vypadá to trochu šíleně, že? To, co spouštíte pomocí této výzvy, je prázdná výzva. Prázdný prompt není možné odeslat jinak než pomocí prázdné dvojice uvozovek. To doslova znamená „nic“, a když ho použijete, Midjourney vám bude halekat něco zajímavého. Níže jsou obrázky, které jsem dostal se zapnutou personalizací a kliknutím na stylizaci 1000.

"Prázdná" personalizace na stylize 1000

"Prázdná" personalizace na stylize 1000

Opět jsem pro srovnání provedl stejný test bez personalizace, abychom viděli pole, které získáme přímo z deffaultní stylizace Midjourney:

"" --p --s 1000



Výchozí stylizace Midjourney založená na interní estetice

Abyste si mohli udělat širší představu o tom, jak se mohou styly personalizace lišit, vytvořil jsem podobné sady s prázdnou výzvou a 1000 stylizací od několika svých přátel. Kód stylu můžete sdílet s přáteli a oni ho mohou sdílet s vámi, pokud si ho chcete vyzkoušet sami. Jakmile použijete --p, budete moci vidět svůj vlastní kód ve vypsaných obrázkových výzvách.

Ukázka jiného stylu personalizace

Překvapilo mě, jak moc se můj osobní styl liší od stylu mých různých přátel na serveru Midjourney! Myslím, že tento průřez ukázal, jak zajímavé a rozmanité mohou být styly. Musím říct, že ze všech se mi ten můj líbí nejvíc, a o to úplně jde!

Důležité poznámky

Byla oznámena nová funkce personalizace a výslovně bylo uvedeno, že je v pohybu, takže očekávejte, že bude mít pár výkyvů, než se vyřeší chyby.

Personalizace není v tuto chvíli stabilní funkcí, bude se měnit s tím, jak budete provádět více párových hodnocení (nenápadně), a je možné, že v příštích několika týdnech budeme vydávat aktualizace algoritmu. Takže předpokládejte, že je to „zábavná funkce, která se neustále mění“.



Závěrem

Funkce personalizace nemusí být šálkem čaje pro každého, ale přestože jsem byl zpočátku skeptický, jsem docela ohromen tím, jak dobře Midjourney vystihla to, co se mi líbí na základě mého hodnocení. Nečekal jsem, že to, jak jsem hodnotil výtvory ostatních lidí, bude tak dobrým ukazatelem mých preferencí, ale zdá se, že to funguje. Zkuste to a uvidíte, jak to dopadne u vás!

Překlad článku od PromptDervish na BootCamp Medium.com


Za 36 hodin režisérem, hudebním tvůrcem a producentem.

Jak se díky AI posunout tam, kde to bylo dříve nemožné.

Tento příběh je inspirací pro všechny, kdo touží po nových způsobech vyjádření, a ukazuje, že s AI je možné dosáhnout úspěchu i tam, kde by to dříve bylo nemožné. Výsledkem je nejen umělecké dílo, ale také nové přístupy k tvorbě, které mění pravidla hry v oblasti umění a kultury.

Je rok 2021 a já se začínám učit s umělou inteligencí. Zatím nevím, co s ní nakonec budu dělat, ale pevně věřím, že to bude mít velký potenciál. Vzdálená vidina je, že mi pomůže udělat pokračovaní mé horrorové adventury s názvem Dark Disharmony, ale jak to tak u mě bývá, věci se vždycky vyvinou trochu jinak, než předpokládám.

Dark Disharmony

Prošel jsem si hromady projektů, a nakonec jsem zůstal u MidJourney pro generování grafiky, které jsem pro náš malý český národ přeložil kompletní příručku. Vždycky u mě fungovalo, že jestli se chci něco naučit musím si udělat zápisky, a tak na svém blogu d3arts.cz vydávám.

Díky mé hlavní práci, kterou je ISP ve společnostni Best-Net si mohu dovolit konečně zakoupit pořádnou grafickou kartu, abych na lokální pracovní stanici mohl rozjet Stable Diffusion a dovolit si ten luxus generovat grafiku bez cenzury a pouze za cenu propálené elektřiny. Díky nastudovaní práce se Stable Diffusion vytvářím za pomocí LoRA modelu a SDXL checkpointů svoji konzistentní AI postavu - ai modelku. Předlohy jsem pro LoRA model jsem si předgeneroval v MidJourney za pomocí obrázkových podnětů - z rrůzných úhlů. Z těchto předloh vytvářím Lenku Baier. Půvabnou blondýnku, která vyhovuje mému estetickému citu.

Lenka Baierová - naše instagramová fitness modelka

Z dalších vytvořených generací zdokonaluji svůj AI model a někdy se snížím i ke faceswapu pomocí ReActor pluginu. Lenka ožívá na sociální síti Instagram, kde mate nové sledující poměrně dráždivým obsahem, abych pak zjistil, že hrát si na influencera a psát si s bandou nadržených followerů není něco, co by mě zrovna naplňovalo. Mimochodem jedem z přátel se do mé modelky zamiloval, a tak jsem přišel o kamaráda, který nerozdýchal to, že Lenka Baier je můj výtvor. V práci s AI se dále vzdělávám a objevuji na Facebooku různé komunity.

Jedna z nich je skupina Cursed AI, kde se lidé baví bizárem, který AI umí vyplivnout. Sám vytvářím vlastní komunitu AI grafici. S rozvojem umělé inteligence různí fantasti a tvůrci clickbaitů, kteří vytváří mysteriózní fotografie z minulosti, a tak se dostáváme k jádru mé nynější tvorby a tím je prompt:

Giant *something*, Kandahar circa 1923

...kterým se skupina Cursed AI baví do té míry, až se stavá toto téma bannovaným a na čas díky těmto restrikcím se stává zapomenutým. Mě ale tato estetika nemyslitelného natolik uchvátila, že jsem pokračoval v jejím rozvíjení.

V roce 2024 spolu s Petrem Marešem a Martino Jurčekovou čistě náhodou pořádáme výstavu AI Galerii Moderního Umění v Hradci Králové – 2045: Human Expiration, kde žiju a vyměňujeme si dojmy a znalosti z AI. Tak jsem se stal součástí umělecké skupiny Homo Digitalis 3.2.1. Výstava má nečekaný úspěch a píše se o nás třeba v české verzi Wired. Petr, je kromě své spisovatelské kariéry také hudebníkem, a tak se dostávám ke generování hudby prostřednictví Udio, se kterým se mi myslím poměrně daří generovat můj oblíbený mikro-žánr a tím je synthwave, což je mix 90-kového diska a nové vlny elektronické hudby. Martina experimentuje s RunwayML pro generování videí. A tak se během volných chvílích, které mi žena poskytuje plně ponořuji do studia těchto projektů.

Human Expiration: 2045 exhibition Hradec Kralove - Wired - Petr Chroustovsky

Díky nástroji Image to Video a dobře vypracovaným promptům si nejdříve v MidJourney předgeneruji databázi obrázků, většinou si vytvořím až dvě sta generací, ze kterých pak prostřednictví RunwayML vytvářím pohyblivé obrázky. A tak se dostáváme k prvnímu singlu s názvem Secrets of Kandahar - Circa 1923. Kde s verzí Gen-2 vytvářím kompletní videoklip a umísťuji jej na svůj YouTube kanál.  

Vítejte ve fantastickém světě Kandaháru. Hudební video realizované za pomoci nástrojů umělé inteligence, kde se nemyslitelně mísí prvky dokumentárních záběrů arabské kultury s bizarně vypadající technologií, hyperkýčem, dadaismem a techno mystikou. 

Jelikož mám za sebou dvě umělecké Školy Aplikované Kybernetiky v HK, terminologie i technologie mi nedělají problém a vytvořené věci jsou už pouze záležitostí mého vlastního vkusu. Nenechte se mýlit, že všechno je jen záležitostí promtů. Dost často sahám do Photoshopu, abych pro nástroj Image to Video vytvořil ideální předlohu rovné mé představě a někdy to sakra bolí. Něž takový záběr použiji předchází mu asi kolem padesáti generací, než jsem spokojený.

Z toho důvodu jsem si spočítal, že u RunwayML se mi vyplatí jít do verze  Unlimited a tak dávám poměrně slušnou sumu na oltář AI, aby se mi dařili opravdu kvalitní výstupy. U MidJourney a Udio je to podobné, a tak jsem se rozhodl, že vytvořím kompletní album. Nicméně představte si, že byste měli vytvořit kompletní klip s normálním štábem a počítačovou grafikou a vytvořit něco podobného klasickou cestou. To jsou úplně jiná čísla.

AI je skvělá, ale nesmíte se bát do ni neinvestovat čas a peníze.

 V Udio Beta projíždím ostatní autory, a koukám na jejich prompty Text to Music a zjišťuji, že je dobré přesně specifikovat hudební nástroje, či syntetizátory, požívat kombinovaní pomocí „Synthwave& Synthpop“ - což není nikde uváděno. Užít „In style of *jméno umělce*“  a používat remixy Inpaint fází skladby, které se mi nezdají. Také je dobré použít konkrétní syntetizátory a jmenovat je jako "synthetizer OB-X, synthetizer CS-80". Rytmičtější skladby mohou mít 128 až 140 BPM, tedy počet úderů za minutu - tepovka, což je dobré jmenovat. Také je dobré specifikova náladovost skladby "playful, passionate, warm, lush, uplifting, lonely" atd. Pokud chcete ovládat zpěv použijte Custom nebo Autogenerated lyrics - "Female/Male vocalist". Opět k dobrému kusu docházím kolem osmdesáti generací, než tam to světýlko cítím. 

Díky zpětné vazbě se taky dozvídám, že existuje něco jako Tísnivé Údolí, a že některé neopodstatněné hejty a zpětné vazby jsou způsobené prostě tím, že téměř dokonalé generace vlastně lidi děsí. Což právě není můj případ naštěstí, a proto je dobré na to pamatovat a umělecky se k tomu postavit tím, že některé věci prostě přiznávám. Mimochodem tento fenomén nám pomáhá přežít, nacházet kazy ve vzoru a zkoumat nesrovnalosti, či vynalézat na základně nesrovnalostí.

Nicméně zpětná vazba mě v následujícím klipu donutila vypracovat příběh a zapojit moji AI modelku jako zpěvačku. Pomocí nástroje Lalal.ai – rozdělovače zvukových stop, oddělím z Udiem vytvořené skladby samotný zpěv. Určitou stopu, pak využiji k Lip-Sync, který RunwayML Gen3-Alpha umí a tak z generovaného videa modelky vpravím do jejich rtů zpěv.

Pomocí distribučních platforem jako je DistroKid dané skladby dostanu na všechny možné hudební paltformy jako jsou.. vezmu to popořadě:  Amazon, Anghami,  iTunes, Apple Music, MediaNet, Boomplay, Deezer, Instagram, Facebook, Adaptr, Flo,  YouTube Music iHeartRadio, Clar Música, JooBox, Kuck Media, NetEase, Qobuz, Pandora, Saavn, Spotify, Tencentu, Tridal, TikTok Music. A odnož distribuční platfomy  DistroVid – platforma pro hudební klipy zase na Vevo, iTunes Video, Apple Music, TikTok Music, Tridal a Boomplay.

Nakonec to nejzajímavější, co se distribuce týče je dostat takové dílo na nějaký festival. S tím pomůže platforma Filmfreeway.com, kde se vyplatí zaplatit si zlaté členství  a po zadání AI do vyhledávání si vybrat festival, kde s trochou štěstí vaše dílo vyberou a zaplatit za přihlášku o něco méně. Já se osobně těším na festival Czech International AI_Film Festival v Praze, které bude letos po třetí v kině Atlas. Popřejte mi štěstí.

Ať se vám to líbí, nebo ne, (r)evoluce ve filmové tvorbě je tady a je poháněna umělou inteligencí.

Jestli jste všestranný umělec, který raději pracuje sám AI se stane vaším nejlepším kolegou, který enormně zvýší vaši produktivitu a doslova zvládne vycucnout veškeré vaše nápady a inspirace. Proto si myslím, že nastává doba „malých“ šikovných lidí, kteří tak dokáží vytvořit opravdu originální a kvalitní díla v nezvykle velkém množství. Já už přidám jen poslední dílo, kterým je singl Giants a na klipu ještě pracuji. 

Jak řekl jeden můj profesor: „Nikdy nevíte, kam vás vítr zavane, a proto se učte všechno.“ A měl pravdu, protože nutná dávka obecné přehledu, dějin umění a termínů je něco, co vás oddělí od ostatních, co pracují s AI stejně jako u vytváření her potřebujete nutné znalosti pokročilé matematiky, protože AI za vás nápad nevymyslí, ale rozhodně ho pomůže vydatně realizovat a já se sní snad jednou dostanu k Dark Disharmony 2. Já už se pomalu teď stávám díky AI Meta-člověkem (kterým se zabýváme na naší výstavě), protože už teď jsem díky ní odstranil spoustu mých nedostatků jako jsou jazyková bariéra, slabé schopnosti programování i nedostatek času na kvalitní tvorbu, který rozděluju i mezi starost o svou rodinu. I tak se mi daří najít čas a posunout tuto AI artovou tvorbou o kousek dál, jak v novém klipu s názvem Saucers.