Personalizace pro MidJourney V6 je tady!

Udělejte si vlastní stylizace v Midjourney a získejte fast hour zdarma.

Na webu Midjourney můžete použít vlastní stylizaci přizpůsobení pomocí hodnocení obrázků a navíc získat nějaké fast hours zdarma. Až dosud měla každá verze Midjourney vlastní interní estetiku založenou na tréninku umělé inteligence s určitým vstupem preferencí uživatelů z procesu řazení. Nyní můžete vystoupit z řady a používat vlastní personalizaci založenou na vlastním hodnocení.

Co je ranking (pořadí)

Hodnocení neboli ranking je výběr jednoho z dvou obrázků, kterému dáváte přednost. Odkaz na něj najdete na webových stránkách midjourney.com v levém postranním panelu pod položkou Úkoly (Tasks). K dispozici máte vždy dva obrázky a můžete si zobrazit výzvu k jejich výběru. Vpravo nahoře je tlačítko pro přeskočení, pokud se nemůžete rozhodnout nebo vás nezajímá výběr jednoho z nich.

Nejlepší na tom je, že vám to nejen pomůže s personalizací, ale pokud se v daný den umístíte mezi prvními 2000 lidmi, kteří se umístili, budete odměněni rychlou hodinou zdarma. Pokud to budete dělat denně, můžete získat dalších 30 hodin měsíčně! Tímto způsobem vám Midjourney děkuje za to, že jim pomáháte trénovat umělou inteligenci v tom, co se nám opravdu líbí.

Byl jsem velmi skeptický, že tato personalizace bude fungovat, ale v mém případě má Midjourney alespoň moje číslo! Aby personalizace fungovala, musíte zařadit alespoň 200 párů obrázků.  Více je lepší. Kolik jste jich ohodnotili, můžete zjistit pomocí příkazu /info na serveru Discord, kde generujete obrázky.

Při řazení si vyberte ten, který se vám líbí více. Nedělejte si starosti s tím, jak to ovlivní vaši personalizaci, a příliš se nezabývejte tím, zda obrázky odpovídají výzvě; pokud jsou tam prsty navíc apod. prostě si vyberte to, co se vám líbí. Rád si pročítám podněty, abych získal nápady, jak lidé tvoří. Můžete dokonce ovládat (nebo příkazem) kliknutí na obrázek, čímž se obrázek zobrazí na nové kartě. Díky tomu si ho můžete prohlédnout ve větší velikosti; můžete dokonce kliknout na jméno tvůrce a zobrazit si jeho galerii, pokud je veřejná.

Někdy se zobrazí jeden nebo oba tyto obrázky, abyste zabránili náhodnému klikání nebo jakémukoli automatizování procesu. Neklikejte na křížek, pokud tak učiníte, budete muset ověřit, že jste člověk, a ztrácet tím čas. Za opakovaná chybná kliknutí  nezískáte rychlou hodinu (fast hour) pro daný den.

Jak spustit personalizovanou výzvu

Jakmile máte za sebou dostatečný počet hodnocení (alespoň 200), můžete začít používat parametr --p. Při jeho použití se vyplní ID osobního stylu; každý uživatel má své jedinečné. Pokud byste jej chtěli mít zapnutý neustále, použijte příkaz /settings na Discordu, nebo pokud používáte webové stránky, klikněte na ikonu nastavení vpravo od panelu představení. Když ji tam zapnete, nebudete muset pokaždé zadávat příkaz --p.

Discord

Website

Můžete také použít stylize - s 100 v rozsahu 0-1000, přičemž 100 je výchozí hodnota, pokud do výzvy nepřidáte žádné --s #.

Pokud nechcete mít toto nastavení trvale zapnuté, jednoduše přidejte --p a chcete-li navíc stylize --s # do výzvy, bude to fungovat také dobře.

A little girl having a tea party with her favorite dolls --p --s 100

A little girl having a tea party with her favorite dolls --p --s 1000

Jako příklad jsem si vybral svůj krátký podnět. Parametr --p zapíná personalizaci výzvy pomocí mého osobního kódu (který se doplní při generování obrázku) a parametr --s 1000 říká: „Zvyšte to na maximum“, abyste viděli co největší efekt.

 

Vlevo moje personalizace se stylizací 100 (výchozí) a vpravo na 1000 (maximální)

Líbí se mi styl chromolitografie, který je na mých personalizovaných obrázcích ve srovnání s výchozím stylem Midjourney dost viditelný. Pro srovnání jsem spustil stejnou výzvu bez personalizace, abychom viděli čistě interní estetický styl Midjourney:

Jak mohu zjistit, co dělá moje personalizace?

Jedním z rychlých způsobů, jak zjistit, k jakým druhům personalizace obrázků dochází, je spustit následující příkaz:

"" --p --s 1000

Vypadá to trochu šíleně, že? To, co spouštíte pomocí této výzvy, je prázdná výzva. Prázdný prompt není možné odeslat jinak než pomocí prázdné dvojice uvozovek. To doslova znamená „nic“, a když ho použijete, Midjourney vám bude halekat něco zajímavého. Níže jsou obrázky, které jsem dostal se zapnutou personalizací a kliknutím na stylizaci 1000.

"Prázdná" personalizace na stylize 1000

"Prázdná" personalizace na stylize 1000

Opět jsem pro srovnání provedl stejný test bez personalizace, abychom viděli pole, které získáme přímo z deffaultní stylizace Midjourney:

"" --p --s 1000

Výchozí stylizace Midjourney založená na interní estetice

Abyste si mohli udělat širší představu o tom, jak se mohou styly personalizace lišit, vytvořil jsem podobné sady s prázdnou výzvou a 1000 stylizací od několika svých přátel. Kód stylu můžete sdílet s přáteli a oni ho mohou sdílet s vámi, pokud si ho chcete vyzkoušet sami. Jakmile použijete --p, budete moci vidět svůj vlastní kód ve vypsaných obrázkových výzvách.

Ukázka jiného stylu personalizace

Překvapilo mě, jak moc se můj osobní styl liší od stylu mých různých přátel na serveru Midjourney! Myslím, že tento průřez ukázal, jak zajímavé a rozmanité mohou být styly. Musím říct, že ze všech se mi ten můj líbí nejvíc, a o to úplně jde!

Důležité poznámky

Byla oznámena nová funkce personalizace a výslovně bylo uvedeno, že je v pohybu, takže očekávejte, že bude mít pár výkyvů, než se vyřeší chyby.

Personalizace není v tuto chvíli stabilní funkcí, bude se měnit s tím, jak budete provádět více párových hodnocení (nenápadně), a je možné, že v příštích několika týdnech budeme vydávat aktualizace algoritmu. Takže předpokládejte, že je to „zábavná funkce, která se neustále mění“.

Závěrem

Funkce personalizace nemusí být šálkem čaje pro každého, ale přestože jsem byl zpočátku skeptický, jsem docela ohromen tím, jak dobře Midjourney vystihla to, co se mi líbí na základě mého hodnocení. Nečekal jsem, že to, jak jsem hodnotil výtvory ostatních lidí, bude tak dobrým ukazatelem mých preferencí, ale zdá se, že to funguje. Zkuste to a uvidíte, jak to dopadne u vás!

Překlad článku od PromptDervish na BootCamp Medium.com


Nová vlna AI oper: Revoluce v české operní scéně

Česi používají Suno AI k vytváření oper známých českých bizárů.

V posledním roce se na české YouTube scéně objevuje fenomén, který by byl ještě nedávno považován za science fiction – opery vytvářené za pomoci umělé inteligence. V Suno AI, je totiž možné za pomocí přidání textu a podnětu ke stylu hudby generovat klasické skladby. Tento přístup přináší zcela nové zážitky a Češi se samozřejmě chytli klasických bizárů a virálních videí, jež posouvají hranice toho, co si tradičně představujeme pod pojmem opera. Jako znalci bizáru a milovníku nekorektního humoru mi nedalo, než o tomto comebacku napsat a hodit to s panem Kletbou pěkně na papír.

Bába pod kořenem

Jedním z prvních a nejvíce diskutovaných děl této nové vlny je opera Bába pod kořenem. Tento experimentální projekt využívá AI ke komponování hudby i k vytváření libret, čímž vzniká dílo, které se vymyká tradičním operním schématům. Opera vypráví příběh z bizarní reportáže TV Nova Davida Pika, který zdokumentoval a zdramatizoval banální příběh staré ženy, která se při pitce s kamarády v lese zasekla pod kořenem. Některé hlášky z reportáže zlidověly a paní Zdena si později v Praze otevřela restauraci s názvem Restaurace Kotva – U báby pod kořenem. Temné a tajemné tóny, které AI vygenerovala, perfektně podtrhují atmosféru díla, jež se pohybuje na pomezí mýtu a reality. 

Ondřeji, prosím

Dalším významným projektem je opera Ondřeji, prosím!, která kombinuje jeden s prvních českých virálů a to Drsný rozchod v Praze. Psal se rok 2012, když se světem internetu začalo šířit dnes již legendární a na tehdejší dobu poměrně drsné video, ve kterém se jistý Ondřej rozchází s blonďatou slečnou. Hystericky brečící blondýnka Kristýna ve videu zakřičí zhruba stokrát zlidovělou hlášku „Ondřeji, prosím!“. To je taky námětem této AI opery, kterou shledávám nejpovedenější. Chvála Tesařovi.

Svatba Jiřího Káry

Svatba Jiřího Káry je jednou z nejvíce provokativních a ikonických AI oper, které v Suno vznikly. Jde o satirickou operu inspirovanou životem a svatbou Jiřího Káry - svatby bezdomovců, legendární postavy českého alko undergroundu s drsnou příchutí devadesátek. Jiří Kára zažívá comeback po někalikátem zabanování a znovunahrání především díky práci facebookové skupiny Jiří Kára. Tato opera využívá AI k vytvoření hudebního doprovodu, který kombinuje hlášky ze svatby bezdomovců a klasických operních postupů. Výsledkem je neotřelé a drsné dílo, které nezapomíná ani na Stránskýho vyprcanýho. Čest všem vydlážděným.

Svarta Jump

Zcela jiný přístup pak představuje opera Svarta Jump, která je inspirována skokem otrokovického pablba a tedy vítěze olympiády v jumpování z vejšky jako prase. Video se stalo virálním myslím v roce 2021 tedy za covidu a AI v tomto projektu využívá rozsáhlé databáze lidových melodií a rytmů, které kombinuje s touto bizarní opileckou polosebevraždou.

Oprava slovenského lakatoše

Nesmíme také zapomenout na opravu lakatoše provázenou hysterickými hláškami "Ani očko nenasadíš" nebo argresivními projevy "Nebudu to dělat" až po agresivní výhružky, defeatistické fáze až po smíření slavného bezejmeného opraváře, který byl něvědomky zachycen mikrofonem mobilního telefonu kolem roku 2010, která se nesmazatelně vryla do cache českých databází se slovy "Nebudu to dělat".

Ať je to jak chce, videa se stali populární a Češi opět prokázili svůj charakterový rys smějících se bestií, kteří AI využijí především proto, aby zvětšnili dávno zapomenuté perly českých internetů. V podstatě už neexistuje nic exkluzivního, na co by AI opera nebyla. To všechno ukazuje, jak na nesmrtelnost těchto virálů, které se za nějakou dobu po smazání zase někde objeví, ale i na nepředvídané schopnosti AI s generováním hudby. Navíc je to příležitost jak mladé generaci připomenout tyto bizární klenoty a přitáhnout je zpět ke klasice.


Tísňové údolí a generovaná AI videa

Proč je někoho nesmírně těžké dívat se na umělý vizuál..

Tísňové údolí (anglicky „uncanny valley“) je fenomén, který popisuje negativní reakci člověka na umělou bytost nebo objekt, který je téměř, ale ne zcela lidský. Tento koncept poprvé představil japonský robotik Masahiro Mori v roce 1970. Podle Moriho teorie dochází ke stavu tísňového údolí tehdy, když robot, avatar nebo jiný umělý výtvor vypadá téměř jako člověk, ale stále vykazuje drobné nedokonalosti nebo zvláštnosti, které způsobují pocit nepohodlí či odporu.

Závislost lidských emocí při vnímání robota s proměnlivou mírou antropomorfismu. Osa x představuje míru antropomorfismu od zcela nehumanoidní bytosti po bytost nerozeznatelnou od člověka, osa y zachycuje míru emocí při vnímání takové bytosti lidmi. V počátku je neutrální, směrem nahoru rostou pozitivní a směrem dolů negativní emoce.

Závislost lidských emocí při vnímání robota s proměnlivou mírou antropomorfismu. Osa x představuje míru antropomorfismu od zcela nehumanoidní bytosti po bytost nerozeznatelnou od člověka, osa y zachycuje míru emocí při vnímání takové bytosti lidmi. V počátku je neutrální, směrem nahoru rostou pozitivní a směrem dolů negativní emoce.

Téměř lidští androidi nás děsí. Zjednodušený graf s průběhem od strojového robota s tísňovým údolím až téměř dokonalého zjevu a plně lidského zjevu.  

Tísnivé údolí, někdy též strašidelné údolí, je oblast na pomyslném grafu závislosti polarity lidských emocí při vnímání humanoidů (robotů, počítačem vytvořených trojrozměrných postav, detailně vymodelovaných panenek apod.) podle jejich míry podobnosti s člověkem (antropomorfismu). Míra kladných emocí při vnímání postupně lépe a lépe antropomorfizované bytosti zpočátku stoupá, ale nepředstavuje prostou funkci – od určité míry antropomorfismu klesá až k negativním emocím, aby těsně před metou dokonalé antropomorfizace opět stoupla k maximu. Interval v míře antropomorfismu, jímž obdařeného humanoida člověk vnímá odpudivě, se nazývá tísnivé údolí.

Mozek na funkční magnetické rezonanci při sledování robota, androida a člověka. Kredit: Ayse Pinar Saygin, UC San Diego. Sayginová a spol. natočili videa na nichž Repliee Q2, Japonka, která byla předobrazem podoby aktroidky a pak tentýž robot v syrové podobě bez lidského povrchu, tedy připomínající terminátora, dělají běžné pohyby, jako je mávání, přikyvování, uchopování sklenky s vodou nebo zvedání kousku papíru. Dobrovolníkům nejprve prozradili, kdo je na kterém videu, pak jim je pustili a sledovali jejich mozky funkční magnetickou rezonancí. Nedostižná matka Sheldona Coopera by jistě měla radost.

Tísňové údolí v kontextu generovaných AI videí

V posledních letech se s rozvojem umělé inteligence (AI) a pokročilých algoritmů pro generování videa stává tísňové údolí stále aktuálnějším tématem. AI dnes dokáže generovat realistická videa, která jsou na první pohled k nerozeznání od skutečnosti. Avšak když se tato videa dostanou do bodu, kdy jsou „téměř dokonalá“, ale stále obsahují drobné anomálie – například nepatrně nepřirozené pohyby, zvláštní výrazy obličeje, nebo nesoulad mezi mluveným slovem a pohyby rtů – mohou vyvolat silný pocit nepohodlí nebo dokonce strachu.

Generovaná videa mohou tísňové údolí překonat dvěma způsoby. Prvním je neustálé zdokonalování technologií, až do bodu, kdy budou tyto drobné chyby zcela odstraněny a umělé výtvory budou zcela nerozeznatelné od skutečných lidí. Druhým přístupem je úmyslné ponechání určitých znaků „umělosti“, aby diváci okamžitě rozpoznali, že se jedná o ne-lidskou tvorbu, což snižuje míru nepohodlí.

Tísňové údolí a robotika

Robotika je dalším polem, kde tísňové údolí představuje významnou výzvu. Moderní humanoidní roboti jsou navrhováni tak, aby napodobovali lidské chování, výrazy obličeje a pohyb. Když je však jejich podoba a pohyb příliš realistický, ale ne zcela přesný, mohou vyvolávat nepříjemné pocity u lidí, kteří s nimi přicházejí do styku. Tento jev může mít závažné důsledky pro aplikace, kde je důležitá interakce mezi lidmi a roboty, například v péči o seniory nebo v zákaznickém servisu.

Aby se minimalizoval efekt tísňového údolí, designéři robotů často volí stylizovaný nebo zjednodušený vzhled, který sice připomíná lidské rysy, ale je dostatečně odlišný, aby nevyvolával pocit, že jde o skutečného člověka. Tento přístup je patrný například u robotů typu „Pepper“, kteří mají záměrně zjednodušený a přátelský design.

Budoucnost a etické otázky

Jak generovaná AI videa, tak humanoidní roboti budou v budoucnosti stále častěji překonávat hranice mezi umělým a skutečným. To přináší nejen technologické, ale i etické otázky. Jaký vliv bude mít tísňové údolí na naši psychiku, a jak bychom měli přistupovat k designu těchto technologií, aby byly pro lidi co nejpřirozenější a nejpřijatelnější?

V oblasti AI generovaných videí se také objevuje otázka autenticity a důvěryhodnosti. Jakým způsobem budeme schopni rozpoznat, co je skutečné a co je generováno AI? A jak zajistíme, že tyto technologie nebudou zneužity k šíření dezinformací nebo manipulaci veřejného mínění?

V konečném důsledku je tísňové údolí nejen technickým problémem, ale i hlubokým filozofickým a etickým dilematem, které bude nadále formovat budoucnost robotiky a AI technologií. Rozpoznání a překonání tohoto fenoménu je klíčovým krokem pro vytvoření technologií, které budou sloužit lidem a současně budou respektovat naše přirozené reakce a emocionální potřeby.