Jak na konzistentní postavy v Midjourney V6

Midjourney V6 dokáže generovat konzistentní postavy - to je obrovská věc

Před dvěma měsíci se hra Dall-E 3 od společnosti OpenAI stala virální, když uživatelé zjistili, že mohou vytvářet postavy s jednotným stylem a estetikou. Někteří z nich dokonce vytvořili aplikace GPT, jako je Consistent Character GPT.

Společnost Midjourney konečně vydala podobnou funkci nazvanou Reference postav - Character Reference.

Představte si, že jste ilustrátor, animátor nebo prostě umělec, který chce generovat více verzí vlastního návrhu postavy z různých úhlů - tato nová funkce Midjourney je přesně to, co potřebujete.

Co je Reference postavy?

Reference postavy je nová funkce v aplikaci Midjourney, která uživatelům umožňuje generovat konzistentní postavy z různých úhlů na základě zadaného referenčního obrázku.

Je podobná funkci „Reference stylu“, ale namísto shody s referenčním stylem se snaží, aby vygenerovaná postava odpovídala rysům postavy na referenčním obrázku.

Můžete dokonce smíchat více referenčních znaků zadáním více než jedné adresy URL oddělené mezerami, stejně jako při použití více podnětů k obrázku nebo stylu.

Jak skvělé to je? Tato funkce funguje jak ve webové verzi Midjourney pro Discord, tak pro webovou verzi Alpha.

Jak to funguje

Nejprve otevřete aplikaci Midjourney Bot a začněte generovat návrh postavy. Zde je příklad výzvy:

Příklad: Prompt: Vytvořte vysoce detailní 3D render herní postavy ve stylu Pixar na bílém pozadí, záběr na celé tělo. Postava je dospívající kluk s mírně kudrnatými vlasy, trochu baculatý, má na sobě černou mikinu s kapucí a modré šortky -- s 250 -- v 6.0

Prompt: Create a highly detailed, Pixar 3D render of a game character on a white background, full body shot. The character is a teenager guy with slightly curly hair, a little chubby, wearing black hoodie, and blue shorts — s 250 — v 6.0


Jak dělat konzistentní charakter MidJourney, Image by Jim Clyde Monge

Vyberte jeden z vygenerovaných obrázků, který chcete zvětšit, a získejte odkaz na obrázek kliknutím pravým tlačítkem myši a výběrem možnosti „Kopírovat adresu obrázku - Copy image adress“.

Jak dělat konzistentní charakter MidJourney, Image by Jim Clyde Monge

Poté vygenerujte další sadu obrázků s podobnou výzvou, ale tentokrát přidejte tyto parametry:

  • Mává - He is waving
  • --cref https://s.mj.run/KgVmyVmf4o8
  • --cw 100“

Vaše nová výzva by tedy vypadala takto:

Prompt: Vytvořte vysoce detailní 3D render herní postavy na bílém pozadí, záběr celého těla. Postava je dospívající kluk s mírně kudrnatými vlasy, trochu baculatý, oblečený v černé mikině s kapucí a modrých šortkách. Mává - cref https://s.mj.run/KgVmyVmf4o8 - cw 100

Prompt: Create a highly detailed, Pixar 3D render of a game character on a white background, full body shot. The character is a teenager guy with slightly curly hair, a little chubby, wearing black hoodie, and blue shorts. He is waving — cref https://s.mj.run/KgVmyVmf4o8 — cw 100

Jak dělat konzistentní charakter MidJourney, Image by Jim Clyde Monge

A voila! Nově vygenerované obrázky by měly vypadat téměř stejně jako referenční obrázek, ale postava nyní mává. Jak je to skvělé? Poté můžete vygenerovat další verze postavy v různých pózách. Možnosti jsou nekonečné.

Jak dělat konzistentní charakter MidJourney, Image by Jim Clyde Monge

Reference postavy v Midjourney Alpha

Pokud dáváte přednost použití webové stránky Midjourney Alpha, jednoduše přetáhněte referenční obrázek do části s výzvou. Ujistěte se, že je obrázek nastaven na „Použít jako výzvu k zadání obrázku“.

Jak dělat konzistentní charakter MidJourney, Image by Jim Clyde Monge

Pak zadejte výzvu a stiskněte klávesu enter. Například:

Prompt: Vytvořte vysoce detailní 3D render herní postavy na bílém pozadí, záběr celého těla. Postava je roztomilá dospívající dívka, trochu baculatá, má na sobě růžové běžecké kalhoty. Mává na sebe.

Prompt: Create a highly detailed, Pixar 3D render of a game character on a white background, full body shot. The character is a cute teenager girl, a little chubby, wearing pink jogging pants She is waving

Jak dělat konzistentní charakter MidJourney, Image by Jim Clyde Monge

Při testování jsem si všiml některých rozdílů mezi referenčním obrázkem a vygenerovaným obrázkem, pokud jde o oblečení, boty a vlasy. Nebyl jsem si jistý, co je příčinou problému, a tak jsem místo toho zkusil znovu použít Discord.

Jak dělat konzistentní charakter MidJourney, Image by Jim Clyde Monge

A hle, obrázek vytvořený společností Discord byl mnohem bližší referenci! S nastavením webového rozhraní mohou být nějaké problémy, které je třeba vyřešit.

Poznámka: Úpravou hodnoty parametru --cw můžete upravit, jak referenční obrázek ovlivní konečný výstup.

  • Úpravou hodnoty parametru--cw upravte „sílu“ referenčního obrázku ze 100 na 0.
  • strenght 100 (--cw 100) je výchozí hodnota a používá obličej, vlasy a oblečení.
  • Při síle 0 (--cw 0) se zaměří pouze na obličej (vhodné pro změnu oblečení, vlasů atd.).

K čemu je určen?

Mějte na paměti, že funkce Character Reference je stále ve fázi beta a tým Midjourney upozorňuje na některá aktuální omezení:

  • Tato funkce funguje nejlépe, když používáte postavy vytvořené z obrázků Midjourney. Není určena pro skutečné osoby / fotografie (a pravděpodobně je bude zkreslovat, jako to dělají běžné obrázkové nápovědy).
  • Cref funguje podobně jako běžné obrázkové nápovědy, s tím rozdílem, že se „zaměřuje“ na rysy postavy.
  • Přesnost této techniky je omezená, nezkopíruje přesně dolíčky, pihy ani loga na tričkách.
  • Cref funguje pro modely Niji i normální MJ a lze jej také kombinovat s parametrem --sref

Zde je příklad s parametry --cref i --sref:

Prompt: a girl drinking coffee - cref https://s.mj.run/pI1CVNG141Q - sref https://s.mj.run/OJGOsuC2XKE - s 250 - v 6.0

Jak dělat konzistentní charakter MidJourney Influencer, Image by Jim Clyde Monge

Páni, to je opravdu působivé.

Při použití referenčního obrázku, který má specifický styl, vřele doporučuji zahrnout také parametr - sref. Opravdu to pomáhá dosáhnout konzistentní estetiky.

Závěrečné myšlenky

Celkově jsem si užil spoustu zábavy při používání nové funkce odkazů na postavy v Midjourney. Ale kromě toho, že se jedná o zábavný nástroj, nemohu si pomoci, ale musím se podivit nad obrovskými důsledky, které to má pro odvětví grafického designu a fotografie.

Představte si, že pořídíte jedinou svou fotografii a necháte umělou inteligenci během několika sekund vygenerovat několik jejích póz.

NFC hodnocenky Google

Sám jsem výtvarník a dokážu si snadno představit, jaký dopad to bude mít na ilustrátory. Možnost vygenerovat konzistentní postavy z různých úhlů během pouhých několika sekund na základě jediného odkazu naprosto mění pravidla hry. Tvůrci se musí naučit přizpůsobit a využívat tuto technologii co nejdříve, než pokročí natolik, že potenciálně zcela nahradí lidské umělce!

Potenciál pro herní průmysl je také ohromující. Generování póz a spritů by mohlo změnit hodiny práce na minuty. Mluvíme o zvýšení produktivity! Herní vývojáři, zpozorněte.

Co si myslíte o funkci odkazu na postavu od Midjourney? Jak si představujete, že ovlivní váš tvůrčí proces nebo odvětví? Rád bych znal vaše názory.

Tento článek byl zveřejněn na webu Generative AI. Připojte se k nám na LinkedIn a sledujte Zeniteq, abyste měli přehled o nejnovějších příbězích z oblasti AI. Pojďme společně utvářet budoucnost AI!

Překlad článku od Jim Clyde Monge


7 úžasných a bezplatných nástrojů umělé inteligence, které byste měli znát

GFP-GAN, Copy.ai , JADBio, DALL-E 2, Notion.ai, Lumen5 a Lalal.ai

Svět umělé inteligence nás nepřestává fascinovat. Shromáždili jsme 7 bezplatných nástrojů umělé inteligence, z nichž většina je snadno použitelná a některé jsou sofistikovanější… například vytváření ML modelů. Snažili jsme se být jedineční a vyhnout se mnoha platformám AI, které najdete ve většině příspěvků o nejlepších nástrojích AI. Navíc jsme chtěli, aby byly k vyzkoušení zdarma, bez výhrad, jako je přidání čísla vaší kreditní karty. Některé z nich sami používáme (např. Lumen, JADBio), takže pro nás bylo důležité je zařadit, protože si skutečně vážíme toho, co nabízejí. 

Seznam není rozsáhlý, ale plánujeme se k tématu často vracet. Považujte to za verzi I.

GFP-GAN - restaurování fotografií

GFP-GAN je nový bezplatný nástroj AI, který dokáže okamžitě opravit většinu starých fotografií. GFP-GAN (Generative Facial Prior-Generative Adversarial Network) byl vyvinut výzkumníky společnosti Tencent sloučením informací ze dvou modelů umělé inteligence, aby během několika sekund doplnil chybějící detaily fotografie realistickými detaily, a to při zachování vysoké přesnosti a kvality. V tomto videu (2:26) Louis Bouchard nadšeně popisuje, jak dobře projekt fungoval při obnově fotografií, s podrobnostmi o tom, jak jej zdarma používat. Výsledky jsou velmi působivé a dobře fungují i u velmi nekvalitních snímků.

Demoverzi GFP-GAN si můžete vyzkoušet zdarma. Tvůrci také zveřejnili svůj kód, aby mohl každý implementovat technologii obnovy do svých vlastních projektů.

Vyzkoušejte zdarma
Stáhněte si kód

Copy.ai — CopyWriter

V tomto případě stačí doslova „kopírovat“. Tento nástroj pro kopírování založený na umělé inteligenci generuje jedinečný obsah, který můžete zveřejnit na svém blogu, sociálních sítích nebo dokonce pro video, stačí zadat krátký popis tématu, na které chcete obsah.

Copy.AI by mohl být užitečný pro tvůrce obsahu. Nástroj může uživateli pomoci při psaní popisků na Instagram, příspěvků na blog, popisů produktů, obsahu na Facebook, nápadů na start-upy a mnoha dalších.

Zaregistrujte si účet, zadejte popis tématu, které vás zajímá, a nástroj AI na základě vašeho popisu vygeneruje obsah. Úžasný nástroj, který se bude hodit v budoucnosti digitálního obsahu.

Webové stránky
Facebook
Twitter
Poznámka: Tento ^ není jediným nástrojem, který využívá umělou inteligenci k vytváření obsahu. Existuje jich několik, některé jsou lepší než jiné, takže doporučujeme vyzkoušet všechny. Je tu:

- Mikrokopie pro titulky, slogany a další.
- Speedwrite pro přepisování a vylepšování libovolných vět
- Hemingway pro odvážné a jasné psaní
- Jarvis AI je kvalitní nástroj pro copywriting s umělou inteligencí, jak se říká
plus Notion.AI, který právě dorazil a kterému jsme níže věnovali celý odstavec.

 

JADBio — AutoML

JADBio je uživatelsky přívětivá platforma pro strojové učení, která nepotřebuje žádné znalosti kódování, ale je vybavena výkonnými nástroji pro extrakci znalostí. Přestože je účelově vytvořena pro biotechnologie a multi-omiku, můžete do ní v podstatě nahrát jakýkoli druh kurátorských dat a analyzovat je. Velmi užitečné pro studenty, kteří se chtějí ponořit do strojového učení, nebo pro lidi, kteří chtějí vytvořit prediktivní model, například který brambor přinese nejlepší smaženici (binární klasifikace). Nabízejí doživotní účet zdarma a použití je poměrně jednoduché.

Webové stránky
Facebook
Twitter

DALL-E 2 — Generátor obrázků

Předpokládáme, že jste o něm už slyšeli. DALL-E 2 od Open AI je nový systém umělé inteligence, který dokáže vytvářet realistické obrázky a umění na základě popisu v přirozeném jazyce. Dokáže vytvořit originální realistické obrázky a umění z textového popisu. Dokáže kombinovat pojmy, atributy a styly. Stojí za to si s ním pohrát, na webových stránkách je několik příkladů, které vás mohou inspirovat. Použití je zcela zdarma.

Webové stránky
Instagram

Notion.ai — CopyWriter

Společnost Notion testuje novou funkci Notion AI pro vytváření obsahu. Stačí, když aplikaci řeknete, co chcete - příspěvek na blog, šablonu náborového e-mailu, seznam skvělých obchodních knih ke čtení - a aplikace skutečně vytvoří obsah přímo před vašima očima. Spousta uživatelů si aplikaci Notion oblíbila pro psaní poznámek a tohle ji rozhodně posune na další úroveň. Přihlásili jsme se k testování, ale zatím jsme na čekací listině (od 16. listopadu).

 

Webové stránky
Facebook
Twitter

Lumen5 — Video Creator

Lumen5 je online platforma pro tvorbu videí s nástroji, které vám umožní vytvářet videa bez námahy v několika krocích. Obsahuje skvělé šablony a různé formáty pro různé platformy sociálních médií. Umělá inteligence přichází na řadu, když nahrajete přepis; na základě importovaného přepisu vytvoří celou videosekvenci včetně obrázků. Skvělý a snadno použitelný nástroj, zejména pokud chcete rychle vytvářet obsah pro platformy sociálních médií. Lumen také nabízí rozsáhlou škálu obrázků a videí, které můžete do výsledného videa zahrnout.

Webové stránky
Facebook
Twitter

Lalal.ai - Rozdělovač zvukových stop

Lalal využívá umělou inteligenci k rychlému, snadnému a přesnému odstranění vokálů a oddělení hudebních zdrojů. Můžete odstranit vokální, instrumentální, bicí, basové, klavírní, elektrické a akustické kytary a syntezátorové stopy bez ztráty kvality. Díky tomu je tvorba bezbolestná! Můžete začít hrát, protože vám dává 10 minut zdarma, ale platící modely jsou také velmi rozumné. Jednorázový poplatek 15 eur za 90 minut zpracování vás dostane daleko.

Webové stránky
Facebook
Twitter

Překlad článku od  Vicky Tsiachri
Social Media Expert ve Digital Giraffes


Jak si stojí Raspberry Pi AI Kit

Společnost Raspberry Pi vydala sadu pro jednodeskový počítač AI Kit s funkcemi strojového učení. Možná je to proto, aby podpořila své nedávné uvedení na trh, nicméně údaje o výkonu vypadají, že zaútočí na trh s okrajovými výpočetními systémy AI. Řekl bych že RPI poháněná Hailo, dává 13 TOPS, za přibližně 2000 CZK, to není špatné.

Společnost Raspberry Pi vydala sadu pro jednodeskový počítač AI Kit s funkcemi strojového učení.

Sada AI je poháněna akcelerátorem Hailo-8L a vlastní deskou Raspberry Pi M.2 HAT+

Než někdo začne předpokládat nějaké pokročilé důvody AI, uvědomte si, že HAT znamená pouze Hardware Attached on Top. Přepychový způsob, jak říct, deska přišroubovaná přes jinou desku...

V každém případě je tento AI akcelerátor za 70 dolarů opravdu výhodná koupě. A co je ještě důležitější, získáte skvělou nabídku výkonu pro vaši vestavěnou aplikaci, jak je uvedeno v následující části.

O Hailo-8L: Raspberry Pi si jako dodavatele akcelerátoru vybralo společnost Hailo. Hailo-8L je ořezaná verze nedávno oznámeného čipu Hailo-8, který nabízí 26TOPS. Hailo-8L nabízí chvályhodných 13TOPS a přináší Raspberry Pi tolik potřebný výkon v oblasti umělé inteligence.

Hailo AI čip detail

Nedávno se AMD dostalo do čela žebříčku TOPS s 50TOPS, proto se 13TOPS zdá málo.Je třeba vzít v úvahu, že se bude používat ve světě embedded a 13TOPS přinese obrovskou výhodu pro okrajové aplikace typu počítačového vidění. Také notebook s RISC-V Linuxem v době psaní tohoto článku nabízí pouze 2TOPS.

Podle technického ředitele společnosti Hailo Aviho Bauma spotřebuje Hailo-8L na každé tři TOPS přibližně jeden watt energie, což je maximálně zhruba pět wattů. A pro typickou embedded zátěž, jako je zpracování 60 FPS videa v reálném čase, si vezme sotva jeden nebo jen dva watty.

Hailo se speciálně zaměřuje na nízkou spotřebu okrajových aplikací umělé inteligence & pohodlně poráží i NVIDIA. Níže je uveden jejich výkon ve srovnání s Jetson Nano a Xavier NX od společnosti NVIDIA.

Hailo - porovnání výkonu AI
NFC hodnocenky Google

Čip má širokou podporu pro frameworky AI, mezi které patří TensorFlow, TensorFlow Lite, Keras, PyTorch a ONNX. Vzhledem k výše uvedeným číslům a výkonové výhodě vypadá rozhodnutí Raspberry Pi s Hailo jasně.Architektura a design sady Raspberry Pi AI V současné době sada AI podporuje architekturu x86 i Arm Host. Generální ředitel Raspberry Pi, Eben, sdělil, že záměrně plánují samostatnou akcelerační desku, nikoli integrovaný NPU, jako je tomu u SoC Apple & Qualcomm, které byly nedávno uvedeny na trh pro počítače s AI.

Raspberry Pi AI Kit

Raspberry Pi již tuto oddělenou architekturu má, protože používá IO funkce na levném 40nm, zatímco CPU a GPU je na 16nm. I když je jádro na 16nm, přidání NPU k němu bude nákladné, protože se zvětší plocha.

Pokud chce uživatel použít Raspberry Pi 5 pro aplikaci, která není spojena s umělou inteligencí, ano, existují... a musí zbytečně vyhodit další peníze za nechtěné náklady na plochu die NPU. Nyní mají možnost volby & hardwaroví lidé mají rádi volby. I když samotná verze Raspberry Pi 3 byla použita pro AI aplikaci, AI zátěž byla na cloudu. Tento nový Raspberry Pi 5 s Hailo-8L dokáže sám na okraji zastat menší modely & optimalizované LLM.

Současný stav sady Raspberry Pi AI

Tento počítač Raspberry Pi je vybaven rozhraním PCIe 2.0, přes které komunikuje s akcelerátorem Hailo-8L. PCIe 2.0 má pouze verze Raspberry Pi 5. Pokud tedy chcete vyzkoušet funkci AI, musíte vyměnit desku. Nicméně i M.2 HAT+ pro Raspberry Pi 5 stojí jen asi 80 dolarů. 

Souprava je dodávána s předmontovanou tepelnou podložkou pro lepší odvod tepla Hailo-8L, která sice spotřebuje pár wattů, ale bude výrazně teplejší. Raspberry Pi si uvědomuje, že pro mnohé tvůrce je to nový terén. Proto bude poskytovat více demo a softwarových nástrojů na podporu uživatelů vyvíjejících funkce UI.

Raspberry Pi tvrdí, že nastavení a spuštění aplikace AI bude otázkou několika minut. 

Ačkoli hardware funguje tak, jak má, je třeba si uvědomit, že software zatím NENÍ ve skvělé formě. Ale během několika měsíců se vše stane skutečností.

Tým Tom's Hardware dostal k dispozici testovací sadu a narazil na několik problémů. Podle jejich informací brzy přijde aktualizace operačního systému Raspberry Pi, která umožní několik funkcí umělé inteligence, což v současné době omezuje jeho použití. Podařilo se jim však detekovat obrázky včetně medvídka, jak ukazuje obrázek níže. 

Detekce oblyčeje nebo objektu - Díky obrázku z Toms Hardware

V ukázce není provedeno měření rychlosti, ale tým se zmínil, že „cítili“, že jen málo z nich je rychlejších. Tým Tom's hardware také zmínil, že Raspberry Pi odhalil, že v budoucnu můžeme v případě potřeby spustit vlastní modely.

Případy použití

Raspberry Pi & Hailo tvrdí, že výhoda nízké spotřeby je významná pro mnoho hardwaru počítačového vidění, jako je rozpoznávání obrazu v okrajových uzlech. Společnost také říká, že mají různé modely včetně některých vhodných pro přidávání funkcí AI do her.

Hra Lincity-NG , díky obrázku z raspberrytips.com

Vzhledem k tomu, že systém Windows 11 není určen pro Raspberry Pi, říkají, že tato sada není určena pro software Microsoft Copilot. Nevylučují však, že některé funkce budou fungovat. Vzhledem k tomu, že 13TOPS je téměř 1/3 ze 40TOPS předepsaných pro počítače Copilot+, něco skutečně fungovat bude.

Závěr

Obě společnosti očekávají, že komunita tvůrců přijde s nějakým jedinečným případem použití, který vyřeší jejich vlastní problémy. Věřím také, že síla komunity Raspberry Pi, skutečně něco změní. Kromě projektů ve třídách začne nově objevenou schopnost 13TOPS AI využívat i mnoho robotických aplikací.

Musíme počkat na další aktualizace softwaru Raspberry Pi, abychom měli lepší pracovní platformu. Je vzrušující, že generální ředitel Raspberry Pi zmínil, že tímto spojení se společností Hailo nekončí.

překlad článku od Gandhi KT