Jak nainstalovat Stable Diffusion na Windows

Chcete vytvářet obrázky na základě textového zadání přímo na vašem počítači? Stable Diffusion od Stability AI je výkonný nástroj pro generování obrázků pomocí AI, který lze snadno nainstalovat na Windows.

Co potřebujete vědět hned na začátku:

  • Co je Stable Diffusion? Jedná se o open-source nástroj pro generování obrázků pomocí textových příkazů, který funguje na běžném hardwaru.
  • Systémové požadavky:
    • Minimálně: Windows 10, NVIDIA GPU s 4 GB VRAM.
    • Doporučeno: Windows 10/11, NVIDIA GPU s 8+ GB VRAM.
  • Co budete potřebovat:
    • Python 3.10.6
    • Git
    • Aktuální ovladače grafické karty
  • Hlavní výhody:
    • Otevřený zdrojový kód
    • Možnost inpaintingu, outpaintingu a převodu mezi obrázky
    • Funguje i na průměrném hardwaru

Rychlé kroky k instalaci:

  1. Nainstalujte Python a Git, nastavte PATH.
  2. Vytvořte virtuální prostředí a nainstalujte balíčky jako torch, torchvision a transformers.
  3. Stáhněte repozitář AUTOMATIC1111 pomocí Git.
  4. Upravte soubor webui-user.bat podle vaší grafické karty.
  5. Stáhněte modely a umístěte je do správné složky.

Stable Diffusion je ideální pro kreativní projekty jako portréty, digitální umění nebo experimentování s AI. Pokračujte ve čtení a zjistíte detailní kroky, jak tento nástroj zprovoznit.

Systémové požadavky pro Windows

Hardwarové požadavky

Aby Stable Diffusion na Windows běželo hladce, doporučujeme splnit tyto hardwarové požadavky:

KomponentaMinimální požadavkyDoporučené požadavky
Operační systémWindows 10 64-bitWindows 10/11 64-bit
GPUNVIDIA s 4 GB VRAMNVIDIA s 8+ GB VRAM

Nemáte-li dedikovanou grafickou kartu NVIDIA, aplikaci lze provozovat i na procesoru. Některé výkonné procesory nabízejí dostatečný výkon . K dispozici jsou také open-source řešení, jako například OpenVINO, která umožňují efektivní využití CPU .

Softwarové předpoklady

Pro instalaci Stable Diffusion budete potřebovat:

  • Python 3.10.6 – doporučená verze pro zajištění kompatibility.
  • Git – pro stahování a aktualizaci potřebných souborů.
  • Aktuální grafické ovladače NVIDIA, pokud používáte GPU.

Při instalaci Pythonu nezapomeňte zaškrtnout možnost přidat python.exe do proměnné PATH .

Pro lepší výkon na CPU můžete v souboru stable_diffusion_engine.py přidat tento řádek:

self.core.set_property("CPU", {"INFERENCE_NUM_THREADS": 8})

Pokud váš hardware nesplňuje požadavky, můžete využít webovou verzi Stable Diffusion, která nabízí podobné funkce bez nutnosti lokální instalace a náročného hardwaru .

Příprava instalace

Než začnete s instalací Stable Diffusion, je nutné připravit Python prostředí a zajistit instalaci potřebných balíčků.

Instalace Pythonu

Pro správnou funkčnost Stable Diffusion je klíčové mít správně nainstalovaný Python. Zkontrolujte jeho přítomnost příkazem:

python --version

Pokud Python nemáte, stáhněte verzi Python 3.10.6 z oficiálních stránek na Python.org. Během instalace nezapomeňte zaškrtnout možnosti Use admin privileges a Add python.exe to PATH.

Vytvoření virtuálního prostředí

Virtuální prostředí pomáhá izolovat projekt a předcházet konfliktům mezi různými Python aplikacemi . Postup vytvoření:

  1. Spusťte příkazový řádek.
  2. Přesuňte se do složky, kde chcete prostředí vytvořit.
  3. Vytvořte virtuální prostředí příkazem:
    python -m venv sd_env
    
  4. Aktivujte prostředí:
    sd_env\Scripts\activate
    

Instalace potřebných balíčků

Nejprve aktualizujte pip:

python -m pip install --upgrade pip

Poté nainstalujte tyto balíčky:

BalíčekPopis
torchPro strojové učení a akceleraci GPU
torchvisionPro zpracování obrazu
transformersPro práci s AI modely

Tipy pro řešení problémů:

  • Pokud narazíte na chybu s torch, přidejte parametr --skip-torch-cuda-test do webui-user.bat.
  • Vyhněte se instalaci do složek s diakritikou nebo speciálními znaky.
  • Při problémech s GPU zkuste instalaci přes Microsoft Store .

Pro nejlepší výkon doporučujeme používat aktuální ovladače NVIDIA a pravidelně aktualizovat všechny balíčky.

Jakmile je prostředí připraveno, můžete přejít k samotné instalaci Stable Diffusion.

Instalační kroky

Stažení souborů

Nejdříve si stáhněte potřebné soubory pro instalaci Stable Diffusion. Otevřete příkazový řádek a spusťte následující příkazy pro klonování webového rozhraní AUTOMATIC1111:

cd %userprofile%
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

Po dokončení se ve vaší domovské složce vytvoří adresář s názvem stable-diffusion-webui.

Nastavení konfigurace

Aby vše fungovalo hladce, je potřeba upravit konfigurační soubor webui-user.bat. Klikněte na něj pravým tlačítkem a zvolte možnost Upravit. Konkrétní nastavení závisí na velikosti paměti vaší grafické karty:

Paměť GPUDoporučené parametry
12 GB+--xformers
8 GB--medvram --xformers
4 GB--lowvram --xformers

Chcete-li zvýšit rychlost generování, přidejte parametr --opt-sdp-attention. Například, pokud máte 8 GB VRAM, upravený řádek v souboru by mohl vypadat takto:

set COMMANDLINE_ARGS=--opt-sdp-attention --medvram --xformers

Instalace modelu

Nakonec stáhněte základní model Stable Diffusion podle těchto kroků:

  1. Otevřete složku %userprofile%\stable-diffusion-webui\models\Stable-diffusion.
  2. Stáhněte soubor v1-5-pruned-emaonly.ckpt nebo v1-5-pruned-emaonly.safetensors.
  3. Umístěte stažený soubor do uvedené složky.

"Použití parametru --opt-sdp-attention může zrychlit práci s modely Stable Diffusion. Pokud máte méně než 8 GB VRAM, doporučuje se zapnout také volbu --medvram pro efektivnější využití paměti při generování více obrázků." - Stable Diffusion Art

Pokud hledáte další modely, můžete navštívit platformu Civit AI. Specializované modely nalezené tam lze umístit do stejné složky jako základní model.

Pro vzdálený přístup k webovému rozhraní z jiného zařízení přidejte do konfigurace parametr --listen. Pokud narazíte na problémy s generováním (např. chyby NaN), zkuste přidat parametr --no-half.

sbb-itb-6f064b4

Používání Stable Diffusion

Stable Diffusion

Teď, když máte instalaci hotovou, je čas začít pracovat se Stable Diffusion.

Spuštění programu

Otevřete Stable Diffusion dvojklikem na soubor webui-user.bat ve složce stable-diffusion-webui. Při prvním spuštění se automaticky stáhnou a nainstalují všechny potřebné balíčky. Po dokončení tohoto procesu se v příkazovém řádku zobrazí lokální URL adresa, obvykle http://127.0.0.1:7860. Tuto adresu zadejte do webového prohlížeče, abyste se dostali k webovému rozhraní AUTOMATIC1111.

Orientace v rozhraní

Webové rozhraní Stable Diffusion je navrženo tak, aby bylo snadno pochopitelné a přehledné. V horní části najdete sekci „Rychlá nastavení“, kterou můžete přizpůsobit v části Nastavení -> Uživatelské rozhraní -> Seznam rychlých nastavení.

Rozhraní obsahuje několik klíčových prvků: výběr základního modelu, pole pro zadání promptu, nastavení parametrů generování a sekci pro zobrazení výsledků. Pořadí těchto prvků můžete změnit v Nastavení -> Uživatelské rozhraní -> Pořadí prvků UI pro záložky txt2img/img2img.

První generování obrázku

Pro vytvoření svého prvního obrázku postupujte následovně:

  • Základní nastavení
    Nastavte tyto parametry:

    • Počet kroků vzorkování: alespoň 20
    • CFG škála: 7 (vyšší hodnota znamená přesnější dodržení promptu)
    • Velikost obrázku: 512 x 512 pixelů
  • Vytvoření promptu
    Zadejte například tento prompt:

    realistická fotografie bílé kočky sedící na okenním parapetu, měkké denní světlo
    

    A přidejte negativní prompt:

    rozmazané, nízká kvalita, deformace, chybějící končetiny
    

Vyzkoušejte generování více variant stejného promptu a experimentujte s různými styly a nastaveními, dokud nedosáhnete výsledku, který vás uspokojí.

Řešení problémů a výkon

Časté problémy

Problémy s instalací Pythonu

  • Používejte výhradně Python 3.10.6. Novější verze (3.11 a vyšší) mohou způsobovat problémy s kompatibilitou.

Chyby při spuštění

  • GitHub chyby: Pokud se objeví chyba "fatal: detected dubious ownership", klonujte repozitář pomocí příkazového řádku spuštěného pod vaším uživatelským účtem .
  • Chyby knihoven a GPU:
    • Při chybě "ImportError: DLL load failed while importing cv2" znovu nainstalujte OpenCV .
    • Pokud vidíte "RuntimeError: Torch is not able to use GPU", aktualizujte ovladače NVIDIA .

Problémy s pamětí

  • Máte-li pouze 4 GB VRAM, přidejte argument --lowvram do souboru webui-user.bat.
  • Pokud narazíte na chyby NaN, zkuste použít argument --no-half .

Optimalizace rychlosti

Úpravy konfigurace

  • Do souboru webui-user.bat přidejte:
    • --xformers pro rychlejší renderování
    • Nastavte batch size na hodnotu 4
    • Vypněte funkci živého náhledu

Optimalizace pro RTX 4000

Pro grafické karty série RTX 4000 použijte následující nastavení:

--xformers
--opt-sdp-no-mem-attention --no-half-vae --opt-channelslast

Proces aktualizace

Pravidelná aktualizace softwaru pomáhá předcházet problémům a zajistit plynulý chod.

Základní aktualizace

  1. Spusťte příkaz git pull v hlavní složce projektu.
  2. Pokud se objeví chyby, použijte tyto příkazy:
git checkout -f master
git pull

Řešení problémů s aktualizací

  • Smažte složku venv a restartujte aplikaci.
  • Pokud je to nutné, odstraňte složku repositories.
  • U problémových rozšíření smažte příslušné rozšíření ze složky extensions.

"Pokud git pull zobrazuje chybu, je to obvykle způsobeno náhodnou změnou některých souborů. Můžete resetovat složku webui pomocí následujících dvou příkazů: git checkout -f master a poté znovu spustit git pull. Pamatujte, že všechny soubory budou resetovány. Budete muset znovu provést změny v webui-user.bat." - Stable Diffusion Art

Další kroky

Po vyřešení problémů a doladění výkonu je čas přejít k plánování dalších aktivit se Stable Diffusion.

Shrnutí instalace

Než začnete svůj první projekt, ujistěte se, že máte vše připraveno:

  • Python 3.10.6 je nainstalován
  • GPU nastavení bylo úspěšně ověřeno
  • Modely jsou staženy
  • Webové rozhraní funguje bez problémů

Nápady na projekty

Když už máte instalaci za sebou, zkuste se inspirovat těmito kreativními projekty:

Portréty

  • Zkuste vytvořit portréty v různých stylech
  • Naučte DreamBooth pracovat s vašimi vlastními fotografiemi
  • Kombinujte různé umělecké styly do jednoho díla

Digitální umění

  • Navrhněte fantasy postavy s detailními popisy, například „mysterious sorceress, detailed leather clothing with gemstones“
  • Tvořte pixel art v klasickém, isometrickém nebo cyberpunk stylu
  • Vytvářejte krajiny od fantasy světů až po sci-fi scenérie

Zdroje pro další vzdělávání

Chcete-li své dovednosti posunout dál, využijte tyto užitečné zdroje:

Online platformy

Praktické tipy

"Přistupujte k tvorbě promptů jako k iterativnímu procesu. Přidávejte maximálně dva klíčové výrazy najednou a generujte více obrázků pro posouzení jejich efektu." - Stable Diffusion Art

Pro co nejlepší výsledky:

  • Vytvářejte detailní a promyšlené prompty
  • Zkoušejte měnit váhu klíčových slov pomocí () a []
  • Používejte negativní prompty, abyste odstranili nežádoucí prvky


MidJourney V7 - pozdě, ale přece

Nový model Midjourney V7

MidJourney V7 je tady a přináší zásadní zlepšení v generování obrazů pomocí AI. Tato verze nabízí detailnější výsledky, lepší práci s textovými zadáními a větší flexibilitu. Co je nového?

  • Flexibilní poměry stran umožňují širší kreativní možnosti.
  • Přesnější zpracování textu – zadávejte celé věty, ne jen klíčová slova.
  • Parametr --iw pro lepší práci s referenčními obrázky.

Rychlé srovnání: MidJourney V6.x vs. V7

FunkceMidJourney V6.xMidJourney V7
   
Poměry stranOmezenéTéměř neomezené
Práce s textemKlíčová slovaCelé věty a styly
Parametr --iwČástečněPodpora referencí
StylizacePřednastavené stylyDetailnější kontrola stylu

Tipy pro práci s V7: Pište zadání jako celé věty, jasně popisujte požadovaný styl a využívejte parametrické možnosti, jako je --iw. V7 klade důraz na precizní výsledky a fotorealismus, ale umožňuje i umělecké styly při správném zadání.

Pro uživatele MidJourney je V7 krokem vpřed, ale vyžaduje přesnější práci s prompty.

1. Funkce MidJourney V6

MidJourney V6 přináší výrazná vylepšení v oblasti generování obrazů.

Přesnost a konzistentnost

Verze 6 zlepšila schopnost zpracovávat složité zadání (prompty) s větším důrazem na konzistentní výsledky a velmi detailní zpracování. Tato vylepšení připravují půdu pro budoucí funkce ve verzi V7.

Nové nástroje pro úpravy

  • Subtle Mode: Umožňuje zvětšení 2×, aniž by se změnil charakter obrazu.
  • Creative Mode: Přidává nové detaily při zvětšení 2×.

Práce s textem

  • Text v promptu je nutné uvádět v uvozovkách.
  • Nižší hodnota parametru --stylize vede k lepším výsledkům.
  • Kratší texty přinášejí spolehlivější výstupy.

Kompoziční změny

  • Nepravidelné (asymetrické) uspořádání prvků.
  • Rozmanitější výsledky při opakovaném použití stejného zadání.

Režim Raw

Použití parametru --style raw nabízí:

  • Neutrální přístup k interpretaci promptů.
  • Lepší výkon pro fotorealistické styly.
  • Přesnější interpretaci zadání.

Textury a detaily

V6 přináší pokročilé zpracování povrchů, materiálů a světelných efektů, a to vše v rámci jednoho renderování.

Pro dosažení nejlepších výsledků je klíčové pochopit, jak jednotlivé parametry fungují, což umožňuje přesnější a efektivnější práci při tvorbě obrazů.

sbb-itb-6f064b4

2. Novinky v MidJourney V7

MidJourney V7 přináší důležité změny v oblasti zpracování obrazu a porozumění zadání.

Lepší rozlišení a kvalita

Přináší detailnější a ostřejší výsledky. Kromě toho byla vylepšena práce s různými poměry stran a interpretací požadavků.

Flexibilnější poměry stran

V7 umožňuje téměř neomezené nastavení poměrů stran, což otevírá nové možnosti jak pro digitální využití, tak pro tiskové formáty.

Přesnější zpracování přirozeného jazyka

Nový model lépe chápe textové zadání. Pro dosažení nejlepších výsledků doporučujeme:

  • Psát zadání jako celé věty
  • Jasně popsat požadovaný styl
  • Vyhnout se pouhému výčtu klíčových slov

Parametr --iw pro práci s referencemi

Funkce --iw umožňuje detailní kontrolu nad tím, jak moc referenční obrázky ovlivní výsledek ve vztahu k textu. Tento nástroj je ideální při kombinaci více zdrojů inspirace a nabízí větší přesnost při tvorbě.

Nový přístup k tvorbě promptů

V7 vyžaduje přesnější a detailnější instrukce, protože méně spoléhá na přednastavené styly. Díky tomu lépe zvládá složité umělecké styly a specifické požadavky. Parametrické možnosti, jako je --iw, hrají v tomto procesu klíčovou roli.

Tipy pro práci s V7

  • Pište zadání jako celé věty (např. „Astronaut plující ve vesmíru“ místo pouhého výčtu slov)
  • Jasně určete požadovaný styl přímo v textu
  • Používejte podrobné popisy pro přesnější výsledky

MidJourney V7 přináší nové možnosti v generování obrazů a klade důraz na preciznější tvorbu promptů.

Tipy pro práci s V7

  • Pište zadání jako celé věty (např. „Astronaut plující ve vesmíru“ místo pouhého výčtu slov)
  • Jasně určete požadovaný styl přímo v textu
  • Používejte podrobné popisy pro přesnější výsledky

MidJourney V7 přináší nové možnosti v generování obrazů a klade důraz na preciznější tvorbu promptů.

Přímé srovnání: V6 a V7

MidJourney V6 je známá přesným zpracováním promptů a možností přidávání textu, přičemž dokáže vytvářet výsledky s velkou variabilitou a hyperrealistickým zpracováním. Nabízí dva režimy upscalingu – Subtle a Creative – a umí generovat detailní obrazy, což ji dělá ideální pro uživatele hledající precizní a propracované výstupy.

Inovativní nástroje pro tvůrčí svobodu

Midjourney Verze 7 přináší několik nových nástrojů určených k rozšíření tvůrčích možností a zefektivnění pracovních postupů. Mezi nejvlivnější patří funkce personalizace, která uživatelům umožňuje vycvičit umělou inteligenci tak, aby odpovídala jejich jedinečnému uměleckému stylu. Hodnocením 200 obrázků můžete systém nasměrovat tak, aby vytvářel výstupy odrážející vaše specifické estetické preference. Tato funkce je ve výchozím nastavení povolena, což zajišťuje od počátku zážitek na míru.

Dalším pozoruhodným doplňkem je režim návrhu - Draft mode, který upřednostňuje rychlost před kvalitou a napomáhá rychlému nápadu. Tento režim je užitečný zejména při brainstormingu a konceptualizaci nápadů, protože generuje obrázky s nižším rozlišením, které slouží jako základ pro další zdokonalování. Ačkoli kompromis v kvalitě snímků nemusí vyhovovat všem pracovním postupům, nabízí praktické řešení pro uživatele, kteří chtějí rychle prozkoumat kreativní koncepty, než se zavážou k vysoce kvalitním výstupům.

Přetrvávající omezení a oblasti pro zlepšení

Přestože Midjourney verze 7 přináší významný pokrok, není bez omezení. Přetrvávajícím problémem zůstává vykreslování textu, které často přináší výsledky, jež nejsou dostatečně jasné nebo souvislé. Stejně tak je zřetelnost vzdálených tváří ve složitých scénách nadále oblastí, kde platforma zaostává, což může bránit profesionálním uživatelům, kteří vyžadují přesné a vybroušené výstupy.

Režim návrhu - Draft mode je sice cenný pro rychlé nápady, ale vytváří obrázky nižší kvality, které nemusí splňovat potřeby uživatelů, kteří hledají konečné výstupy. Tento kompromis mezi rychlostí a kvalitou by mohl omezit její přitažlivost pro některé pracovní postupy, zejména ty, které vyžadují výsledky ve vysokém rozlišení od samého počátku.

Budoucí funkce a vylepšení

Midjourney představila ambiciózní plán budoucích aktualizací, jehož cílem je odstranit některá současná omezení platformy a zároveň zavést nové funkce. Jednou z nejočekávanějších funkcí je „Omniconsistency“, která slibuje zlepšení konzistence postav, objektů a míst na více snímcích. Toto vylepšení by mohlo vyřešit jeden z nejtrvalejších problémů při vytváření obrázků umělou inteligencí a nabídnout ucelenější a spolehlivější kreativní zážitek.

Mezi další plánované funkce patří kompatibilita se stávajícími referenčními knihovnami hvězd a možnost používat hlasové příkazy pro pohotovou iteraci v režimu návrhu. Tyto doplňky mají zlepšit použitelnost a vyhovět širokému spektru uživatelů, od příležitostných tvůrců až po pokročilé profesionály. Zaměřením na tyto oblasti chce Midjourney upevnit svou pozici přední platformy v oblasti kreativity řízené umělou inteligencí.


Midjourney Aktualizace 2025 – V7: Časová osa & video, 3D funkce

Novinky, které nás čekají tento rok v MidJourney 

Už je to nějaká doba, co jsem sdílel novinky o MidJourney – čekal jsem na skutečně zásadní aktualizace, které stojí za váš čas. A teď to přichází – rok 2025 začíná pořádným nášupem. MidJourney se neustále vyvíjí s novými funkcemi a vylepšeními. V lednu jsme se dočkali velkých změn, včetně možnosti míchání moodboardů a vylepšené funkce „describe“ na webu. Koncem února se očekává vydání verze 7, která přinese zásadní pokrok v oblasti videa a 3D obsahu. Zde je kompletní přehled nejnovějších aktualizací a nadcházejících funkcí.

Míchání Moodboardů

MidJourney nyní umožňuje kombinovat více moodboardů do jednoho výstupu, čímž dosáhnete přesnějších a konzistentnějších vizuálů. Navíc lze moodboardy kombinovat se stylovými referencemi pro ještě kreativnější výsledky.

  • Pro vícenásobné směsi Stačí přidat kód moodboardu do parametru profilu.
  • Každý moodboard má stejnou váhu při tvorbě výsledného obrazu.
  • Style Weight (SW) Do budoucna se plánuje možnost nastavit váhu jednotlivých moodboardů pro lepší kontrolu stylu.

Příklad: Srovnání jednoho moodboardu vs. kombinace více moodboardů vs. hybridní stylové reference.

Příklad: Podívejte se na tyto směsi - jednoduchá náladová tabule vs. chaos na více tabulích vs. hybridy referenčních stylů.

Funkce „Describe“ je nyní dostupná na webovém rozhraní.

Funkce „describe“, která převádí obrázky na text, byla dříve dostupná pouze na Discordu pomocí příkazu /describe. Nyní ji můžete využít přímo na webových stránkách Midjourney!

Jak na to:

  • Klikněte pravým tlačítkem na obrázek nebo jej přetáhněte do pole „imagine“.
  • Okamžitě dostanete nový sada návrhů promptů pro další generování.

Funkce „describe“ nenabízí přesné kopie, protože výsledky závisí na náhodných sadách, verzích modelu a obecných klíčových slovech.

Tip: Kombinujte „describe“ s obrazovou referencí pro ještě ostřejší a přesnější výstupy.

Funkce Midjourney Describe je sice výchozím bodem, ale není to nástroj pro kopírování a vkládání. Proměnné, jako jsou náhodná semena, verze modelu a neurčitá klíčová slova (např. „atmosférický“), ponechávají prostor pro interpretaci.


Časová osa vydání V7

Původně měla verze 7 vyjít dříve, ale kvůli technickým problémům byla odložena asi o týden. Nové očekávané vydání: polovina až konec února 2025.

Nové funkce ve V7:

Vyšší kvalita obrázků a lepší interpretace promptů
Lepší koherence detailů, zejména u složitých prvků, jako jsou ruce držící předměty (sbohem, uncanny ruce! )
Silnější podpora vícero jazyků pro lepší pochopení promptů 🌍
Character Consistency 2.0 (funguje i s ne-Midjourney referencemi!)
Personalizované profily a moodboardy budou kompatibilní s V7
Nový systém stylových referencí – podpora obrazových referencí při spuštění (detaily o kódech SRF zatím nejsou známy).

Proč trvá V7 tak dlouho?

Midjourney provádí zásadní změny v backendu, které usnadní budoucí aktualizace. Po vydání V7 tým plánuje 6–8 velkých aktualizací v průběhu roku 2025.


Velké novinky: Video a 3D obsah 

Video funkce přicházejí brzy

Midjourney pracuje na experimentálním video modelu ve spolupráci s partnery:

  • Nejdříve se spustí jeden nebo dva partnerské modely, které budou upraveny pomocí Midjourney procesingu.
  • Tento přístup pomůže zjistit preference uživatelů před vytvořením vlastního video modelu.
  • První video funkce by mohly být spuštěny už během příštího měsíce!

3D funkce na cestě

Midjourney plánuje přechod do 3D světa:

  • První verze umožní konvertovat 2D obrázky na 3D.
  • Uživatelé budou moci měnit úhly kamery a upravovat scény před finálním vykreslením.
  • Tato funkce bude fungovat jak pro objekty, tak pro celé scény, čímž se otevírají nové kreativní možnosti.

Další klíčové aktualizace

Batch Size 8 – větší gridy obrázků

  • Možnost generování až 8 obrázků najednou v jednom gridu.
  • Nepůjde jen o duplikaci promptů, ale o iterativní generování s lepšími výsledky.
  • Tato funkce bude závislá na aktualizaci UI webu a může být dostupná před nebo po vydání V7.

Překlad článku od Christie C. na Medium.com