Návod na vytvoření LORA modelu pro Stable Diffusion

LORA model pro Stable Diffusion pro konzistentní charaktery.

LORA (Low-Rank Adaptation) umožňuje snadné přizpůsobení modelů Stable Diffusion bez nutnosti jejich kompletního přetrénování. Tento postup šetří čas, paměť a poskytuje flexibilitu při úpravě AI modelů.

Klíčové body:

  • Výhody LORA: Menší velikost modelu (2–500 MB), rychlejší trénink a nižší nároky na hardware.
  • Požadavky na hardware: Doporučeno GPU s 24 GB VRAM, 64 GB RAM a 100 GB volného úložiště.
  • Příprava datasetu: Obrázky s rozlišením alespoň 512×512 px, konzistentní poměr stran a kvalitní úprava.
  • Tréninkové parametry: Použijte rank 4–32, learning rate 3e-5 až 8e-5 a 2–3 epochy.
  • Použití modelu: Aktivujte model v promptu Stable Diffusion pomocí syntaxe [lora:nazev_modelu:váha].

Rychlé srovnání: LORA vs. Tradiční modely

VlastnostTradiční modelLORA model
Velikost2–7 GB2–500 MB
Nároky na GPUVysokéNízké
Rychlost tréninkuPomaláRychlá

LORA modely výrazně zjednodušují práci s AI a umožňují rychlé přizpůsobení i na méně výkonném hardwaru.

Potřebné nástroje a nastavení

Požadavky na počítač

Pro trénink LORA modelu doporučujeme následující minimální a doporučené specifikace:

KomponentaMinimální požadavkyDoporučené požadavky
GPU paměť12 GB VRAM24 GB VRAM
Operační paměť32 GB RAM64 GB RAM
Úložiště50 GB volného místa100 GB volného místa
GPUNVIDIA řady RTX 20xxNVIDIA RTX 3090

 


Instalace softwaru

  • Python: Stáhněte nejnovější verzi z python.org.
  • PyTorch: Nezbytný framework pro strojové učení.
  • Kohya SS: Nástroj určený pro trénování modelů.
  • AUTOMATIC1111: Webové rozhraní pro Stable Diffusion.

Nastavení Python prostředí

Nejprve vytvořte virtuální prostředí a aktivujte ho:

python -m venv lora-env  
lora-envScriptsactivate  # Pro Windows

Poté aktualizujte pip a nainstalujte potřebné knihovny:

pip install --upgrade pip  
pip install git+https://github.com/huggingface/diffusers  
pip install accelerate wandb  
pip install -r requirements.txt

Ověřte funkčnost GPU akcelerace příkazem:

accelerate config default

Doporučení pro dataset

  • Používejte obrázky s minimálním rozlišením 512×512 pixelů .
  • Zajistěte konzistentní poměr stran u všech tréninkových obrázků.
  • Dataset by měl být vyčištěný a bez chyb.

Tento postup vytvoří pevný základ pro další kroky při tréninku. Následně se zaměřte na přípravu dat.

Sběr a zpracování dat

Kvalitní data jsou nezbytná pro efektivní trénink modelu LORA.

Výběr tréninkových obrázků

Výběr správných obrázků hraje zásadní roli. Dataset by měl obsahovat 10 až 20 obrázků, minimální počet jsou 3 .

Požadavky na obrázky:

  • Rozlišení alespoň 1024×1024 px
  • Podporované formáty: PNG, JPG
  • Konzistentní poměr stran
  • Dobrá ostrost

Pro modely zaměřené na postavy vybírejte fotografie, kde je postava jasně viditelná:

  • Samostatná, bez dalších osob
  • S různými výrazy (např. úsměv, vážný výraz)
  • V podobném věku
  • Bez výrazných doplňků jako sluneční brýle nebo silné líčení

Jakmile máte obrázky vybrané, přistupte k jejich úpravě, aby dataset měl jednotnou kvalitu.

 

Příprava obrázků

Před tréninkem je potřeba obrázky standardizovat:

1. Ořezání a úprava velikosti

  • Ořízněte obrázky na jednotný formát, například 1:1.
  • Zaměřte se na hlavu a část ramen.
  • Zmenšete velikost na 768×768 pixelů .

2. Zlepšení kvality

Kvalitu obrázků lze zvýšit pomocí následujících nástrojů:

  • Topaz pro zlepšení rozlišení
  • StableSR skript v rozhraní AUTOMATIC1111
  • Úpravy ostrosti a kontrastu

Po úpravě obrázky uspořádejte do strukturovaného systému.

Struktura souborů

Použijte tuto strukturu složek:

SložkaObsahFormát
training_imagesHlavní tréninkové obrázkyPNG
validationObrázky pro validaciPNG
metadataPopisky a metadataTXT

Pojmenování souborů:

  • Dodržujte konzistentní schéma názvů (např. model_01.png).
  • Vyhněte se formátům jako HEIC nebo WebP .
  • Přidejte unikátní klíčové slovo pro snadnou identifikaci .

Nakonec všechny soubory zkomprimujte do ZIP archivu . Nastavte přesnost tréninku na hodnotu mezi 0,3 a 0,35 .

Video návod


Průvodce tréninkem LORA modelu

Správné nastavení parametrů hraje důležitou roli při tréninku LORA modelu.

Nastavení tréninku

Pro dosažení dobrých výsledků je třeba věnovat pozornost následujícím parametrům:

ParametrDoporučená hodnotaPoznámka
Network Rank4–32Vyšší hodnoty obvykle nejsou nutné
Network Alpha1 nebo polovina rankuNapříklad při ranku 32 použijte hodnotu 16
Learning Rate3e-5 až 8e-5Začněte s 3e-5
Počet epoch2–3Obvykle postačí

Tato nastavení pomohou modelu dosáhnout lepších výsledků při jeho aplikaci ve Stable Diffusion. Pro trénink doporučujeme použít model optimalizovaný pro režim bf16/fp16, díky čemuž se sníží nároky na VRAM . Při výběru základního modelu zvažte následující:

  • Pro realistické výstupy: SD1.5, SD2.1 nebo SDXL
  • Pro anime nebo kreslený styl: NAI (animefull-final-pruned) nebo SDXL

Spuštění tréninku

  1. Příprava aktivačního tagu
    Vytvořte specifický tag, který bude reprezentovat váš koncept. Tento tag musí být uveden jako první v popisech vašeho datasetu .
  2. Nastavení složky pro trénink
    Složku s tréninkovými daty přejmenujte na formát '3_nazev', což automaticky nastaví opakování na 3.
  3. Monitorování průběhu
    Použijte Tensorboard k sledování průběhu tréninku. Tento nástroj vám pomůže identifikovat přetrénování. Pokud ukládáte checkpointy po každé epoše, průběžně testujte výsledky z různých fází tréninku.

Řešení běžných problémů

Při tréninku se mohou objevit následující problémy:

Přetrénování a nedostatečné natrénování

  • Přetrénovaný model produkuje přesycené obrazy s artefakty.
  • Nedostatečně natrénovaný model nedokáže konzistentně reprodukovat požadovaný koncept.

Únik konceptů
Pro snížení rizika úniku konceptů:

  • Používejte jedinečné aktivační tagy.
  • Nastavte počet opakování datasetu tak, aby byla zachována rovnováha.
  • Vyzkoušejte pivotní ladění pro vytvoření nového embeddingu.

Důležité: Při označování datasetu se zaměřte spíše na falešně negativní označení než na falešně pozitivní, protože ty mohou výrazně ovlivnit kvalitu modelu .

Generujte regularizační obrázky pomocí stejného modelu, VAE, rozlišení a sampleru (DDIM nebo DDPM), vždy s pevným seedem.

Po dokončení tréninku a vyřešení všech problémů přistupte k implementaci modelu ve Stable Diffusion. Následně můžete pokračovat s integrací vašeho LORA modelu do tohoto systému.

Použití LORA modelu ve Stable Diffusion

Jakmile máte svůj LORA model natrénovaný, můžete ho začít používat ve Stable Diffusion.

Načtení LORA modelu

Postup pro implementaci LORA modelu do Stable Diffusion:

  1. Stáhněte soubor LORA modelu a umístěte jej do složky stable-diffusion-webui/models/Lora .
  2. V promptu model aktivujte pomocí syntaxe [lora:nazev_modelu:váha]. Váha určuje, jak moc model ovlivní výstup (např. 1 = plný vliv, 0,5 = poloviční vliv, 0 = deaktivace).

Jakmile je model načten, můžete přejít k testování jeho nastavení a výsledků.

Testování a úprava výsledků

Pro co nejlepší výsledky je klíčové správně nastavit parametry generování. Doporučené hodnoty:

ParametrDoporučená hodnotaPoznámka
Váha LORA0,35 – 1,0Začněte na 0,35 pro LCM-LoRA
CFG škála1,0 – 7,0Pro LCM-LoRA zkuste cca 1,0
Počet kroků4 – 8Platí pro LCM-LoRA

Používejte stejný základní checkpoint jako při tréninku a upravujte váhu podle tabulky, dokud nedosáhnete požadovaných výsledků. Sledujte, zda model věrně reprodukuje zamýšlený koncept.


Tipy pro lepší výsledky

Zde je několik užitečných tipů, jak doladit generování:

  • Ujistěte se, že váš LORA model je kompatibilní s verzí Stable Diffusion, kterou používáte. Při kombinování více modelů postupujte opatrně .
  • Pokud model není viditelný, zkuste obnovit seznam modelů v rozhraní Web UI .
  • Experimentujte s aktivačními klíčovými slovy a váhou modelu, abyste dosáhli požadované kvality.

Pro stabilní výkon doporučujeme pravidelně aktualizovat Stable Diffusion Web UI na aktuální verzi a zachovat konzistentní nastavení mezi fází tréninku a generování obrázků.

Shrnutí

LORA (Low-Rank Adaptation) nabízí efektivní způsob, jak upravit Stable Diffusion bez nutnosti kompletního přetrénování modelu. Díky této technologii lze dosáhnout až 10× rychlejšího výkonu a 4× menší náročnosti na paměť .

Příklady LORA modelů

Typ LORAPříkladVyužití
StylovýCrayon Style LoRA SDXLObrázky s efektem kreseb pastelkami
KonceptuálníSticker Sheet LoRATvorba designů samolepek
ObjektovýDog Example LoRA SDXLGenerování obrázků zaměřených na psy

Pravidelná aktualizace softwaru a experimentování s parametry jsou klíčem k dosažení požadované kvality. Platformy jako Shakker AI navíc umožňují snadné trénování LORA modelů bez nutnosti lokální instalace .

Tento přehled vám poskytne základní informace pro úspěšnou aplikaci LORA modelů ve Stable Diffusion.

 


Jak nainstalovat nástroj pro tvorbu 3D modelů umělou inteligencí Hynyuan3D-2 prostřednictvím Pinokio na systému Windows.

Chcete začít rychle tvořit 3D modely pomocí AI? Hunyuan3D-2 od Tencentu umožňuje generování 3D modelů s texturami během několika sekund. Díky platformě Pinokio je instalace jednoduchá a bezpečná. Postupujte podle následujících kroků:

Klíčové informace:

Rychlý přehled:

Funkce PinokioVýhody
Lokální zpracováníData zůstávají na vašem zařízení.
Jednoduchá instalaceAutomatická správa závislostí.
Otevřený kódZdarma a bez omezení API.

Začněte instalací Pinokio, ověřte kompatibilitu GPU a postupujte podle návodu k instalaci Hunyuan3D-2. Problémy s pamětí nebo chybami DLL lze řešit přepnutím na LowVRAM verzi nebo aktualizací ovladačů. Po instalaci můžete snadno vytvářet 3D modely z textu, obrázků nebo skic.

Přípravné kroky před instalací

Před instalací Hunyuan3D-2 je potřeba připravit váš systém Windows. Správná příprava zajistí hladký průběh instalace i bezproblémový výkon.

Instalace Pinokio

Pinokio

  • Stažení instalačního souboru
    Přejděte na oficiální web Pinokio a stáhněte aktuální verzi instalačního souboru. Pokud se během stahování objeví varování od Windows Defenderu, můžete jej ignorovat a pokračovat. Tento krok je běžný .
  • Spuštění instalace
    Po otevření instalačního souboru vás aplikace Pinokio provede procesem instalace. Automaticky nainstaluje všechny potřebné nástroje, včetně správy GitHub repozitářů, FFmpeg, Pythonu, Anacondy a virtuálních prostředí.

Jakmile je Pinokio úspěšně nainstalováno, přejděte ke kontrole hardwarových požadavků na GPU.

Kontrola požadavků na GPU

Pro ověření kompatibility GPU postupujte podle následujících kroků:

  • Správce zařízení (Windows + X):
    • Otevřete „Správce zařízení“ a rozbalte sekci „Grafické adaptéry“.
    • Zkontrolujte model grafické karty.
  • Správce úloh (Ctrl + Shift + Esc):
    • Přejděte na záložku „Výkon“ a vyberte „GPU“.
    • Zkontrolujte dostupnou VRAM.

Pokud vaše GPU splňuje požadavky, přejděte k úpravě nastavení Windows pro AI.

Nastavení Windows pro AI

PožadavkySpecifikace
Operační systémWindows 10 nebo novější
PythonVerze 3.11+
CUDA ToolkitVerze 12.4+
Ovladače GPUVerze >550 (březen 2024)

Před instalací nezapomeňte na tyto kroky:

  • Stáhněte a nainstalujte Visual Studio Build Tools s volbou „Vývoj desktopových aplikací v C++“ .
  • Aktualizujte ovladače grafické karty na nejnovější dostupnou verzi.
  • Nainstalujte PyTorch kompatibilní s verzí CUDA, kterou používáte .

Průvodce instalací Hunyuan3D-2

Hunyuan3D-2

Otevření skriptů v Pinokio

Po instalaci aplikace Pinokio a kontrole systémových požadavků postupujte podle těchto kroků:

  1. Spuštění Pinokio: Otevřete aplikaci Pinokio. Slouží jako lokální prohlížeč pro správu serverových aplikací .
  2. Vyhledání skriptu: Použijte vyhledávací pole v horní části okna a zadejte "Hunyuan3D-2".
  3. Výběr verze: Zvolte verzi, která odpovídá VRAM vaší grafické karty:
VerzePožadavky na VRAMDoporučené použití
Standardní24 GBPro profesionální práci
LowVRAM6 GBPro běžné použití

Spuštění instalace

  1. Zahájení instalace

Klikněte na tlačítko „Install“ u vybrané verze Hunyuan3D-2. Pinokio automaticky stáhne a nainstaluje všechny potřebné součásti .

  1. Sledování průběhu

Sledujte průběh instalace v konzoli. Doba instalace závisí na rychlosti připojení. Pokud narazíte na problémy, pokračujte do sekce řešení chyb.

Řešení běžných chyb

Chyba načítání DLL souborů

"V únoru 2025 uživatel Vainilla07 hlásil chybu ImportError: DLL load failed while importing custom_rasterizer_kernel: Cannot find the specified module."

Zkontrolujte, zda máte nainstalované všechny požadované závislosti včetně Visual Studio Build Tools.

Problémy s pamětí CUDA

"V únoru 2025 uživatel sankexin nahlásil chybu 'cuda out of memory'."

  • Přepněte na verzi LowVRAM.
  • Snižte velikost textur.
  • Zavřete ostatní aplikace, které využívají GPU.

Problémy s kompilací

"V únoru 2025 uživatel metamountain nahlásil chybu při kompilaci rasterizeru."

Řešení zahrnuje:

  • Aktualizaci CUDA Toolkit na verzi 12.4 nebo novější.
  • Přeinstalaci ovladačů NVIDIA.
  • Kontrolu kompatibility verze Python.

Pokud problémy přetrvávají, zvažte využití komunitních nástrojů, jako jsou ComfyUI-Hunyuan3DWrapper nebo Hunyuan3D-2-for-windows .

sbb-itb-6f064b4

Nastavení a první spuštění

Po úspěšné instalaci je čas na konfiguraci systému a spuštění aplikace.

Nastavení cesty k souborům

Aby systém správně rozpoznal aplikaci Hunyuan3D-2, je potřeba nastavit cestu k její instalační složce v Systémových vlastnostech Windows:

  • Klikněte pravým tlačítkem na "Tento počítač" a vyberte možnost "Vlastnosti".
  • Přejděte do "Pokročilé nastavení systému".
  • Otevřete "Proměnné prostředí".
  • V sekci "Systémové proměnné" vyhledejte proměnnou "Path".
  • Přidejte cestu k instalační složce Hunyuan3D-2.

Poznámka: Maximální délka proměnné prostředí je 1 024 znaků. Pokud je cesta příliš dlouhá, může být nutné upravit registr.

Pro ověření zadejte příkaz: echo %PATH%.

Výběr verze podle VRAM

Zvolte správnou verzi aplikace podle kapacity paměti vaší grafické karty. K ověření velikosti VRAM můžete použít nástroj GPU-Z.

Velikost VRAMDoporučená verzePoznámka
24 GB a víceStandardníNejvyšší kvalita výstupu
6–12 GBLowVRAMLepší výkon pro slabší hardware
Méně než 6 GBNepodporovánoJe nutný upgrade GPU

První spuštění programu

Aplikaci Hunyuan3D-2 můžete spustit dvěma způsoby:

  • Gradio rozhraní: Zadejte příkaz python3 gradio_app.py.
  • API server: Zadejte příkaz python api_server.py --host 0.0.0.0 --port 8080.

Pro ověření instalace doporučujeme vytvořit jednoduchý 3D model z testovacího obrázku.

V lednu 2025 společnost Tencent zpřístupnila inferenční kód a předtrénované modely Hunyuan3D 2.0. Ty lze vyzkoušet prostřednictvím platformy Hugging Face Space nebo na jejich oficiálních stránkách.

Kontrolní body

Před dalším postupem zkontrolujte následující:

  • Cesta v systémových proměnných byla nastavena správně.
  • Vybraná verze odpovídá kapacitě vaší grafické karty.
  • Připojení k internetu je funkční pro stažení potřebných modelů.

Po těchto krocích je instalace dokončena a můžete začít plnohodnotně pracovat s Hunyuan3D-2.

Výkon a řešení problémů

Optimalizace výkonu

Pro zajištění hladkého chodu Hunyuan3D-2 je důležité správné nastavení hardwaru a softwaru. Doporučené požadavky zahrnují aktualizované ovladače GPU, procesor s podporou AVX, 8–32 GB RAM a operační systém Windows 10 nebo novější.

KomponentaDoporučené nastaveníDopad na výkon
GPU ovladačeNejnovější oficiální verzeStabilita a kompatibilita
CPUS podporou AVX instrukcíLepší výpočetní efektivita
RAM8–32 GBPlynulý chod při práci s velkými modely
WindowsWindows 10 nebo novějšíPodpora moderních ML pluginů

Kromě základního nastavení můžete snížit nároky na VRAM úpravou určitých parametrů:

  • tile_size v uzlu „VAE Decode (Tiled)“ – zmenšení hodnoty pro nižší spotřebu paměti.
  • temporal_overlap – úprava pro efektivnější správu paměti.
  • weight_dtype v uzlu „Load Diffusion Model“ – nastavení na fp8 pro úsporu VRAM.

Řešení běžných problémů

I při optimálním nastavení se mohou objevit potíže. Zde je několik tipů, jak je řešit:

ModuleNotFoundError

  • Zkontrolujte, zda máte nejnovější verzi ComfyUI.
  • Ověřte, že všechny soubory jsou umístěny ve správných složkách.

CUDA chyby

  • Ujistěte se, že máte správně nainstalovanou CUDA a nastavené systémové proměnné.
  • Používejte GPU s výpočetní schopností 6.0 nebo vyšší (např. Pascal).

Problémy s pamětí

  • Aktivujte dlaždicování, aby se snížily nároky na VRAM, aniž by došlo ke ztrátě kvality výstupu.

Pokud nemáte k dispozici vhodnou GPU, pluginy strojového učení mohou běžet na CPU. Mějte však na paměti, že výkon bude výrazně nižší .

Kde hledat pomoc

Pro další informace a podporu můžete využít následující zdroje:

Pro profesionální práci, například s 360VR nebo filmovými projekty, je doporučeno mít alespoň 8–32 GB RAM. Tím zajistíte plynulý výkon i při náročných úlohách .

Další kroky

Instalace je hotová, takže je čas se pustit do tvorby vlastních 3D modelů.

Začněte tím, že se seznámíte s prostředím Hunyuan3D-2. Program má přehledné a snadno pochopitelné rozhraní, které vám umožní pracovat s umělou inteligencí na tvorbě 3D modelů. Doporučujeme začít s jednoduššími objekty a postupně se pustit do složitějších projektů.

Tipy, jak z Hunyuan3D-2 vytěžit maximum:

Vyzkoušejte také hybridní metody generování modelů, například kombinaci technik zigzag a boundary parallel. Tyto metody jsou ideální pro tvorbu složitějších 3D objektů.

Nezapomeňte pravidelně kontrolovat aktualizace na oficiálním GitHub repozitáři. Najdete tam nejen nové verze programu, ale také užitečné nástroje a doplňky, jako je například Blender Addon pro pokročilé modelování.

Tímto začíná vaše tvůrčí cesta s Hunyuan3D-2!