Necenzurované a „šílené“: Pohled na tajný generátor obrázků OpenAI

Dosud nezveřejněný nástroj pro generování obrázků se nevyhýbá nahotě a gore a upozorňuje na to MidJourney.

Společnost OpenAI v posledních několika měsících soukromě testovala novou iteraci svého generativního modelu pro generování obrazu pomocí umělé inteligence (AI) a první ukázky, které unikly od YouTubera MattaVidPro, ukazují, že překonává předchozí generátory obrazu.

„Nesmírně vzrušující – tohle vyrazí dech všemu, co jsme dosud viděli, je to šílené,“ uvedl Matt v ukázce, kterou zveřejnil na YouTube. „Midjourney nemůže konkurovat na této úrovni – dokonce si ani nemyslím, že by Midjourney verze šest byla schopna konkurovat na této úrovni.“

Nečekejte však, že si ji v dohledné době vyzkoušíte. Přístup je totiž velmi omezený.

Nezveřejněný model je pravděpodobně upgradem DALL-E 2 a je testován prostřednictvím náhledu pouze pro zvané uvnitř ChatGPT-4. Matt uvedl, že na celém světě má k tomuto novému generátoru obrázků OpenAI přístup jen asi 400 lidí.

Ukázky obrázků jsou sice omezené, ale ukazují pokročilé schopnosti umělé inteligence. Vytvořila ostré snímky s osvětlením a odrazy, které napodobují skutečné fotografie. Model obnovil detailní obrazy až po viditelné tahy štětcem. Na vygenerovaných produktech také bezchybně ztvárnil názvy značek jako „Snickers“ a loga známých značek, například Subway, a dosáhl poměrně dobrého pravopisu ve vykreslovaném textu.

Jeden příklad obrázku vytvořeného pomocí převodu textu na obrázek od společnosti OpenAI. Zdroj: MattVidPro

Jeden příklad obrázku vytvořeného pomocí převodu textu na obrázek od společnosti OpenAI. Zdroj: MattVidPro

Zatímco současné generátory obrázků mají problémy se souvislými rukama, příklady ukázaly realistické, správně proporcionální ruce. Také pozadí se jevilo přesvědčivěji než u konkurenčních systémů AI.

OpenAI zřejmě odstranil své bezpečnostní filtry, aby mohl otestovat plný potenciál modelu. Podle uživatelů dokáže bez zaváhání generovat násilný obsah a nahotu. Nicméně při znalosti postoje OpenAI k NSFW obsahu je velmi nepravděpodobné, že by oficiální veřejná verze byla uvolněna podle těchto standardů.

„Je to OpenAI, takže se můžete vsadit, že tuhle věc budou hlídat, jako to dělají u všeho, než ji vydají,“ poznamenal Matt.

ChatGPT se na scéně objevil koncem loňského roku, kdy oslnil lidi svými konverzačními schopnostmi podobnými lidským, a vydání nejnovější verze vyvolalo kryptografickou rallye a volání po pozastavení vývoje. Podle nové studie však mohou schopnosti předního AI bota ve skutečnosti klesat. Výzkumníci ze Stanfordu a Kalifornské univerzity v Berkeley systematicky analyzovali různé verze ChatGPT z března a června 2022. Vyvinuli přísná měřítka pro hodnocení kompetencí modelu v oblasti matematiky, kódování a…

Někteří odborníci kritizují OpenAI za to, že „otupuje“ své modely, aby se vyhnula případným kontroverzím. Některé studie dokonce naznačují, že OpenAI vycvičila ChatGPT tak, aby její výstupy byly silně politicky zaujaté.

Nicméně konzistentní kvalita, kterou vzorky vykazují, je skokem vpřed. Zdůrazňuje pokračující úsilí společnosti OpenAI o zlepšení schopností generativní umělé inteligence. Společnost možná ještě letos prozradí více o svém pokroku, zejména pokud oblast rozpoznávání a generování obrazů pomůže zlepšit robustnost jejího hvězdného produktu: multimodálního GPT-4 schopného porozumět textu, obrázkům a návrhům v jedné výzvě.

Prozatím zůstává tato technologie omezena na uzavřené testování s nepatrným počtem uživatelů.

S dalším zdokonalováním modelů se hranice mezi umělou a skutečnou komunikací ještě více stírá. To sice mnohé vzrušuje, ale obavy ze zneužití budou přetrvávat. Odpovědné budování této technologie zůstává naléhavou výzvou.

Překlad članku z Decrypt.co od Jose Antonio Lanz