Nová vlna AI oper: Revoluce v české operní scéně

Česi používají Suno AI k vytváření oper známých českých bizárů.

V posledním roce se na české YouTube scéně objevuje fenomén, který by byl ještě nedávno považován za science fiction – opery vytvářené za pomoci umělé inteligence. V Suno AI, je totiž možné za pomocí přidání textu a podnětu ke stylu hudby generovat klasické skladby. Tento přístup přináší zcela nové zážitky a Češi se samozřejmě chytli klasických bizárů a virálních videí, jež posouvají hranice toho, co si tradičně představujeme pod pojmem opera. Jako znalci bizáru a milovníku nekorektního humoru mi nedalo, než o tomto comebacku napsat a hodit to s panem Kletbou pěkně na papír.

Bába pod kořenem

Jedním z prvních a nejvíce diskutovaných děl této nové vlny je opera Bába pod kořenem. Tento experimentální projekt využívá AI ke komponování hudby i k vytváření libret, čímž vzniká dílo, které se vymyká tradičním operním schématům. Opera vypráví příběh z bizarní reportáže TV Nova Davida Pika, který zdokumentoval a zdramatizoval banální příběh staré ženy, která se při pitce s kamarády v lese zasekla pod kořenem. Některé hlášky z reportáže zlidověly a paní Zdena si později v Praze otevřela restauraci s názvem Restaurace Kotva – U báby pod kořenem. Temné a tajemné tóny, které AI vygenerovala, perfektně podtrhují atmosféru díla, jež se pohybuje na pomezí mýtu a reality. 

Ondřeji, prosím

Dalším významným projektem je opera Ondřeji, prosím!, která kombinuje jeden s prvních českých virálů a to Drsný rozchod v Praze. Psal se rok 2012, když se světem internetu začalo šířit dnes již legendární a na tehdejší dobu poměrně drsné video, ve kterém se jistý Ondřej rozchází s blonďatou slečnou. Hystericky brečící blondýnka Kristýna ve videu zakřičí zhruba stokrát zlidovělou hlášku „Ondřeji, prosím!“. To je taky námětem této AI opery, kterou shledávám nejpovedenější. Chvála Tesařovi.

Svatba Jiřího Káry

Svatba Jiřího Káry je jednou z nejvíce provokativních a ikonických AI oper, které v Suno vznikly. Jde o satirickou operu inspirovanou životem a svatbou Jiřího Káry - svatby bezdomovců, legendární postavy českého alko undergroundu s drsnou příchutí devadesátek. Jiří Kára zažívá comeback po někalikátem zabanování a znovunahrání především díky práci facebookové skupiny Jiří Kára. Tato opera využívá AI k vytvoření hudebního doprovodu, který kombinuje hlášky ze svatby bezdomovců a klasických operních postupů. Výsledkem je neotřelé a drsné dílo, které nezapomíná ani na Stránskýho vyprcanýho. Čest všem vydlážděným.

Svarta Jump

Zcela jiný přístup pak představuje opera Svarta Jump, která je inspirována skokem otrokovického pablba a tedy vítěze olympiády v jumpování z vejšky jako prase. Video se stalo virálním myslím v roce 2021 tedy za covidu a AI v tomto projektu využívá rozsáhlé databáze lidových melodií a rytmů, které kombinuje s touto bizarní opileckou polosebevraždou.

Oprava slovenského lakatoše

Nesmíme také zapomenout na opravu lakatoše provázenou hysterickými hláškami "Ani očko nenasadíš" nebo argresivními projevy "Nebudu to dělat" až po agresivní výhružky, defeatistické fáze až po smíření slavného bezejmeného opraváře, který byl něvědomky zachycen mikrofonem mobilního telefonu kolem roku 2010, která se nesmazatelně vryla do cache českých databází se slovy "Nebudu to dělat".

Ať je to jak chce, videa se stali populární a Češi opět prokázili svůj charakterový rys smějících se bestií, kteří AI využijí především proto, aby zvětšnili dávno zapomenuté perly českých internetů. V podstatě už neexistuje nic exkluzivního, na co by AI opera nebyla. To všechno ukazuje, jak na nesmrtelnost těchto virálů, které se za nějakou dobu po smazání zase někde objeví, ale i na nepředvídané schopnosti AI s generováním hudby. Navíc je to příležitost jak mladé generaci připomenout tyto bizární klenoty a přitáhnout je zpět ke klasice.


Tísňové údolí a generovaná AI videa

Proč je někoho nesmírně těžké dívat se na umělý vizuál..

Tísňové údolí (anglicky „uncanny valley“) je fenomén, který popisuje negativní reakci člověka na umělou bytost nebo objekt, který je téměř, ale ne zcela lidský. Tento koncept poprvé představil japonský robotik Masahiro Mori v roce 1970. Podle Moriho teorie dochází ke stavu tísňového údolí tehdy, když robot, avatar nebo jiný umělý výtvor vypadá téměř jako člověk, ale stále vykazuje drobné nedokonalosti nebo zvláštnosti, které způsobují pocit nepohodlí či odporu.

Závislost lidských emocí při vnímání robota s proměnlivou mírou antropomorfismu. Osa x představuje míru antropomorfismu od zcela nehumanoidní bytosti po bytost nerozeznatelnou od člověka, osa y zachycuje míru emocí při vnímání takové bytosti lidmi. V počátku je neutrální, směrem nahoru rostou pozitivní a směrem dolů negativní emoce.

Závislost lidských emocí při vnímání robota s proměnlivou mírou antropomorfismu. Osa x představuje míru antropomorfismu od zcela nehumanoidní bytosti po bytost nerozeznatelnou od člověka, osa y zachycuje míru emocí při vnímání takové bytosti lidmi. V počátku je neutrální, směrem nahoru rostou pozitivní a směrem dolů negativní emoce.

Téměř lidští androidi nás děsí. Zjednodušený graf s průběhem od strojového robota s tísňovým údolím až téměř dokonalého zjevu a plně lidského zjevu.  

Tísnivé údolí, někdy též strašidelné údolí, je oblast na pomyslném grafu závislosti polarity lidských emocí při vnímání humanoidů (robotů, počítačem vytvořených trojrozměrných postav, detailně vymodelovaných panenek apod.) podle jejich míry podobnosti s člověkem (antropomorfismu). Míra kladných emocí při vnímání postupně lépe a lépe antropomorfizované bytosti zpočátku stoupá, ale nepředstavuje prostou funkci – od určité míry antropomorfismu klesá až k negativním emocím, aby těsně před metou dokonalé antropomorfizace opět stoupla k maximu. Interval v míře antropomorfismu, jímž obdařeného humanoida člověk vnímá odpudivě, se nazývá tísnivé údolí.

Mozek na funkční magnetické rezonanci při sledování robota, androida a člověka. Kredit: Ayse Pinar Saygin, UC San Diego. Sayginová a spol. natočili videa na nichž Repliee Q2, Japonka, která byla předobrazem podoby aktroidky a pak tentýž robot v syrové podobě bez lidského povrchu, tedy připomínající terminátora, dělají běžné pohyby, jako je mávání, přikyvování, uchopování sklenky s vodou nebo zvedání kousku papíru. Dobrovolníkům nejprve prozradili, kdo je na kterém videu, pak jim je pustili a sledovali jejich mozky funkční magnetickou rezonancí. Nedostižná matka Sheldona Coopera by jistě měla radost.

Tísňové údolí v kontextu generovaných AI videí

V posledních letech se s rozvojem umělé inteligence (AI) a pokročilých algoritmů pro generování videa stává tísňové údolí stále aktuálnějším tématem. AI dnes dokáže generovat realistická videa, která jsou na první pohled k nerozeznání od skutečnosti. Avšak když se tato videa dostanou do bodu, kdy jsou „téměř dokonalá“, ale stále obsahují drobné anomálie – například nepatrně nepřirozené pohyby, zvláštní výrazy obličeje, nebo nesoulad mezi mluveným slovem a pohyby rtů – mohou vyvolat silný pocit nepohodlí nebo dokonce strachu.

Generovaná videa mohou tísňové údolí překonat dvěma způsoby. Prvním je neustálé zdokonalování technologií, až do bodu, kdy budou tyto drobné chyby zcela odstraněny a umělé výtvory budou zcela nerozeznatelné od skutečných lidí. Druhým přístupem je úmyslné ponechání určitých znaků „umělosti“, aby diváci okamžitě rozpoznali, že se jedná o ne-lidskou tvorbu, což snižuje míru nepohodlí.

Tísňové údolí a robotika

Robotika je dalším polem, kde tísňové údolí představuje významnou výzvu. Moderní humanoidní roboti jsou navrhováni tak, aby napodobovali lidské chování, výrazy obličeje a pohyb. Když je však jejich podoba a pohyb příliš realistický, ale ne zcela přesný, mohou vyvolávat nepříjemné pocity u lidí, kteří s nimi přicházejí do styku. Tento jev může mít závažné důsledky pro aplikace, kde je důležitá interakce mezi lidmi a roboty, například v péči o seniory nebo v zákaznickém servisu.

Aby se minimalizoval efekt tísňového údolí, designéři robotů často volí stylizovaný nebo zjednodušený vzhled, který sice připomíná lidské rysy, ale je dostatečně odlišný, aby nevyvolával pocit, že jde o skutečného člověka. Tento přístup je patrný například u robotů typu „Pepper“, kteří mají záměrně zjednodušený a přátelský design.

Budoucnost a etické otázky

Jak generovaná AI videa, tak humanoidní roboti budou v budoucnosti stále častěji překonávat hranice mezi umělým a skutečným. To přináší nejen technologické, ale i etické otázky. Jaký vliv bude mít tísňové údolí na naši psychiku, a jak bychom měli přistupovat k designu těchto technologií, aby byly pro lidi co nejpřirozenější a nejpřijatelnější?

V oblasti AI generovaných videí se také objevuje otázka autenticity a důvěryhodnosti. Jakým způsobem budeme schopni rozpoznat, co je skutečné a co je generováno AI? A jak zajistíme, že tyto technologie nebudou zneužity k šíření dezinformací nebo manipulaci veřejného mínění?

V konečném důsledku je tísňové údolí nejen technickým problémem, ale i hlubokým filozofickým a etickým dilematem, které bude nadále formovat budoucnost robotiky a AI technologií. Rozpoznání a překonání tohoto fenoménu je klíčovým krokem pro vytvoření technologií, které budou sloužit lidem a současně budou respektovat naše přirozené reakce a emocionální potřeby.


Jak si stojí Raspberry Pi AI Kit

Společnost Raspberry Pi vydala sadu pro jednodeskový počítač AI Kit s funkcemi strojového učení. Možná je to proto, aby podpořila své nedávné uvedení na trh, nicméně údaje o výkonu vypadají, že zaútočí na trh s okrajovými výpočetními systémy AI. Řekl bych že RPI poháněná Hailo, dává 13 TOPS, za přibližně 2000 CZK, to není špatné.

Společnost Raspberry Pi vydala sadu pro jednodeskový počítač AI Kit s funkcemi strojového učení.

Sada AI je poháněna akcelerátorem Hailo-8L a vlastní deskou Raspberry Pi M.2 HAT+

Než někdo začne předpokládat nějaké pokročilé důvody AI, uvědomte si, že HAT znamená pouze Hardware Attached on Top. Přepychový způsob, jak říct, deska přišroubovaná přes jinou desku...

V každém případě je tento AI akcelerátor za 70 dolarů opravdu výhodná koupě. A co je ještě důležitější, získáte skvělou nabídku výkonu pro vaši vestavěnou aplikaci, jak je uvedeno v následující části.

O Hailo-8L: Raspberry Pi si jako dodavatele akcelerátoru vybralo společnost Hailo. Hailo-8L je ořezaná verze nedávno oznámeného čipu Hailo-8, který nabízí 26TOPS. Hailo-8L nabízí chvályhodných 13TOPS a přináší Raspberry Pi tolik potřebný výkon v oblasti umělé inteligence.

Hailo AI čip detail

Nedávno se AMD dostalo do čela žebříčku TOPS s 50TOPS, proto se 13TOPS zdá málo.Je třeba vzít v úvahu, že se bude používat ve světě embedded a 13TOPS přinese obrovskou výhodu pro okrajové aplikace typu počítačového vidění. Také notebook s RISC-V Linuxem v době psaní tohoto článku nabízí pouze 2TOPS.

Podle technického ředitele společnosti Hailo Aviho Bauma spotřebuje Hailo-8L na každé tři TOPS přibližně jeden watt energie, což je maximálně zhruba pět wattů. A pro typickou embedded zátěž, jako je zpracování 60 FPS videa v reálném čase, si vezme sotva jeden nebo jen dva watty.

Hailo se speciálně zaměřuje na nízkou spotřebu okrajových aplikací umělé inteligence & pohodlně poráží i NVIDIA. Níže je uveden jejich výkon ve srovnání s Jetson Nano a Xavier NX od společnosti NVIDIA.

Hailo - porovnání výkonu AI
NFC hodnocenky Google

Čip má širokou podporu pro frameworky AI, mezi které patří TensorFlow, TensorFlow Lite, Keras, PyTorch a ONNX. Vzhledem k výše uvedeným číslům a výkonové výhodě vypadá rozhodnutí Raspberry Pi s Hailo jasně.Architektura a design sady Raspberry Pi AI V současné době sada AI podporuje architekturu x86 i Arm Host. Generální ředitel Raspberry Pi, Eben, sdělil, že záměrně plánují samostatnou akcelerační desku, nikoli integrovaný NPU, jako je tomu u SoC Apple & Qualcomm, které byly nedávno uvedeny na trh pro počítače s AI.

Raspberry Pi AI Kit

Raspberry Pi již tuto oddělenou architekturu má, protože používá IO funkce na levném 40nm, zatímco CPU a GPU je na 16nm. I když je jádro na 16nm, přidání NPU k němu bude nákladné, protože se zvětší plocha.

Pokud chce uživatel použít Raspberry Pi 5 pro aplikaci, která není spojena s umělou inteligencí, ano, existují... a musí zbytečně vyhodit další peníze za nechtěné náklady na plochu die NPU. Nyní mají možnost volby & hardwaroví lidé mají rádi volby. I když samotná verze Raspberry Pi 3 byla použita pro AI aplikaci, AI zátěž byla na cloudu. Tento nový Raspberry Pi 5 s Hailo-8L dokáže sám na okraji zastat menší modely & optimalizované LLM.

Současný stav sady Raspberry Pi AI

Tento počítač Raspberry Pi je vybaven rozhraním PCIe 2.0, přes které komunikuje s akcelerátorem Hailo-8L. PCIe 2.0 má pouze verze Raspberry Pi 5. Pokud tedy chcete vyzkoušet funkci AI, musíte vyměnit desku. Nicméně i M.2 HAT+ pro Raspberry Pi 5 stojí jen asi 80 dolarů. 

Souprava je dodávána s předmontovanou tepelnou podložkou pro lepší odvod tepla Hailo-8L, která sice spotřebuje pár wattů, ale bude výrazně teplejší. Raspberry Pi si uvědomuje, že pro mnohé tvůrce je to nový terén. Proto bude poskytovat více demo a softwarových nástrojů na podporu uživatelů vyvíjejících funkce UI.

Raspberry Pi tvrdí, že nastavení a spuštění aplikace AI bude otázkou několika minut. 

Ačkoli hardware funguje tak, jak má, je třeba si uvědomit, že software zatím NENÍ ve skvělé formě. Ale během několika měsíců se vše stane skutečností.

Tým Tom's Hardware dostal k dispozici testovací sadu a narazil na několik problémů. Podle jejich informací brzy přijde aktualizace operačního systému Raspberry Pi, která umožní několik funkcí umělé inteligence, což v současné době omezuje jeho použití. Podařilo se jim však detekovat obrázky včetně medvídka, jak ukazuje obrázek níže. 

Detekce oblyčeje nebo objektu - Díky obrázku z Toms Hardware

V ukázce není provedeno měření rychlosti, ale tým se zmínil, že „cítili“, že jen málo z nich je rychlejších. Tým Tom's hardware také zmínil, že Raspberry Pi odhalil, že v budoucnu můžeme v případě potřeby spustit vlastní modely.

Případy použití

Raspberry Pi & Hailo tvrdí, že výhoda nízké spotřeby je významná pro mnoho hardwaru počítačového vidění, jako je rozpoznávání obrazu v okrajových uzlech. Společnost také říká, že mají různé modely včetně některých vhodných pro přidávání funkcí AI do her.

Hra Lincity-NG , díky obrázku z raspberrytips.com

Vzhledem k tomu, že systém Windows 11 není určen pro Raspberry Pi, říkají, že tato sada není určena pro software Microsoft Copilot. Nevylučují však, že některé funkce budou fungovat. Vzhledem k tomu, že 13TOPS je téměř 1/3 ze 40TOPS předepsaných pro počítače Copilot+, něco skutečně fungovat bude.

Závěr

Obě společnosti očekávají, že komunita tvůrců přijde s nějakým jedinečným případem použití, který vyřeší jejich vlastní problémy. Věřím také, že síla komunity Raspberry Pi, skutečně něco změní. Kromě projektů ve třídách začne nově objevenou schopnost 13TOPS AI využívat i mnoho robotických aplikací.

Musíme počkat na další aktualizace softwaru Raspberry Pi, abychom měli lepší pracovní platformu. Je vzrušující, že generální ředitel Raspberry Pi zmínil, že tímto spojení se společností Hailo nekončí.

překlad článku od Gandhi KT