AI od Googlu umí vytvářet a měnit virtuální světy. Koubský: Budou se tak trénovat roboti a agenti
Generování textů, obrázků, zvuků či videa už umělá inteligence nabízí dlouho. Teď přichází na řadu vytváření virtuálních světů. Umět to má model Genie 3 od společnosti DeepMind, která patří Googlu. „Je to dobré třeba na výcvik robotů. Nanečisto se naučí pohybovat v různém prostředí, aby to potom zvládli v reálném světě, kde dostávají informace přes senzorické vstupy,“ přibližuje význam této technologie pro Český rozhlas Plus Petr Koubský, vědecký redaktor Deníku N.
Genie 3 umí na základě textového zadání vytvořit interaktivní svět, kterým může uživatel podle libosti do určité míry procházet. Simulaci dokáže také měnit po zadání dalších textových pokynů.
Model zatím dokáže přehrávat jen několik minut simulace a Google jej zatím neuvolnil k veřejnému používání. Podle firmy by měl sloužit pro AI agenty, kteří mají samostatně působit v reálném prostředí.
Čtěte také
Firma model považuje za klíčovou technologii, která by měla pomoci vývoji takzvané obecné umělé inteligence (AGI).
V oblasti generování interaktivních světů zatím není tolik modelů, aby bylo s čím srovnávat. „Hlavní konkurencí pro Google je v tomto směru asi Nvidia se svým modelem Cosmos,“ připomíná Koubský.
„Ale jinak toho moc není. Existují proprietární modely, které provozují herní firmy pro generování prostředí náročných videoher,“ pokračuje. „Jsou to vesměs technologie na generování reálně vyhlížejícího a fungujícího světa, kde platí fyzikální zákony, pokud se tvůrce nerozhodne, že je chce nějak modifikovat.“
Čtěte také
Takové prostředí je velmi bohaté na detaily a lze se v něm různě pohybovat. „To si nejlépe představíme právě na hře,“ doporučuje vědecký redaktor.
Podle něj jde o užitečný nástroj pro výcvik robotů a trénování toho, aby se dokázali dobře pohybovat v různém prostředí. To by si pak mohli přenést do reálného světa, kde získávají informace o prostředí prostřednictvím senzorů.
Trénování AI agentů
Společnost DeepMind uvádí, že právě tento model by měl sehrát poměrně velkou roli při trénování AI agentů a vývoji obecné umělé inteligence (AGI).
Čtěte také
„Myslím, že tímto směrem to opravdu povede,“ souhlasí Koubský. O umělé inteligenci včetně té na úrovni AGI zpravidla přemýšlíme jako o něčem abstraktním, co bydlí v počítači a pracuje to s daty, texty a programovým kódem. „A to je přece také text.“
„Ovšem skutečně špičková umělá inteligence a skuteční AI agenti budou muset nějakým způsobem umět jednat a fungovat ve skutečném světe. A to například v robotickém těle,“ předpovídá vědecký novinář.
Aby tohle dovedli, vyplatí se je trénovat právě v prostředí, jaké nyní nabízí Genie 3. „Tohle jim žádný text nezprostředkuje,“ vyzdvihuje Koubský. „A proto modely virutálního světa nabývají takového významu.“
Povede mazání e-mailů k úspoře vody? Co dokáže nový model ChatGPT od OpenAI? A jak se daří sociální síti Threads, která měla nahradit X? Poslechněte si celý Online Plus.
Nejposlouchanější
Více z pořadu
E-shop Českého rozhlasu
Závěr příběhu staré Karviné, který měl zůstat pod zemí
Karin Lednická, spisovatelka

Šikmý kostel 3
Románová kronika ztraceného města - léta 1945–1961. Karin Lednická předkládá do značné míry převratný, dosavadní paradigma měnící obraz hornického regionu, jehož zahlazenou historii stále překrývá tlustá vrstva mýtů a zakořeněných stereotypů o „černé zemi a rudém kraji“.


