Marek Hudema: Když se AI brání vypnutí
Umělá inteligence může přinést dnes nepředstavitelné bohatství a vyřešit mnohé problémy lidstva. Anebo převzít řízení společnosti a sledovat vlastní cíle. Jak může vypadat tento problém, ukázaly nedávno informace o novém velkém jazykovém modelu, tedy umělé inteligenci, s názvem Claude 4 od firmy Anthropic.
V testovacím módu se Claude 4 pokoušel vydírat inženýra, který ho měl nahradit jiným modelem. Vyhrožoval mu, že zveřejní jeho údajnou nevěru, pokud to udělá. Jinak řečeno, Claude 4 se bránil svému vypnutí a nejednal přitom vůbec v rukavičkách.
Čtěte také
Společnost Anthropic uvedla, že šlo o chování v nestandardních modelových situacích a před zveřejněním svůj model upravila. Nicméně i tak to zní dost děsivě.
Laboratorní podmínky, kde se testuje bezpečnost modelu, se sice liší od běžné reality, nicméně model se opakovaně používá tolikrát, že k tomu může dojít i v reálu. Navíc se zdá, že v některých případech si umělá inteligence uvědomuje, že je testována, a chová se pak v laboratoři „krotčeji“ než „venku“.
Je otázkou, co pak stroje ještě dokážou udělat, jak budou manipulovat s lidmi a za jakým cílem.
Čtěte také
Nastoupí regulace?
Nemusíme za tím hledat zlý úmysl. Velké jazykové modely jsou stroje a vycházejí ze statistiky a dat, které získaly přímo či pomocí tréninku. Aplikovat na ně lidská a morální kritéria nedává moc smysl. Lidé se jim snaží dát cíle a ony je plní – jenže po svém. Jak, to přesně nevíme. Nevíme totiž, co se uvnitř těchto strojů děje.
Je to dáno tím, že do zkoumání fungování modelů plyne mnohem méně peněz, než do jejich vývoje, a tak tento výzkum zaostává. Firmám stačí vědět, že něco funguje, nezajímá je proč. Vytvářejí tak homunkula, kterému nerozumíme, ale který může změnit svět v náš neprospěch.
Člověk by očekával, že tu nastoupí tvrdá regulace zajišťující, aby se nám umělá inteligence nevymkla z rukou dříve, než zjistíme, jak funguje. Jenže nic takového tu není. Přitom jsme schopni nesmyslně tvrdě regulovat třeba využívání geneticky modifikovaných rostlin a zvířat, ačkoliv jde o mnoho řádů méně nebezpečnou technologii než je umělá inteligence.
Autor je komentátor serveru lidovky.cz
Nejposlouchanější
Více z pořadu
E-shop Českého rozhlasu
Vždycky jsem si přál ocitnout se v románu Julese Verna. Teď se mi to splnilo.
Václav Žmolík, moderátor


Tajuplný ostrov
Lincolnův ostrov nikdo nikdy na mapě nenašel, a přece ho znají lidé na celém světě. Už déle než sto třicet let na něm prožívají dobrodružství s pěticí trosečníků, kteří na něm našli útočiště, a hlavně nejedno tajemství.