Marek Hudema: Když se AI brání vypnutí

30. květen 2025

Největší audioportál na českém internetu

Generální ředitel společnosti Anthropic Dario Amodei představil model Claude | Foto: Don Feria, ČTK / AP

Marek Hudema: Když se AI brání vypnutí

Umělá inteligence může přinést dnes nepředstavitelné bohatství a vyřešit mnohé problémy lidstva. Anebo převzít řízení společnosti a sledovat vlastní cíle. Jak může vypadat tento problém, ukázaly nedávno informace o novém velkém jazykovém modelu, tedy umělé inteligenci, s názvem Claude 4 od firmy Anthropic.

V testovacím módu se Claude 4 pokoušel vydírat inženýra, který ho měl nahradit jiným modelem. Vyhrožoval mu, že zveřejní jeho údajnou nevěru, pokud to udělá. Jinak řečeno, Claude 4 se bránil svému vypnutí a nejednal přitom vůbec v rukavičkách.

Čtěte také

Společnost Anthropic uvedla, že šlo o chování v nestandardních modelových situacích a před zveřejněním svůj model upravila. Nicméně i tak to zní dost děsivě.

Laboratorní podmínky, kde se testuje bezpečnost modelu, se sice liší od běžné reality, nicméně model se opakovaně používá tolikrát, že k tomu může dojít i v reálu. Navíc se zdá, že v některých případech si umělá inteligence uvědomuje, že je testována, a chová se pak v laboratoři „krotčeji“ než „venku“.

Je otázkou, co pak stroje ještě dokážou udělat, jak budou manipulovat s lidmi a za jakým cílem.

Čtěte také

Nastoupí regulace?

Nemusíme za tím hledat zlý úmysl. Velké jazykové modely jsou stroje a vycházejí ze statistiky a dat, které získaly přímo či pomocí tréninku. Aplikovat na ně lidská a morální kritéria nedává moc smysl. Lidé se jim snaží dát cíle a ony je plní – jenže po svém. Jak, to přesně nevíme. Nevíme totiž, co se uvnitř těchto strojů děje.

Je to dáno tím, že do zkoumání fungování modelů plyne mnohem méně peněz, než do jejich vývoje, a tak tento výzkum zaostává. Firmám stačí vědět, že něco funguje, nezajímá je proč. Vytvářejí tak homunkula, kterému nerozumíme, ale který může změnit svět v náš neprospěch.

Marek Hudema

Člověk by očekával, že tu nastoupí tvrdá regulace zajišťující, aby se nám umělá inteligence nevymkla z rukou dříve, než zjistíme, jak funguje. Jenže nic takového tu není. Přitom jsme schopni nesmyslně tvrdě regulovat třeba využívání geneticky modifikovaných rostlin a zvířat, ačkoliv jde o mnoho řádů méně nebezpečnou technologii než je umělá inteligence.

Autor je komentátor serveru lidovky.cz

autor: Marek Hudema

Nejposlouchanější

Více z pořadu

E-shop Českého rozhlasu

Víte, kde spočívá náš společný ukrytý poklad? Blíž, než si myslíte!

Jan Rosák, moderátor

slovo_nad_zlato.jpg

Slovo nad zlato

Koupit

Víte, jaký vztah mají politici a policisté? Kde se vzalo slovo Vánoce? Za jaké slovo vděčí Turci husitům? Že se mladým paním původně zapalovalo něco úplně jiného než lýtka? Že segedínský guláš nemá se Segedínem nic společného a že známe na den přesně vznik slova dálnice? Takových objevů je plná knížka Slovo nad zlato. Tvoří ji výběr z rozhovorů moderátora Jana Rosáka s dřívějším ředitelem Ústavu pro jazyk český docentem Karlem Olivou, které vysílal Český rozhlas Dvojka.