Marek Hudema: Když se AI brání vypnutí

30. květen 2025

Názory a argumenty

Největší audioportál na českém internetu

Generální ředitel společnosti Anthropic Dario Amodei představil model Claude | Foto: Don Feria, ČTK / AP

2:39

Umělá inteligence může přinést dnes nepředstavitelné bohatství a vyřešit mnohé problémy lidstva. Anebo převzít řízení společnosti a sledovat vlastní cíle. Jak může vypadat tento problém, ukázaly nedávno informace o novém velkém jazykovém modelu, tedy umělé inteligenci, s názvem Claude 4 od firmy Anthropic.

V testovacím módu se Claude 4 pokoušel vydírat inženýra, který ho měl nahradit jiným modelem. Vyhrožoval mu, že zveřejní jeho údajnou nevěru, pokud to udělá. Jinak řečeno, Claude 4 se bránil svému vypnutí a nejednal přitom vůbec v rukavičkách.

Čtěte také

Nejvíc pokročilé AI systémy vyvíjí firmy potají. Musíme chránit whistleblowery, věří vědec Kulveit

Společnost Anthropic uvedla, že šlo o chování v nestandardních modelových situacích a před zveřejněním svůj model upravila. Nicméně i tak to zní dost děsivě.

Laboratorní podmínky, kde se testuje bezpečnost modelu, se sice liší od běžné reality, nicméně model se opakovaně používá tolikrát, že k tomu může dojít i v reálu. Navíc se zdá, že v některých případech si umělá inteligence uvědomuje, že je testována, a chová se pak v laboratoři „krotčeji“ než „venku“.

Je otázkou, co pak stroje ještě dokážou udělat, jak budou manipulovat s lidmi a za jakým cílem.

Čtěte také

Vyhubí AI lidstvo? Není to jen strašení, bojí se Romportl. Microsoft: Lidé AI řídí, nejsou pasivní

Nastoupí regulace?

Nemusíme za tím hledat zlý úmysl. Velké jazykové modely jsou stroje a vycházejí ze statistiky a dat, které získaly přímo či pomocí tréninku. Aplikovat na ně lidská a morální kritéria nedává moc smysl. Lidé se jim snaží dát cíle a ony je plní – jenže po svém. Jak, to přesně nevíme. Nevíme totiž, co se uvnitř těchto strojů děje.

Je to dáno tím, že do zkoumání fungování modelů plyne mnohem méně peněz, než do jejich vývoje, a tak tento výzkum zaostává. Firmám stačí vědět, že něco funguje, nezajímá je proč. Vytvářejí tak homunkula, kterému nerozumíme, ale který může změnit svět v náš neprospěch.

Marek Hudema|foto:Kamila Schusterová, Český rozhlas

Člověk by očekával, že tu nastoupí tvrdá regulace zajišťující, aby se nám umělá inteligence nevymkla z rukou dříve, než zjistíme, jak funguje. Jenže nic takového tu není. Přitom jsme schopni nesmyslně tvrdě regulovat třeba využívání geneticky modifikovaných rostlin a zvířat, ačkoliv jde o mnoho řádů méně nebezpečnou technologii než je umělá inteligence.

Autor je komentátor serveru lidovky.cz

autor: Marek Hudema

Všechny díly pořadu na mujRozhlas

Jak nás naladíte na DABu

E-shop Českého rozhlasu

Vždycky jsem si přál ocitnout se v románu Julese Verna. Teď se mi to splnilo.

Václav Žmolík, moderátor

Tajuplný ostrov

Koupit

Lincolnův ostrov nikdo nikdy na mapě nenašel, a přece ho znají lidé na celém světě. Už déle než sto třicet let na něm prožívají dobrodružství s pěticí trosečníků, kteří na něm našli útočiště, a hlavně nejedno tajemství.

Čtěte také

Nejvíc pokročilé AI systémy vyvíjí firmy potají. Musíme chránit whistleblowery, věří vědec Kulveit

Čtěte také

Vyhubí AI lidstvo? Není to jen strašení, bojí se Romportl. Microsoft: Lidé AI řídí, nejsou pasivní

Nastoupí regulace?

Nejposlouchanější

Nina Špitálníková: Svědectví o životě v KLDR 2. Severokorejci vypráví o životě a ideologii

Nenasytný Vítězslav Nezval a jeho syn Robert, který prozřel a vzal si život. Pochopte jejich příběh

David Klimeš: Bitcoinová kauza začíná dávat smysl

Jiřikovský chtěl od státu potvrzení, že jsou bitcoiny v pořádku. Teď se musí bát o život, míní Týc

Antisystém už sedí na Slovensku ve vládě, říká Breiner. Kovačič Hanzelová: Nedůvěra se Ficovi vymstí

Více z pořadu

Petr Honzejk: Poodhalený program ANO je noční můrou národohospodáře

Jan Fingerland: Je teplo a Sýrie se svléká do plavek. Ale jakých?

Martin Fendrych: Starostové a nezávislí jsou naštvaní. Bitcoinová kauza nahrála Babišovi

Týden očima Petra Schwarze: Touhy po předvčerejšku a pošetilost mocných

E-shop Českého rozhlasu

Vždycky jsem si přál ocitnout se v románu Julese Verna. Teď se mi to splnilo.

Tajuplný ostrov

Krakatit

Klukoviny Uršuly Klukové

Severka