Zlatá horečka digitálních dat: Lidé si přivydělávají prodejem svých dat pro trénování generativní AI. Jaká jsou rizika?
Britský deník Guardian se zabývá problematikou prodeje identity pro trénování umělé inteligence. Za nahrávání videí a fotografií platí uživatelům například aplikace Kled AI a zvuková data odkupuje Silencio. Společnost Neon Mobile dokonce platí uživatelům za odposlech soukromých telefonních rozhovorů – půl dolaru za minutu nahrávky.
Od Kapského Města po Chicago tak dnes tisíce lidí mikrolicencují svá biometrická a intimní data, aby trénovali další generaci umělé inteligence.
Čtěte také
Tito přivydělávající si trenéři AI stojí v první linii nové globální zlaté horečky digitálních dat. Prodejci takových dat ale riskují zneužití pro deepfake obsah nebo krádež identity, upozorňují odborníci.
Zmíněná zlatá horečka se rozhořela kvůli nedostatku trénovacích dat, se kterým se jazykové modely potýkají. Jedny z nejkvalitnějších datasetů tradičně poskytují společnosti C4, RefinedWeb nebo Dolma. Ty ale omezují používání svých dat firmami pracujícími s generativní umělou inteligencí.
Nová kategorie práce
Laboratoře by sice mohly znovu přistoupit k využívání syntetických dat, které si umělá inteligence vygeneruje sama – takový rekurzivní proces ale může vést k zahlcení obsahu chybami. Právě v této situaci rostoucího nedostatku dat pro trénink přichází na scénu zmíněné aplikace jako Kled AI nebo Silencio, ale i mnohé další, které vytváří datová tržiště.
Čtěte také
Trénování umělé inteligence je nově vznikající kategorií práce a bude výrazně růst, myslí si profesor ekonomie z King’s College London Bouke Klein Teeselink. Společnosti si totiž podle něj dobře uvědomují, že placením za licencování dat se vyhnou případnému riziku sporů o autorská práva.
Tato nová kategorie práce je příležitostí zejména pro lidi ze zemí s vysokou nezaměstnaností a znehodnocenou měnou. Funguje ale i jako přivýdělek v bohatších státech s rostoucími životními náklady.
Skrytá rizika
Guardian však upozorňuje na skrytá rizika „prodeje sebe sama“. Jedním z nich může být poskytnutí neodvolatelné neomezené licence, která firmám umožní vytvářet z hlasu „trenéra AI“ odvozená díla.
Čtěte také
Z několikaminutové nahrávky tak může vzniknout například chatbot, který bude roky pohánět umělá inteligence, aniž by poskytovatel vstupní nahrávky dostal jakoukoliv další odměnu. Tvář prodejce biometrických dat se pak může objevit v databázi pro rozpoznávání obličejů nebo dát vzniknout predátorské reklamě na druhém konci světa.
Je navíc potřeba upozornit, že úloha trenéra AI neposkytuje možnost pohádkových přivýdělků. Například Ramelio Hill z Chicaga, se kterým autor článku mluvil, prodal asi 11 hodin soukromých telefonických hovorů za pouhých 200 dolarů, což je v přepočtu něco přes 4 200 korun.
Nejasnosti kolem využití
Podle výzkumnice v oblasti ochrany osobních dat ze Standfordského institutu Jennifer Kingové jsou znepokojivé také nejasnosti ohledně možného dalšího využití dat uživatelů.
Čtěte také
Bez znalosti vlastních práv spotřebitelé riskují, že jejich data budou použita způsobem, který nemusí vůbec očekávat, a to s velmi omezenými možnostmi obrany. Sdílením svých dat totiž trenéři AI udělují platformám neomezenou licenci, která umožňuje další prodej, veřejné využití nebo vytváření odvozených děl.
Guardian výše jmenované platformy oslovil. Zatímco Kled AI reagovala ujištěním, že její datové dohody omezují použití pouze na účely trénování umělé inteligence a výzkum, společnosti Neon Mobile nebo Caption na dotazy novinářů neodpověděly.
Poslechněte si celý Svět ve 20 minutách. Jak Rusové pomáhají maďarskému premiérovi Orbánovi s volební kampaní? Trump si myslí, že Kuba je druhá Venezuela. Proč se mýlí? Strana dánské premiérky sice vyhrála volby, čekají ji ale náročná vyjednávání o nové vládě. Objevilo se video, jak primátor slovenského města Kežmarok počítá v garáži 45 tisíc eur. Šlo o půjčku, tvrdí politik. Taková jsou další témata pořadu, který připravila Zuzana Marková.
Nejposlouchanější
Více z pořadu
E-shop Českého rozhlasu
Přijměte pozvání na úsměvný doušek moudré člověčiny.
František Novotný, moderátor

Setkání s Karlem Čapkem
Literární fikce, pokus přiblížit literární nadsázkou spisovatele, filozofa, ale hlavně člověka Karla Čapka trochu jinou formou.



