Vzniknou celoplanetární databáze všech lidských znalostí o světě

10. září 2014

Významnou gigantickou databázi znalostí připravuje firma Google. Vznikají také projekty obsáhlých online zdrojů informací a dovedností, ze kterých budou moci čerpat roboti.

Cílem firmy Google je dostat do jednoho obrovského znalostního systému souhrn všech lidských vědomostí a fakt o světě či historii. Pak by mohli lidé z celého světa z tohoto systému efektivně čerpat informace. Odborníci také pracují na tom, aby mohly softwarové roboty zmíněný souhrn znalostí automaticky doplňovat ze všech dostupných zdrojů. Chystaná univerzální databáze firmy Google dostala název Trezor znalostí (Knowledge Vault).

Základní otázkou je, jak původní útržkovitá data zabudovat do nějakého účelného uspořádání, které bude zahrnovat rozmanité souvislosti mezi fakty a také jejich významy v různém kontextu. Tato struktura by měla být čitelná nejen pro lidské uživatele, ale také přístupná pro další strojové zpracování, například pro hluboké společenské, statistické nebo historické analýzy. V případě, že bude znalostní databáze pracovat jak má, nebudeme se už muset za informacemi pracně pídit po různých stránkách webu. Patřičnou vyhledávací syntézu či kontextovou analýzu za nás udělá databáze. Odpovědi nám pak poskytnou automatické softwarové nástroje, někdy zvané softwarové agenty nebo osobní informační asistenti. Jednoduchým softwarovým agentem tohoto typu je třeba aplikace Siri, kterou známe z prostředí chytrých telefonů.

Místo hledání na webu se svého softwarového agenta prostě na cokoliv zeptáme v přirozeném jazyce, běžnými větami, a on nám zjistí odpovědi a souvislosti, uložené v databázi. Lze si také snadno představit aplikaci podobné znalostní superdatabáze na naše nejbližší geografické okolí. Půjde tak vlastně o typ rozšířené reality, kdy k určitým objektům dostaneme rozšiřující data. Budeme pak znát spoustu informací o objektech, firmách či lidech v našem okolí. Rovněž bude možné předpovídat budoucí trendy vývoje v řadě tematických oblastí a také některé budoucí události.

Americký univerzitní projekt RoboBrain

Obří databáze Knowledge Vault staví na současné mnohem menší databázi Googlu, která se jmenuje Knowledge Graph. Tu dnes různými útržky informací zásobují lidé, přičemž databáze dosud obsahuje asi 1 miliardu a 600 milionů zkatalogizovaných fakt. Zhruba 300 milionů z nich je považováno díky křížovému odkazování za prakticky ověřené a tedy za důvěryhodné. Knowledge Graph umožňuje již dnes zadávat do vyhledávacího políčka Googlu jednoduché dotazy a relace. Google ovšem nedisponuje pouze veřejnými daty. Proto může, přinejmenším teoreticky, hledat korelace a vzájemná propojení také mezi daty soukromými.

Google není sám, kdo chce vyvinout podobnou databázi. Obrovské znalostní báze či nástroje na získávání kontextově uspořádaných informací vyvíjejí i další softwaroví giganti, Facebook, Amazon, Microsoft, IBM nebo čínská vyhledávací firma Baidu.

Podobné centrální znalostní databáze se však nyní vyvíjejí také speciálně “na míru” pro různé robotické nástroje. Za všechny jmenujme evropský projekt RoboEarth nebo čerstvý americký univerzitní projekt RoboBrain, jehož úkolem je podobně jako u výše popsané univerzální databáze Googlu soustředit veškerý objem znalostí, důležitých pro učení robotů. Půjde zejména o různé manuály, popisy objektů, postupy, algoritmy, videa, obrázky, diagramy nebo dokumenty, umístěné na Internetu.

Zdroje: Phys.Org, TechCrunch, Wired, Popular Science, Discovery News, New Scientist, 33rd square, CONtejner, Robo Brain

autor: Pavel Vachtl
Spustit audio

Více z pořadu

E-shop Českého rozhlasu

Víte, kde spočívá náš společný ukrytý poklad? Blíž, než si myslíte!

Jan Rosák, moderátor

slovo_nad_zlato.jpg

Slovo nad zlato

Koupit

Víte, jaký vztah mají politici a policisté? Kde se vzalo slovo Vánoce? Za jaké slovo vděčí Turci husitům? Že se mladým paním původně zapalovalo něco úplně jiného než lýtka? Že segedínský guláš nemá se Segedínem nic společného a že známe na den přesně vznik slova dálnice? Takových objevů je plná knížka Slovo nad zlato. Tvoří ji výběr z rozhovorů moderátora Jana Rosáka s dřívějším ředitelem Ústavu pro jazyk český docentem Karlem Olivou, které vysílal Český rozhlas Dvojka.