Obnova starověkých dokumentů a rukopisů zrychlí

20. červenec 2009

Společný projekt dvou španělských univerzit se snaží přispět k ochraně kulturního dědictví urychlením obnovy starých dokumentů a rukopisů. V jeho rámci školy vyvinuly nový systém přepisu.

Výsledky běžné metody optického rozpoznávání znaků, známé také pod zkratkou OCR, většinou obsahují velké množství chyb. Ty se musejí dodatečně opravovat. Nový systém, který dostal jméno State, v sobě integruje řadu nástrojů pro lepší zpracování obrazových dat. State umí originální obraz vyčistit a odstranit z něj šum. Dokáže rozpoznat strukturu stránky a následně i samotný text. Opravy případných chyb je pak možné provést například elektronickou tužkou přímo v textu. Právě poslední fáze - dodatečné opravování - zabírá nejvíce času. Kromě redukce chyb už v průběhu zpracování je proto cílem systému také maximálně usnadnit editaci výsledků.

Inovaci představuje především architektura systému. Rozpoznávání textu běží na jiném stroji než jeho editace. Tu může provádět přes internet i několik uživatelů najednou. Systém se navíc umí z uživatelských oprav učit a přizpůsobovat se vlastnostem konkrétního dokumentu. Podle autorů systému State se dá jeho použitím ušetřit až 50 % času. Vzhledem k tomu, že digitalizace rozsáhlejších materiálů trvá hodiny, jde o výraznou úsporu.

autor: redakce ČRo Leonardo
Spustit audio

Nejposlouchanější

Více z pořadu

E-shop Českého rozhlasu

Vždycky jsem si přál ocitnout se v románu Julese Verna. Teď se mi to splnilo.

Václav Žmolík, moderátor

tajuplny_ostrov.jpg

Tajuplný ostrov

Koupit

Lincolnův ostrov nikdo nikdy na mapě nenašel, a přece ho znají lidé na celém světě. Už déle než sto třicet let na něm prožívají dobrodružství s pěticí trosečníků, kteří na něm našli útočiště, a hlavně nejedno tajemství.