Obnova starověkých dokumentů a rukopisů zrychlí

20. červenec 2009

Společný projekt dvou španělských univerzit se snaží přispět k ochraně kulturního dědictví urychlením obnovy starých dokumentů a rukopisů. V jeho rámci školy vyvinuly nový systém přepisu.

Výsledky běžné metody optického rozpoznávání znaků, známé také pod zkratkou OCR, většinou obsahují velké množství chyb. Ty se musejí dodatečně opravovat. Nový systém, který dostal jméno State, v sobě integruje řadu nástrojů pro lepší zpracování obrazových dat. State umí originální obraz vyčistit a odstranit z něj šum. Dokáže rozpoznat strukturu stránky a následně i samotný text. Opravy případných chyb je pak možné provést například elektronickou tužkou přímo v textu. Právě poslední fáze - dodatečné opravování - zabírá nejvíce času. Kromě redukce chyb už v průběhu zpracování je proto cílem systému také maximálně usnadnit editaci výsledků.

Inovaci představuje především architektura systému. Rozpoznávání textu běží na jiném stroji než jeho editace. Tu může provádět přes internet i několik uživatelů najednou. Systém se navíc umí z uživatelských oprav učit a přizpůsobovat se vlastnostem konkrétního dokumentu. Podle autorů systému State se dá jeho použitím ušetřit až 50 % času. Vzhledem k tomu, že digitalizace rozsáhlejších materiálů trvá hodiny, jde o výraznou úsporu.

autor: redakce ČRo Leonardo
Spustit audio

Více z pořadu

E-shop Českého rozhlasu

Starosvětské příběhy lesníků z časů, kdy se na Šumavě ještě žilo podle staletých tradic.

Václav Žmolík, moderátor

ze_světa_lesních_samot.jpg

3x Karel Klostermann

Koupit

Komplet obsahuje dva šumavské romány Ze světa lesních samot, V ráji šumavském a povídkový soubor Mrtví se nevracejí z pera klasika české literatury Karla Klostermanna (1848 - 1923), který tomuto kraji zasvětil celé své dílo.