Digitalizace tištěných informací

Archiv | 01.03.06

ABBYY FineReader OCR 8.0 Professional Edition - inteligentní a snadno použitelný software OCR software obecně slo...







ABBYY FineReader OCR 8.0 Professional Edition - inteligentní a snadno použitelný software



OCR software obecně slouží k rozpoznávání znaků v souborech s netextovým obsahem typicky pak v obrázcích. Produkt ruského výrobce ABBYY patří v oboru mezi špičková řešení, jak z hlediska kvality rozpoznávání, tak i rychlosti, s jakou je obrázek přečten. Nejnovější verze tohoto softwaru pak nabízí údajně až o 30 % přesnější "čtení" textu a podstatné zvýšení rychlosti rozpoznávání. Rovněž množství formátů, v nichž lze rozpoznané texty ukládat, se rozrostlo. Za poměrně klíčovou vlastnost lze považovat schopnost převést text z formátu PDF do prostého textu nebo např. wordového dokumentu, bez nutnosti kupovat originální software firmy Adobe. Dokumenty lze samozřejmě v tomto populárním formátu rovněž ukládat. FineReader si poradí s texty ve 179 jazycích, dokonce zvládne akceptovat i několik různých jazyků v jednom dokumentu. Propagována je i uživatelská přívětivost a snadnost obsluhy. Tolik tedy k obsahu Fact Sheetu, otázkou ale zůstává, zda realita není trochu odlišná.
Krátce a jasně řečeno, není. Začneme-li zezadu, pak uživatelské rozhraní je více než přehledné, neskrývá žádné záludnosti a prakticky okamžitě po instalaci lze (i bez čtení manuálu) začít s programem pracovat. Uživateli nenabízí více, než potřebuje. Jedním velkým tlačítkem je načtena předloha, druhým je v předloze rozpoznán text. Třetí tlačítko pak spustí kontrolu pravopisu, pro níž lze použít i tzv. uživatelský slovník aplikace MS Word. Poslední tlačítko pak skrývá dialog, umožňující rozpoznaný text uložit.
Není sice pravda, že bych testoval schopnosti FineReaderu ve všech 179 deklarovaných jazycích, jako běžný uživatel jsem si vystačil s češtinou, angličtinou a ruštinou. Jakožto s reprezentativním vzorkem jazyků si s uvedeným lingvistickým koktejlem FineReader poradil. Nezaskočilo ho ani snížení rozlišení při skenování předloh hluboko pod doporučovanou hodnotu 300 dpi. Program si sice trochu stěžoval, ale text rozpoznal s minimem chyb i při rozlišení 96 dpi. Při rozlišení nad 150 dpi již prakticky nechybuje, pokud předloha vypadá alespoň trochu rozumně. FineReader si poradí i s barevnými texty, rozpozná různá formátování původního textu i jeho rozložení na stránce.
Za velmi užitečnou považuji schopnost rozpoznávat text v PDF dokumentech. Každý, kdo pracuje alespoň v minimální míře s dokumenty z různých zdrojů, se jistě setkal s potřebou přenést část textu PDF dokumentu jinam. Fine Reader tuto situaci elegantně řeší. Vzhledem k jeho schopnosti zpracovávat více než jednu stránku v tzv. dávkách stačí otevřít předmětný PDF dokument a nechat ho FineReaderem převést do textové podoby. Tvrzení o 30 % a rychlosti čtení se těžko ověřuje, pro každý dokument se jedná o značně proměnlivé parametry.
Na první pohled se tedy jedná o naprosto úžasný software, se kterým se uživatelům otevírají netušené obzory. Nicméně FineReader si neporadí s texty otočenými, a to vůbec. Lékem na tento neduh je schopnost jednoduchých grafických manipulací v náhledovém okně uživatelského rozhraní. Pokud chcete jako špióni získávat tajné informace o konkurenci fotografováním do mobilního telefonu a následně je předložit FineReaderu k přečtení, pravděpodobně neuspějete. Minimální akceptovatelná hranice pro fotografické předlohy je rozlišení snímače 2 Mpix, optimální pak 5 Mpix. Tyto předlohy vyžadují delikátní způsob snímání, na hony vzdálený nenápadné noční akci v neosvětlené kanceláři.
Lidské oko a mozek jsou zatím v oblasti rozpoznávání objektů nepřekonatelnými nástroji. Pokud někdy stroje doženou člověka, pak bych se nedivil, kdyby elektronické oko bylo opatřeno nápisem "Powered by Fine Reader".
O

ABBYY FineReader OCR 8.0 Professional Edition

převod PDF dokumentů do textové podoby
rozpoznávací schopnost
K recenzi poskytla firma:
NUPSESO Data Service, s. r. o.
www.nupseso.cz
Cena: 4 400 Kč bez DPH













Komentáře

K tomuto článku není připojena žádná diskuze, nebo byla zakázána.