Proč je 300 dpi pro OCR standard?
Skenování v rozlišení 300 dpi (bodů na palec) není oficiálně standard pro OCR (optické rozpoznávání znaků), ale je považován za zlatý standard.
- 11. 3. 2015
- 1 min
Skenování při nižším dpi, například 200 dpi, a následné použití softwaru pro zvýšení rozlišení pomocí interpolace (proces počítačového dopočítání a doplnění pixelů za cílem zvětšení) není zcela vhodné, protože neposkytuje optické zlepšení rozpoznávání znaků. Obvykle se jen obrázek zvětší a to díky přidání extra pixelů navíc. Tento způsob zpracování je ale už pouze odhad, váš obrázek tak vždy ztratí na čistotě a kvalitě. Lepší je začít skenováním dokumentu při rozlišení 300 dpi.
Většina OCR a softwarových společností vám doporučuje skenování při minimálním rozlišením 300 bodů na palec a mají to jako výchozí nastavení. Jinými slovy, za každý čtvereční centimetr papíru skener zachycuje 300 bodů horizontálně a 300 bodů svisle, tj. 90000 bodů celkem. Používáte-li 200 dpi nastavení namísto 300 dpi, uvidíte pouze 40000 bodů na čtvereční palec a to je velký rozdíl.
Proto tedy vyšší rozlišení skenování zajištuje lepší přesnost OCR.
Přiložený obrázek představuje příklad, kde písmeno neobsahuje dostatek bodů na palec a může tak pro software působit jako číslo 8.