В статье "Linux OCR: A review of free optical character recognition software" представлены результаты тестирования доступных для Linux систем распознавания текста: gocr, Clara, Ocre, Ocrad, Tesseract, Ocropus и Aspire OCR.
В качестве теста, используется шаблон напечатанный различными типами и размерами шрифта. Лучше всех оказались недавно открытые компанией Google продукты Tesseract и Ocropus, продемонстрировавшие точность распознавания 99%(коммерческий Aspire OCR распознал 91.5% текста, открытый Ocrad - 97%, gocr - 94%).
|