В статье "Linux OCR: A review of free optical character recognition software (http://groundstate.ca/ocr)" представлены результаты тестирования доступных для Linux систем распознавания текста: gocr (http://jocr.sourceforge.net/), Clara (http://www.geocities.com/claraocr/), Ocre (http://lem.eui.upm.es/ocre.html), Ocrad (http://www.gnu.org/software/ocrad/ocrad.html), Tesseract (http://code.google.com/p/tesseract-ocr/), Ocropus (http://code.google.com/p/ocropus/) и Aspire OCR (http://asprise.com/product/ocr/index.php?lang=java).
В качестве теста, используется шаблон напечатанный различными типами и размерами шрифта. Лучше всех оказались недавно открытые компанией Google продукты Tesseract (http://code.google.com/p/tesseract-ocr/) и Ocropus (http://code.google.com/p/ocropus/), продемонстрировавшие точность распознавания 99%(коммерческий Aspire OCR распознал 91.5% текста, открытый Ocrad - 97%, gocr - 94%).URL: http://groundstate.ca/ocr
Новость: http://www.opennet.me/opennews/art.shtml?num=10894
В каком из них работает русский?
даже не смешно
никаком :(
Вроде как поддержку обещали в gocr и Clara OCR. Но похоже там на самом деле никак...
Ждем, когда Ocropus доделают... или движок от Fine Reader за отдельную плату к Kooka прикрутят.--
Jay
А рецепты от врачей распознают?
Врачи сами никогда не читают, то что пишут. Больной итак им все перескажет. Они же не ветеренары.