В блоге компании Google с опозданием на два месяца анонсировано (http://google-code-updates.blogspot.com/2006/08/announcing-t...) открытие исходных текстов системы распознавания текста Tesseract (http://sourceforge.net/projects/tesseract-ocr).Система была создана в лаборатории компании Hewlett Packard с 1985 по 1995 годы. В 2005 году код был открыт под лицензией Apache и в дальнейшем доведен до версии 1.0 при участии работников компании Google.
В Tesseract OCR имеется только поддержка английского языка, пока нет средств выделения областей текста (например когда текст размещен в несколько колонок).URL: http://google-code-updates.blogspot.com/2006/08/announcing-t...
Новость: http://www.opennet.me/opennews/art.shtml?num=8274
Ждем русской ветки.
"Система была создана в лаборатории компании Hewlett Packard с 1985 по 1995 годы"
Редактора здесь не ночевало...
А кто нибудь уже пробовал - как оно по качеству распознавания в сравнении с?...
Тот виндошный софт, что даёт HP со сканерами, - говнище. Хотя распознавание кириллицы там есть. Есть, работает, но результаты идут прямиком в помойку.
>Тот виндошный софт, что даёт HP со сканерами, - говнище. Хотя распознавание
>кириллицы там есть. Есть, работает, но результаты идут прямиком в помойку.
>
Что вы такое говорите софт HP на сканерах работает очень хорошо.
>>Тот виндошный софт, что даёт HP со сканерами, - говнище. Хотя распознавание
>>кириллицы там есть. Есть, работает, но результаты идут прямиком в помойку.
>>
>Что вы такое говорите софт HP на сканерах работает очень хорошо.
Ну, мне пришлось качать 200 метров дров для HP.
ох уж эти двести метров. подскажите действительно ли маразм заразителен. Тыкните меня пожалуйста на драйвера сканера hp scanjet 2400 меньше двухсот метров ? Это что нельзя было просто драйвера выдожить, обязтельно нужно качать это с их поделкой ? или я как то не правильно искал ? на сайте я не обнаружил..
а почему сорцефорж?
у гугла вроде теперь свой крутой архив.
гугол коде.
Интересно будет посмотреть какая реализация скрывается заплатным софтом :devil: