URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 38285
[ Назад ]

Исходное сообщение
"OpenNews: В Tesseract OCR 2.0 появился модуль для обучения новым языкам"
Отправлено opennews , 30-Авг-07 23:10

В состав новой версии программы распознавания текста Tesseract 2.0 (http://code.google.com/p/tesseract-ocr/wiki/ReleaseNotes), открытой компанией Google около года назад, включены средства для обучения системы работе с новыми языками (http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract). Таким образом, время появления OCR с поддержкой русского языка теперь зависит только от того, как скоро найдутся энтузиасты готовые потратить свое время на обучение системы.

В настоящее время обучение системы уже проведено для французского, итальянского, немецкого, испанского и голландского языков.

В заключение, можно отметить выход статьи "Optical Character Recognition With Tesseract OCR On Ubuntu 7.04 (http://www.howtoforge.com/ocr_with_tesseract_on_ubuntu704)" с описанием процесса настройки Tesseract 2.0 в Ubuntu Linux, для начинающих.
URL: http://rulinux.net.ru/node/66
Новость: http://www.opennet.me/opennews/art.shtml?num=11847

Содержание

В Tesseract OCR 2.0 появился модуль для обучения новым языкам,НеДемократ, 23:10 , 30-Авг-07
В Tesseract OCR 2.0 появился модуль для обучения новым языкам,Аноним, 01:50 , 31-Авг-07
В Tesseract OCR 2.0 появился модуль для обучения новым языкам,_Nick_, 04:05 , 31-Авг-07
В Tesseract OCR 2.0 появился модуль для обучения новым языкам,www.andr.ru, 09:14 , 31-Авг-07
В Tesseract OCR 2.0 появился модуль для обучения новым языкам,Олег, 10:59 , 31-Авг-07

Сообщения в этом обсуждении

"В Tesseract OCR 2.0 появился модуль для обучения новым языкам"
Отправлено НеДемократ , 30-Авг-07 23:10

так это же просто прекрасно!

"В Tesseract OCR 2.0 появился модуль для обучения новым языкам"
Отправлено Аноним , 31-Авг-07 01:50

Ура! Ура! Ура!
Качаю и начинаю экспериментировать.

"В Tesseract OCR 2.0 появился модуль для обучения новым языкам"
Отправлено _Nick_ , 31-Авг-07 04:05

обнадеживающе...

"В Tesseract OCR 2.0 появился модуль для обучения новым языкам"
Отправлено www.andr.ru , 31-Авг-07 09:14

классная фигня

"В Tesseract OCR 2.0 появился модуль для обучения новым языкам"
Отправлено Олег , 31-Авг-07 10:59

Знаете поговорку "Имею ввозможность, но не имею желения и наоборот...".
Так вот я работаю в конторе которая все входящие и исходящие документы (факсы, наряды, письма, машинописные и ручные заявления), даже внутренние приказы по организации делает скан копию. Сейчас посмотрел на сервере их там на около 10000 файлов на более чем Гб :)
Но...