URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 42550
[ Назад ]

Исходное сообщение
"OpenNews: Оценка качества распознавания текстов на немецком языке в открытых OCR"

Отправлено opennews , 25-Июн-08 17:58 
"How to scan and OCR like a pro with open source tools (http://www.linux.com/feature/138511)" - оценка качества распознавания текстов на немецком языке в открытых OCR - GOCR (http://jocr.sourceforge.net/), Ocrad (http://www.gnu.org/software/ocrad/ocrad.html)  и Tesseract-OCR (http://code.google.com/p/tesseract-ocr/). Система Tesseract-OCR лидирует с большим перевесом.

URL: http://www.linux.com/feature/138511
Новость: http://www.opennet.me/opennews/art.shtml?num=16651


Содержание

Сообщения в этом обсуждении
"Оценка качества распознавания текстов на немецком языке в открытых OCR"
Отправлено Аноним , 25-Июн-08 17:58 
И какой интерес в этой новости русскоязычному сообществу? =)

"Оценка качества распознавания текстов на немецком языке в от..."
Отправлено Vertigo , 26-Июн-08 12:00 
>И какой интерес в этой новости русскоязычному сообществу? =)

А почему бы и не быть интересу? Немецкий - он, как и русский, с символами, которых нет в Великом Могучем "Интернациональном". Так что узнать как открытые OCR ведут себя с таким языком - совсем нелишне, на мой взгляд.
И кстати, люди, а не подскажете ли, - если есть результаты тренировки tesseract'а в части русского языка, куда их слать, чтобы, значить, пользу проекту принести? )


"Оценка качества распознавания текстов на немецком языке в открытых OCR"
Отправлено vehn , 25-Июн-08 18:34 
Видимо, дабы привлечь народ к пополнению баз (как их там называют, не помню) сигнатур русских литер. Правдо, наш юзер, видимо, настолько привык к файнридеру, что не считает, возможным получить свободный продукт подобного качества в ближайшее время.