Игорь Власов представил демонстрацию (http://www.opennet.me//base/rus/osr_tesseract_rus.txt.html) процесса обучения системы распознавания текстов Tesseract русскому языку.URL: http://www.opennet.me//base/rus/osr_tesseract_rus.txt.html
Новость: http://www.opennet.me/opennews/art.shtml?num=11897
Хорошее дело затеяли :)
еще лет 5 пройдет, может будет нормальный OCR с русским.
а еще пройдет лет 10...и 1Ц и консультанты и гаранты всякие под linux появятся
А вы куда то спешите? Может тогда поможете, тогда года за 3 всё получится доделать :)
Если менты трясти будут конторы, то уже через года полтора появится все - сначала через вайн запустят(сейчас УЖЕ все перечисленное работает), а за нативными не заржавеет. Тем более объем работ небольшой - БД остается только мордашку останется переписать.
У нас уже на фоне борьбы с пиратством две конторы (машин по 150) уже переводятся и это только за последнюю неделю(менты особенно распоясались). А раз процент использования существенно вырос то и производителям ПО очень интересен - тем более корп сектор всегда лакомый кусок.
Стоит только приказным порядком перевести на Линух ГНИ и Пенсионный, как сразу всё начнёт появляться.
ЗЫ А Рейнман, всё же, решился уже госконторы на OpenOffice переводить.
оффтоп: если не трудно, дайте ссылочку, где Рейман на ОДФ всех устремил.
http://www.nixp.ru/news/8592
http://www.nixp.ru/news/8597
ГНИ и Пенсионный переход на Линукс "ниаслят". Достаточно посмотреть какое чудо (программами это назвать не возможно) под Винды на Foxpro...А как они будут писать под линукса, я себе даже представить не могу...
О! спасиб за перевод :) бум пробовать
В процессе обсуждения на форуме и тут, возникла идея создать на Google Group группу, по обмену опытом в обучении Tesseract русскому языку:
http://groups.google.com/group/tesseract-ocr-russian?hl=ru