URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 95044
[ Назад ]

Исходное сообщение
"Выпуск системы распознавания текста GNU Ocrad 0.23"

Отправлено opennews , 24-Мрт-14 22:31 
Представлен (http://permalink.gmane.org/gmane.org.fsf.announce/2123) релиз системы распознавания текста Ocrad (http://www.gnu.org/software/ocrad/ocrad.html) (Optical Character Recognition) 0.23, развиваемой под эгидой проекта GNU. Из изменений в новой версии отмечено улучшение распознавание символов (например, более корректное разделение схожих начертаний L и Z) и реализация удаления лидирующих пробелов в фильтрах "только буквы" и "только цифры".


Для оптического распознавания в Ocrad используется метод выделение признаков (feature extraction (http://en.wikipedia.org/wiki/Feature_extraction)). &nbs... может применяться как в форме библиотеки для интеграции функций OCR в другие приложения, так и в форме обособленной утилиты, которая на основе переданного на вход изображения выдаёт текст в UTF-8 или 8-битных кодировках. Распознавание поддерживается только для  кодировок "ascii", "iso-8859-9" и "iso-8859-15". Поддержка кириллицы отсутствует. В состав входит анализатор макета страницы, позволяющий корректно разделять столбцы и блоки текста в печатных документах.


URL: http://permalink.gmane.org/gmane.org.fsf.announce/2123
Новость: http://www.opennet.me/opennews/art.shtml?num=39392


Содержание

Сообщения в этом обсуждении
"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено qwewewewewep , 24-Мрт-14 22:31 
интересно как оно по сравнению с ocropus, tesseract ?

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Аноним , 24-Мрт-14 23:11 
FineRider от всей этой опенсорсной лабуды так недосягаем, что даже не приходится радоваться подобным новостям.

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено A.Stahl , 25-Мрт-14 00:11 
>FineRider

Неужели Офигенный Всадник лучше расшифровывает свитки, чем Джо Мокрый Нос Длинная Сопля?
>что даже не приходится радоваться подобным новостям.

Какая разница что может какая-то другая программа?
То, что fineReader лучше, не делает Ocrad хуже.
То, что в openSource сообществе нет специалистов по распознаванию никак не дискредитирует систему.
Вышла новая версия. Улучшенная версия. Чем не повод порадоваться?
Нельзя проскочить промежуточные этапы. Нельзя от палки-копалки перейти к транзисторам.
Придётся сначала и с зубчатыми колёсами и с катушками и с лампами повозиться.
Так устроен мир.


"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Аноним , 25-Мрт-14 00:24 
Оно путало L и Z. Лично мне хочется плакать, а не радоваться.
Оно на стадии "ребенок учится ползать", в то время как какие-то движки из первого комментария открыты и умеют что-то распознавать на среднем уровне. Накой этот велосипед?

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Аноним , 25-Мрт-14 01:29 
Что бы ты плакал.

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Евгений , 25-Мрт-14 05:37 
> Оно путало L и Z. Лично мне хочется плакать, а не радоваться.

Никто ничего не путал, уважаемому не стоит беспокоится
> Оно на стадии "ребенок учится ползать", в то время как какие-то движки
> из первого комментария открыты и умеют что-то распознавать на среднем уровне.
> Накой этот велосипед?

Основные проблемы у меня последний раз были в смешанном тексте с кириллицей и латиницей. Года 3 назад с  tesseract-ocr.


"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Аноним , 25-Мрт-14 12:55 
> То, что в openSource сообществе нет специалистов по распознаванию никак не дискредитирует систему.

Там так же нет и многих других специалистов. И в конце-концов этот снежный ком недовидео-недоаудио-недофото и прочих просто-нету таки дискредитирует систему.

> Нельзя проскочить промежуточные этапы. Нельзя от палки-копалки перейти к транзисторам.

Придётся сначала и с зубчатыми колёсами и с катушками и с лампами повозиться.
Так устроен мир.

Так устроен опенсорс, где эти этапы за такое количество лет так и не были пройдены.


"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено IP , 25-Мрт-14 11:36 
> FineRider от всей этой опенсорсной лабуды так недосягаем, что даже не приходится
> радоваться подобным новостям.

Вот только версии под линукс нет как таковой, я бы купил для дома буде таковая продавалась.
Но таки ёк, только либа за штуку баксофф и "напиши гуй сам", при том, что хоум версия под винды меньше сотки.
Да, файнридер хорош в распознавании, вот только запускать крайне хлопотно, когда нет желания с виндой возиться.


"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено ваноним , 25-Мрт-14 17:35 
> Вот только версии под линукс нет как таковой

Под Linux есть SDK: http://www.abbyy.com/ocr_sdk_linux/


"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено paulus , 24-Мрт-14 23:31 
cuneiform и tesseract нормально не работают, а про оcrad даже не стоит и заикаться. Хотя то, что работы в этих направлениях ведутся всеже плюс. Давно не пользовался, что сейчас из перечисленного более вменяемое?

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Аноним , 25-Мрт-14 01:31 
> cuneiform и tesseract нормально не работают. Давно не пользовался, что сейчас из перечисленного более вменяемое?

Вот и проверьте, потом здесь расскажите.


"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено 1 , 25-Мрт-14 01:41 
Проверил - лучше всех штука finereader online

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено VolanD , 25-Мрт-14 05:02 
> Проверил - лучше всех штука finereader online

Ага, чтобы сразу в архивы АНБ?


" Проверил - лучше всех штука finereader online"
Отправлено Аноним , 25-Мрт-14 08:59 
Вы сами-то пробовали on-line?
Там ограничение и на количество страниц и документов. Затем просит заплатить.

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Евгений , 25-Мрт-14 05:40 
> cuneiform и tesseract нормально не работают, а про оcrad даже не стоит
> и заикаться. Хотя то, что работы в этих направлениях ведутся всеже
> плюс. Давно не пользовался, что сейчас из перечисленного более вменяемое?

У меня проблемы были только со смешанным текстом  года 3 назад...


"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Например , 26-Мрт-14 14:05 
что значит "нормально"? с формулами, таблицами есть проблемы, а обычный текст у меня хорошо распознавался.

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Аноним , 25-Мрт-14 09:49 
Только я один прочел вначале как orcad со всеми вытекающими? ))

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Аноним , 25-Мрт-14 16:38 
Так ведь есть же Cuneiform который русский поддерживает. Еще бы gui на gtk ему нормальное прикрутить.

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Аноним , 25-Мрт-14 17:41 
Периодически юзаю синеформу для распознавания разных домашних бумажек в убунте 12.04 из терминала, меня устраивает. Точность распознавания процентов 80. Всё лучше чем руками перенабирать.

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Василий , 25-Мрт-14 18:14 
> Поддержка кириллицы отсутствует

Блин! С этого же надо было заметку начинать! А то я столько буковок прочитал зря, зачем напрягался? Минуты полторы убил зря! :-)))