URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 95044
[ Назад ]

Исходное сообщение
"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено opennews , 24-Мрт-14 22:31

Представлен (http://permalink.gmane.org/gmane.org.fsf.announce/2123) релиз системы распознавания текста Ocrad (http://www.gnu.org/software/ocrad/ocrad.html) (Optical Character Recognition) 0.23, развиваемой под эгидой проекта GNU. Из изменений в новой версии отмечено улучшение распознавание символов (например, более корректное разделение схожих начертаний L и Z) и реализация удаления лидирующих пробелов в фильтрах "только буквы" и "только цифры".

Для оптического распознавания в Ocrad используется метод выделение признаков (feature extraction (http://en.wikipedia.org/wiki/Feature_extraction)). &nbs... может применяться как в форме библиотеки для интеграции функций OCR в другие приложения, так и в форме обособленной утилиты, которая на основе переданного на вход изображения выдаёт текст в UTF-8 или 8-битных кодировках. Распознавание поддерживается только для кодировок "ascii", "iso-8859-9" и "iso-8859-15". Поддержка кириллицы отсутствует. В состав входит анализатор макета страницы, позволяющий корректно разделять столбцы и блоки текста в печатных документах.

URL: http://permalink.gmane.org/gmane.org.fsf.announce/2123
Новость: http://www.opennet.me/opennews/art.shtml?num=39392

Содержание

Выпуск системы распознавания текста GNU Ocrad 0.23,qwewewewewep, 22:31 , 24-Мрт-14
Выпуск системы распознавания текста GNU Ocrad 0.23,Аноним, 23:11 , 24-Мрт-14
- Выпуск системы распознавания текста GNU Ocrad 0.23,A.Stahl, 00:11 , 25-Мрт-14
  - Выпуск системы распознавания текста GNU Ocrad 0.23,Аноним, 00:24 , 25-Мрт-14
    - Выпуск системы распознавания текста GNU Ocrad 0.23,Аноним, 01:29 , 25-Мрт-14
    - Выпуск системы распознавания текста GNU Ocrad 0.23,Евгений, 05:37 , 25-Мрт-14
  - Выпуск системы распознавания текста GNU Ocrad 0.23,Аноним, 12:55 , 25-Мрт-14
- Выпуск системы распознавания текста GNU Ocrad 0.23,IP, 11:36 , 25-Мрт-14
  - Выпуск системы распознавания текста GNU Ocrad 0.23,ваноним, 17:35 , 25-Мрт-14
Выпуск системы распознавания текста GNU Ocrad 0.23,paulus, 23:31 , 24-Мрт-14
- Выпуск системы распознавания текста GNU Ocrad 0.23,Аноним, 01:31 , 25-Мрт-14
  - Выпуск системы распознавания текста GNU Ocrad 0.23,1, 01:41 , 25-Мрт-14
    - Выпуск системы распознавания текста GNU Ocrad 0.23,VolanD, 05:02 , 25-Мрт-14
    - Проверил - лучше всех штука finereader online,Аноним, 08:59 , 25-Мрт-14
- Выпуск системы распознавания текста GNU Ocrad 0.23,Евгений, 05:40 , 25-Мрт-14
- Выпуск системы распознавания текста GNU Ocrad 0.23,Например, 14:05 , 26-Мрт-14
Выпуск системы распознавания текста GNU Ocrad 0.23,Аноним, 09:49 , 25-Мрт-14
Выпуск системы распознавания текста GNU Ocrad 0.23,Аноним, 16:38 , 25-Мрт-14
Выпуск системы распознавания текста GNU Ocrad 0.23,Аноним, 17:41 , 25-Мрт-14
Выпуск системы распознавания текста GNU Ocrad 0.23,Василий, 18:14 , 25-Мрт-14

Сообщения в этом обсуждении

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено qwewewewewep , 24-Мрт-14 22:31

интересно как оно по сравнению с ocropus, tesseract ?

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Аноним , 24-Мрт-14 23:11

FineRider от всей этой опенсорсной лабуды так недосягаем, что даже не приходится радоваться подобным новостям.

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено A.Stahl , 25-Мрт-14 00:11

>FineRider
Неужели Офигенный Всадник лучше расшифровывает свитки, чем Джо Мокрый Нос Длинная Сопля?
>что даже не приходится радоваться подобным новостям.
Какая разница что может какая-то другая программа?
То, что fineReader лучше, не делает Ocrad хуже.
То, что в openSource сообществе нет специалистов по распознаванию никак не дискредитирует систему.
Вышла новая версия. Улучшенная версия. Чем не повод порадоваться?
Нельзя проскочить промежуточные этапы. Нельзя от палки-копалки перейти к транзисторам.
Придётся сначала и с зубчатыми колёсами и с катушками и с лампами повозиться.
Так устроен мир.

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Аноним , 25-Мрт-14 00:24

Оно путало L и Z. Лично мне хочется плакать, а не радоваться.
Оно на стадии "ребенок учится ползать", в то время как какие-то движки из первого комментария открыты и умеют что-то распознавать на среднем уровне. Накой этот велосипед?

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Аноним , 25-Мрт-14 01:29

Что бы ты плакал.

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Евгений , 25-Мрт-14 05:37

> Оно путало L и Z. Лично мне хочется плакать, а не радоваться.
Никто ничего не путал, уважаемому не стоит беспокоится
> Оно на стадии "ребенок учится ползать", в то время как какие-то движки
> из первого комментария открыты и умеют что-то распознавать на среднем уровне.
> Накой этот велосипед?
Основные проблемы у меня последний раз были в смешанном тексте с кириллицей и латиницей. Года 3 назад с tesseract-ocr.

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Аноним , 25-Мрт-14 12:55

> То, что в openSource сообществе нет специалистов по распознаванию никак не дискредитирует систему.
Там так же нет и многих других специалистов. И в конце-концов этот снежный ком недовидео-недоаудио-недофото и прочих просто-нету таки дискредитирует систему.
> Нельзя проскочить промежуточные этапы. Нельзя от палки-копалки перейти к транзисторам.
Придётся сначала и с зубчатыми колёсами и с катушками и с лампами повозиться.
Так устроен мир.
Так устроен опенсорс, где эти этапы за такое количество лет так и не были пройдены.

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено IP , 25-Мрт-14 11:36

> FineRider от всей этой опенсорсной лабуды так недосягаем, что даже не приходится
> радоваться подобным новостям.
Вот только версии под линукс нет как таковой, я бы купил для дома буде таковая продавалась.
Но таки ёк, только либа за штуку баксофф и "напиши гуй сам", при том, что хоум версия под винды меньше сотки.
Да, файнридер хорош в распознавании, вот только запускать крайне хлопотно, когда нет желания с виндой возиться.

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено ваноним , 25-Мрт-14 17:35

> Вот только версии под линукс нет как таковой
Под Linux есть SDK: http://www.abbyy.com/ocr_sdk_linux/

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено paulus , 24-Мрт-14 23:31

cuneiform и tesseract нормально не работают, а про оcrad даже не стоит и заикаться. Хотя то, что работы в этих направлениях ведутся всеже плюс. Давно не пользовался, что сейчас из перечисленного более вменяемое?

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Аноним , 25-Мрт-14 01:31

> cuneiform и tesseract нормально не работают. Давно не пользовался, что сейчас из перечисленного более вменяемое?
Вот и проверьте, потом здесь расскажите.

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено 1 , 25-Мрт-14 01:41

Проверил - лучше всех штука finereader online

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено VolanD , 25-Мрт-14 05:02

> Проверил - лучше всех штука finereader online
Ага, чтобы сразу в архивы АНБ?

" Проверил - лучше всех штука finereader online"
Отправлено Аноним , 25-Мрт-14 08:59

Вы сами-то пробовали on-line?
Там ограничение и на количество страниц и документов. Затем просит заплатить.

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Евгений , 25-Мрт-14 05:40

> cuneiform и tesseract нормально не работают, а про оcrad даже не стоит
> и заикаться. Хотя то, что работы в этих направлениях ведутся всеже
> плюс. Давно не пользовался, что сейчас из перечисленного более вменяемое?
У меня проблемы были только со смешанным текстом года 3 назад...

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Например , 26-Мрт-14 14:05

что значит "нормально"? с формулами, таблицами есть проблемы, а обычный текст у меня хорошо распознавался.

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Аноним , 25-Мрт-14 09:49

Только я один прочел вначале как orcad со всеми вытекающими? ))

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Аноним , 25-Мрт-14 16:38

Так ведь есть же Cuneiform который русский поддерживает. Еще бы gui на gtk ему нормальное прикрутить.

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Аноним , 25-Мрт-14 17:41

Периодически юзаю синеформу для распознавания разных домашних бумажек в убунте 12.04 из терминала, меня устраивает. Точность распознавания процентов 80. Всё лучше чем руками перенабирать.

"Выпуск системы распознавания текста GNU Ocrad 0.23"
Отправлено Василий , 25-Мрт-14 18:14

> Поддержка кириллицы отсутствует
Блин! С этого же надо было заметку начинать! А то я столько буковок прочитал зря, зачем напрягался? Минуты полторы убил зря! :-)))