URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 72464
[ Назад ]

Исходное сообщение
"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."

Отправлено opennews , 13-Ноя-10 13:35 
Вышла (http://www.joaquimrocha.com/2010/11/09/ocrfeeder-version-0-7.../) новая версия OCRFeeder (http://code.google.com/p/ocrfeeder/) - одной из наиболее развитых графических оболочек для программ оптического распознавания символов. Код программы распространяется под лицензией GPLv3.


Среди возможностей OCRFeeder:

-  Автоматическое определение установленных OCR-программ, включая tesseract и cuneiform;-  Автоматическое распознание структуры документа с использованием собственного  алгоритма (пакет Ocroupus не используется, поскольку собственный алгоритм был написан до его появления);-   Импорт изображений со сканера;-  Графический интерфейс для проверки орфографии в распознанном тексте.


Поддержка распознавания для языков, отличных от английского, в настоящее время не полная: для распознавания текстов на русском языке необходимо добавить "-l rus" в настройках каждой системы распознавания, а для правильной проверки русской орфографии помечать распознанный текст как русский.


URL: http://www.joaquimrocha.com/2010/11/09/ocrfeeder-version-0-7.../
Новость: http://www.opennet.me/opennews/art.shtml?num=28644


Содержание

Сообщения в этом обсуждении
"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено Аноним , 13-Ноя-10 13:35 
Как я понял, это альфа версия гуя для гнома. Не полностью работоспособная, но другой пока нет.

"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено yaleks , 13-Ноя-10 15:08 
http://symmetrica.net/cuneiform-linux/yagf-ru.html

"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено Аноним , 13-Ноя-10 15:14 
Это для кед. И есть еще одна, тоже для кед.

"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено ZaWertun , 13-Ноя-10 17:41 
цитата с сайта:
"YAGF необходимы библиотеки Qt 4.x и пакет проверки орфографии aspell."

надеюсь для вас "для кед" != "для Qt" ?


"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено Аноним , 13-Ноя-10 18:11 
Я за то, чтобы у каждого рабочего окружения были свои программы. Пока было только два гуя для программ распознавания и обе на КуТе. Считаю они уместнее в Кедах, а не в Гноме.

"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено Аноним , 14-Ноя-10 10:04 
Да пожалуйста - не пользуйся. Раз уместнее на ГТК - напиши.

"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено Аноним , 14-Ноя-10 14:31 
Так написали. Обсуждаем. :)

"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено gregg128 , 13-Ноя-10 15:32 
YAGF не развивается. Последняя версия за 2009 год.

"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено yaleks , 13-Ноя-10 21:07 
Чего вам не хватает в нем?

"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено gregg128 , 15-Ноя-10 15:13 
Поддержки тессеракт, выделения зон распознавания, работы с пдф и т.п. и т.д.

"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено Аноним , 17-Ноя-10 15:50 
Насчет тессеракт незнаю, а остальное - враньё.

"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено gregg128 , 18-Ноя-10 16:57 
> Насчет тессеракт незнаю, а остальное - враньё.

Посмотрел - действительно можно выделить зону (хотя указать её свойства нельзя). Но поддержка только кьюниформа = fail.


"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено paulus , 13-Ноя-10 19:19 
>другой пока нет

на http://sourceforge.net/projects/gimagereader/
A graphical GTK frontend to tesseract-ocr


"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено gregg128 , 13-Ноя-10 20:53 
А лэйаут оно распознаёт ? А кроме тессеракта что-нибудь понимает ? То-то.
Жаль, конечно, что опять люди будут по пять раз делать одну и ту же работу (Ведь ещё есть tesseract-gui.py и прочие).


>>другой пока нет
> на http://sourceforge.net/projects/gimagereader/
> A graphical GTK frontend to tesseract-ocr


"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено paulus , 16-Ноя-10 21:01 
>> на http://sourceforge.net/projects/gimagereader/
>> A graphical GTK frontend to tesseract-ocr

и с рус. больше дружит и распознает, а тот же tesseract+OCRFeeder нет. '-l rus' не помогает...



"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено gregg128 , 18-Ноя-10 16:55 
>>> на http://sourceforge.net/projects/gimagereader/
>>> A graphical GTK frontend to tesseract-ocr
> и с рус. больше дружит и распознает, а тот же tesseract+OCRFeeder нет.
> '-l rus' не помогает...

Как это не помогает ? Ещё как помогает, распознаёт на счёт раз. Я уже массу всего так распознал. Куда вы вставили этот -l rus ? Какая у вас версия тессеракта, установлен ли пакет с русским ?



"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено Аноним , 13-Ноя-10 15:28 
http://live.gnome.org/OCRFeeder

Тут еще картинки есть. Функционал вроде неплохой.


"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено gregg128 , 13-Ноя-10 15:30 
Функционал простенький, но лучше, чем у других. Если будет развиваться - получится вполне себе замена файнридеру, хотя и упрощённая.

"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено paulus , 13-Ноя-10 19:28 
> Если будет развиваться - получится вполне себе...

+1, главное, что создает ODT и работает с tesseract и cuneiform - сейчас заценим... правда только 0.7.0



"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено gregg128 , 13-Ноя-10 20:22 
дебы с git-версией, близкой к 0.7.1 есть у http://notesalexp.org/ . Там же есть deb-ы тессеракта 3.0 со всеми-всеми патчами из git, и то же самое для cuneiform. Владелец этого репозитария вообще рулит не по детски - спасибо ему. Собирает новьё, не ленится. Жаль только, что ведёт свой стэндэлоун репозиторий, а не PPA на ланчпаде, но дарёному коню...

"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено Аноним , 13-Ноя-10 23:23 
Жалко сам автор не выкладывает сборки. А АлексуП респект! Он уже по моему несколько лет собирает все касающееся распознавания.

"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено Аноним , 14-Ноя-10 00:43 
https://launchpad.net/~alex-p/+archive/notesalexp

"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено gregg128 , 14-Ноя-10 14:55 
> https://launchpad.net/~alex-p/+archive/notesalexp

Ага! Большое спасибо.


"OCRFeeder 0.7.1a - новая версия графической оболочки для OCR..."
Отправлено paulus , 16-Ноя-10 20:54 
да знаю я, только на тот момент на http://notesalexp.org/ был 0.7.0