URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 94219
[ Назад ]

Исходное сообщение
"Новая версия оболочки для распознавания текста YAGF 0.9.3"

Отправлено opennews , 19-Фев-14 21:46 
Вышла (http://symmetrica.net/cuneiform-linux/yagf-en.html) новая версия YAGF, написанной с использованием Qt 4 графической оболочки для программ оптического распознавания текста  Cuneiform (https://launchpad.net/cuneiform-linux) и Tesseract (http://code.google.com/p/tesseract-ocr/). Программа позволяет через единый GUI-интерфейс управлять сканированием изображений, их предварительной обработкой и распознаванием большого числа отсканированных страниц. Главным новшеством выпуска является  улучшенное качество распознавания плохо отсканированных страниц

<center><a href="http://symmetrica.net/cuneiform-linux/yagf.jpg"><img src="http://www.opennet.me/opennews/pics_base/0_1392831580.jpg" style="border-style: solid; border-color: #e9ead6; border-width: 15px;" title="" border=0></a></center>

URL: http://symmetrica.net/cuneiform-linux/yagf-en.html
Новость: http://www.opennet.me/opennews/art.shtml?num=39130


Содержание

Сообщения в этом обсуждении
"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено Аноним , 19-Фев-14 21:46 
Хммм... лучше пусть улучшат качество распознавания хорошо отсканированных страниц...

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено Аноним , 19-Фев-14 22:25 
Что мешает примкнуть к проектам Tesseract или Cuneiform?

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено Карбофос , 19-Фев-14 22:35 
что мешает? демагогия и мешает. ибо нельзя разводить одновременно трёп о том, что лучше и что хуже, и что-то  действительно делать. тут одно из двух.

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено Аноним , 20-Фев-14 01:02 
Им там жарко не станет если все недовольные юзеры интернета к ним "примкнут"?
Че им там кофе носить или машину мыть? Думаешь на качество продукта это повлияет?

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено name , 20-Фев-14 06:53 
Можно просто денег дать.

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено Аноним , 20-Фев-14 10:35 
Если примкнуть в виде разработчика и выдавать кодом, то жарко не станет. Опыт показывает, что для OpenSource проекта соотношение пользователей к разработчикам редко превышает 1 к 10000, если только этот проект не предназначен только для разработчиков.

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено RedCow , 19-Фев-14 22:29 
Неистово плюсую !!!

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено paulus , 19-Фев-14 23:37 
YAGF просто гуйня, вся проблема в пока еще плохом качестве распознавания текста  Cuneiform и Tesseract. Ждемсъ улучшений.

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено Аноним , 20-Фев-14 02:58 
Откройте для себя scantailor.

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено Аноним 2.0 , 20-Фев-14 03:24 
А в нем возможно перспективу (трапецию) править?
Я не нашел.

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено Аноним , 20-Фев-14 00:46 
С распознаванием русского у неё до сих пор проблемы?

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено Аноним , 20-Фев-14 04:31 
В сусе валится при импорте чего угодно.

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено CHERTS , 20-Фев-14 07:13 
Cuneiform и Tesseract очень даже неплохо распознают русский язык. Я уже 2-й месяц пишу библиотеку с использованием Tesseract и очень доволен качеством распознавания русского.

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено Аноним , 20-Фев-14 08:51 
я поработал с тессерактом
нужно было составить алгоритм распознавания чеков
у тессеракта есть алгоритм самообучения
но в целом он работает на слабую троечку


"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено Аноним , 20-Фев-14 09:32 
На чём в итоге остановились?

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено Аноним , 20-Фев-14 09:37 
жаль ни одна система распознования не умеет форматированный текст и таблицы.

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено Аноним , 20-Фев-14 09:39 
Приходилось бесплатный cuneiform запускать в wine. Но он там очень плохо работает.

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено Аноним , 20-Фев-14 09:49 
Чисто из любопытства, а зачем через вайн?

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено Аноним , 20-Фев-14 21:15 
Бесплатная версия для виндовс умеет таблицы, картинки, форматированный текст и распознавать где картинка, где текст, где таблица.
та что свободная не умеет всего этого.

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено цирроз , 20-Фев-14 10:51 
этот проект уже несколько лет, как открыт. для линукса есть нативная версия, причем - во многих дистрибутивах

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено Skull , 20-Фев-14 10:08 
Увы, эту версию надо допиливать (что усложняет контрибьютинг, так как автор использует для VCS svn, а не git):
1. Выбор русского-английского языка при распознавании через Cuneiform приводит к ошибке, хотя ruseng в доступных словарях есть и в ошибке показывается.
2. UI Language (и пункт и диалог), а также некоторые диалоги сообщения об ошибках не переведены.
3. Зря автор сделал аляповатый диалог выбора языка распознавания.
4. При попытке распознавания не может открыть input.bmp (собственно, это основная причина, по которой версия неработоспособна).
5. При смене движка на tesseract (при наличии rus.traineddata) и оставшемся варианте «Русский» в выпадающем списке панели инструментов, пытается открыть английский словарь (выбраны языки русский и английский). Диалог явно лишний.

Автору терпения и удачи!


"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено цирроз , 20-Фев-14 10:45 
пишите отчеты об ошибках на страничке проекта, тогда и софт будет лучше ;)

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено Skull , 21-Фев-14 13:21 
> пишите отчеты об ошибках на страничке проекта, тогда и софт будет лучше ;)

Форму ввода на официальной страничке покажите, дорогой Капитан Очевидность. :)


"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено цирроз , 21-Фев-14 16:12 
вот, на проектной страничке
https://code.google.com/p/yagf/issues/list

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено ццц , 20-Фев-14 16:27 
Андрей, а что в альте OCRFeeder? Там язык можно для движков выбирать?

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено Skull , 21-Фев-14 13:28 
> Андрей, а что в альте OCRFeeder? Там язык можно для движков выбирать?

Да, конечно.

P.S. У нас там суровые патчи george@ (http://packages.altlinux.org/en/Sisyphus/srpms/ocrfeeder/pat...). Надо будет посмотреть, что в новой версии, может, там и приложены.



"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено Андрей Боровский , 20-Фев-14 20:56 
Большая часть претензий вращается вокруг английского словаря по умолчанию (исправлено) и работы с форматом TIFF. Запощу сюда еще это: http://quickgeeknotes.blogspot.ru/2014/02/yagf.html

> Автору терпения и удачи!

Спасибо!


"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено Аноним , 20-Фев-14 20:46 
Кто может писать программы - пишет. Кто не может - учит писать программы. К сожалению, у этого правила нет исключения.

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено Аноним , 20-Фев-14 21:19 
Как же нет? Думается мне большая часть не умеет и не учит.

"Новая версия оболочки для распознавания текста YAGF 0.9.3"
Отправлено trdm , 22-Фев-14 16:21 
это только для линукса?
А для винды будет сборка?