Выпущен (https://lists.launchpad.net/cuneiform/msg00236.html) релиз Cuneiform 0.6 (https://launchpad.net/cuneiform-linux), свободной системы распознавания печатных текстов построенной на базе открытых компанией Cognitive Technologies исходных текстов (http://www.cuneiform.ru/downloads/index.html). В новой версии произведено исправление ошибок, добавлена поддержка сборки в Visual Studio.URL: https://lists.launchpad.net/cuneiform/msg00236.html
Новость: http://www.opennet.me/opennews/art.shtml?num=20162
не столько VS, сколько mingw.
Попробовал. Относительно неплохо распознало.
Я заскриншотил консоль, на которо
ой
на которой собирал продукт. Шрифт там был 8, сохранил как bmp 1bpp и прогнал через программу. Не опознались извратные @ и еще пара символов. А в нескольких местах пострадал регистр и добавились пробелы. Но общее впечатление - удовлетворительно. То есть, я удовлетворен :)
Сейчас придет User294, и скажет чтобы ты срочно удалял это со совего компа, иначе подсядешь на эту прогу, а потом придет Майкрософт, закроет исходники (потому что BSD лицензия) потребует от тебя денег, не заплатишь - MS покажет кукишь.
А оно уже научилось распознавать несколько страниц сразу, или всё также надо мучить их по одной?
поддержка pdf то появилась?
Гм. Понятно, конечно, чего хочет народ.
Нет. Этого ничего я не вижу в программе. Но могу предложить, как сделать.
Например, как фильтр CUPS. ;-)Сейчас эта программа ест один файл и выдает результат в другой.
Никакого GUI. Если смотреть на программу в этом свете, я бы вообще убрал вывод в файл, если он не назначен, а выводил бы на консоль.
А если добавлять чего, так добавил бы самоконвертатор изображений средствами ImageMagick.
И не засорял бы сам OCR движок поддержкой сотней нужных форматов.
Как раз без ImageMagick понимает только несжатый BMP.
когда раньше вставал вопрос о переводе части офисных машин на линукс, против этого были такие аргументы: нет системы распознавания текстов (finereader только под винду) и 1с-ка тоже только под винду. теперь, похоже, аргументов против линукса поубавится.
стандартный вопрос. оно всё также стабильно падает?
>стандартный вопрос. оно всё также стабильно падает?Как на духу, аноним анониму - это первая сборка, научившаяся понимать рашан фонтс и при этом не сегфолтиццо. Я доволен как слон. Только деб не могу собрать под amd64, у кого получится, прошу поделиться.
я не пойму будет ли cuneiform распознавать отсканированный текст, а не сохраненный в виде рисунка?