The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Вышел консольный вариант системы распознавания текстов ABBYY FineReader 11 для Linux

16.05.2014 21:27

Компания ABBYY выпустила одиннадцатую версию системы распознавания текстов ABBYY FineReader Engine CLI для Linux. CLI-версия FineReader работает в режиме командной строки и поддерживает обработку документов в форматах RTF, HTML, XML и PDF. Начиная с выпуска 11 добавлена поддержка форматов PDF/A-2, ODT, FB2 и ePub. Программа позволяет переводить содержимое таблиц, распознавать 1D и 2D штрих-коды, обрабатывать документы с текстом на нескольких языках (всего поддерживается около 190 языков).

Кроме новых форматов для экспорта распознанных страниц, в версии 11 обеспечено распространение 64-разрядных сборок пакета, добавлена поддержка многопоточного распознавания с задействованием всех ядер CPU, реализована возможность использования профилей обработки (преобразование документов, архивирование документов, выделение текста, распознавание штрих-кодов и т.п.), добавлен режим быстрого распознавания (на 92% быстрее с незначительным ухудшением точности), добавлена поддержка новых видов штрих-кодов, осуществлён переход на новые алгоритмы препроцессинга и бинаризации для повышения качества изображений.

Программа является коммерческим продуктом, но с сайта проекта можно загрузить пробную версию, которая позволяет бесплатно распознать 100 страниц за 10 дней. Стоимость коммерческой версии составляет 149 евро с ограничением в 12 тыс. страниц в год и 999 евро с ограничением 120 тыс. страниц в год. Обладатели лицензии на прошлый выпуск ABBYY CLI OCR for Linux 9 смогут использовать 11 версию без реактивации.

  1. Главная ссылка к новости (http://www.ocr4linux.com/en:st...)
  2. OpenNews: Выпуск системы распознавания текста GNU Ocrad 0.23
  3. OpenNews: Опубликован исходный код системы для формирования слепков отпечатков пальцев FingerJetFX
  4. OpenNews: Инициатива по созданию полнофункциональной свободной системы распознавания речи
  5. OpenNews: Релиз системы распознавания текстов Cuneiform 1.1.0
  6. OpenNews: Релиз системы распознавания текста Tesseract 3.0 с поддержкой русского языка
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/39789-abbyy
Ключевые слова: abbyy, finereader, ocr
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (68) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Аноним (-), 21:56, 16/05/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • +8 +/
    Надо бы исключительно из спортивного интереса попробовать в линуксе эту пробную версию сделать вечной. Неужто не найду куда прога пишет свой этот признак "пробности".
     
     
  • 2.3, Аноним (-), 22:05, 16/05/2014 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Отпишись после
     
  • 2.6, mihalych (ok), 22:23, 16/05/2014 [^] [^^] [^^^] [ответить]  
  • +6 +/
    strace тебе в помощь. :)
     
  • 2.10, Аноним (-), 22:34, 16/05/2014 [^] [^^] [^^^] [ответить]  
  • +2 +/
    При наличии мозгов и прямых рук это будет несложно. Помню, Nero продлевался путем удаления файла /var/lib/nero/config.nero9.dat
    Ну и strace тебе в помощь, дарагой :)
     
     
  • 3.12, Аноним (-), 22:38, 16/05/2014 [^] [^^] [^^^] [ответить]  
  • +16 +/
    Фу блин варезятники. Позорище космофлота.
     
     
  • 4.15, Аноним (-), 23:07, 16/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    если я сказал "помню, делали так-то" это еще не значит, что я этоделал :) у меня купленный Неро со своим серийником ибо корпоративно покупали :) жаль, правда, поддержки линуха у них больше нет.
     
     
  • 5.22, Аноним (-), 00:43, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • +4 +/
    > жаль, правда, поддержки линуха у них больше нет.

    Если честно, на дворе 2014 год и я уже забыл когда я в последний раз использовал CD/DVD-привод. Кажется, в этом году не использовал...

     
     
  • 6.25, Аноним (-), 01:19, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • –6 +/
    > Если честно, на дворе 2014 год

    неужто
    > и я уже забыл когда я

    могёт давеча-то было
    > в последний раз использовал CD/DVD-привод. Кажется,

    туман, интрига
    > в этом году не использовал...

     
     
  • 7.32, Аноним (-), 10:33, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    Наверное это был сотрудник Неро, предвкушающий нагрев на квартальный бонус :).
     
     
  • 8.36, Аноним (-), 12:47, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    просто флешку с конфиденцией найти не могу, завалилась куда-то storage у лучше ... текст свёрнут, показать
     
     
  • 9.49, oxyum (ok), 22:09, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Только сегодня, только для вас Прекраснейшая каменная табличка и долото Надёжн... текст свёрнут, показать
     
  • 5.40, arisu (ok), 14:37, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • +4 +/
    > у меня купленный Неро со своим серийником

    вдвойне позорище.

     
  • 4.16, вввввв (?), 23:19, 16/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    Под linux нет сравнимых аналогов. А с нашими зарплатами купить нереально, тем более покупать с ограничением даже за 999 $ не охота.
     
     
  • 5.18, kurokaze (ok), 00:01, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • –2 +/
    >Под linux нет сравнимых аналогов.

    Лол, открой для себя k3b

     
     
  • 6.21, Zenitur (ok), 00:07, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    Он про FineReader. Неро для Linux я покупал за 800 рублей.
     
     
  • 7.27, Crazy Alex (ok), 03:27, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Этому и не под линуксом аналогов нет... Один из немногих примеров конкурентоспособного софта российского производства (ну, насколько это вообще к софту применимо, конечно).
     
     
  • 8.64, Аноним (-), 10:37, 19/05/2014 [^] [^^] [^^^] [ответить]  
  • +1 +/
    С хороших исходников tesseract распознаёт лишь самую малость похуже ... текст свёрнут, показать
     
     
  • 9.67, Аноним (-), 14:13, 19/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    То ли у меня исходники такие были, то ли ещё что, но у меня cuneiform допускал з... текст свёрнут, показать
     
  • 5.51, Аноним (-), 01:25, 18/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    Справедливости ради. Под линукс как раз есть какая-то простая морда к нескольким OCR движкам, чего нет под винду совсем. Платные программы не рассматриваем.
     
     
  • 6.68, Аноним (-), 14:15, 19/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    Есть. OCRFeeder называется.
     
  • 4.52, Аноним (-), 01:28, 18/05/2014 [^] [^^] [^^^] [ответить]  
  • –1 +/
    > Фу блин варезятники. Позорище космофлота.

    Позорище это когда консольная версия под линь стоит дороже гуевой под вин гуевая отсутствует как класс, а версия даже за кило евро считает копии и показывает фигу в случае чего. Абби явно нехватает хдоровой конкуренции со стророны торрен трекеров.

     

  • 1.2, Neandertalets (ok), 22:04, 16/05/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    А зачем _распознавать_ документы в RTF? Или ODT? Или FB2?
     
     
  • 2.8, AlexYeCu (ok), 22:26, 16/05/2014 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Ну вы прям как с Луны свалились: скан.jpg, втиснутый в офисный формат не видели ни разу! А если серьёзно, подозреваю, что «RTF, HTML, XML и PDF» — форматы, в которые прога может сохранять полученный результат.
     
     
  • 3.13, Аноним (-), 22:39, 16/05/2014 [^] [^^] [^^^] [ответить]  
  • +8 +/
    > Ну вы прям как с Луны свалились: скан.jpg, втиснутый в офисный формат
    > не видели ни разу!

    Мы и веселее видели - скриншот путем сканирования монитора уложенного на сканер :)

     
     
  • 4.17, pw (ok), 23:37, 16/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    так недолго и в рекурсию войти)
     
     
  • 5.23, Аноним (-), 00:44, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    > так недолго и в рекурсию войти)

    Ну как, стандартный скриншот от долбо...в: кладется монитор на сканер, результат засовывается в ворд.

     
     
  • 6.30, Андрей (??), 09:46, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    Обязательно в ворд! Никогда не понимал, почему .jpeg просто в письмо вложить нельзя, обязательно сначала в ворд...
     
     
  • 7.53, Аноним (-), 01:29, 18/05/2014 [^] [^^] [^^^] [ответить]  
  • –1 +/
    > Обязательно в ворд! Никогда не понимал, почему .jpeg просто в письмо вложить
    > нельзя, обязательно сначала в ворд...

    Потому что на том конце 1) просто джепег могут не открыть 2) принимают только в ворде (например, на сайте прикрепляется только ворд)

     
  • 7.55, PNG (?), 01:57, 18/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    > Никогда не понимал, почему .jpeg

    Тоже никогда не понимал почему jpeg используют для скриншотов - картинка получается вся в квадратах и файл большего объёма. Для скриншотов оптимальным на данный момент является png. Возможно со временем это будет что-то типа webp, но пока png безалтернативен.

     
     
  • 8.59, Michael Shigorin (ok), 20:03, 18/05/2014 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Зависит ой зависит Обычно нет, если не требуется именно картинка без потерь ... текст свёрнут, показать
     
     
  • 9.62, PNG (?), 10:06, 19/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    Если постараться, то добъёшься исключения одного за сччёт другого Проверено нео... текст свёрнут, показать
     
     
  • 10.63, PNG (?), 10:08, 19/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    s добъёшься добьёшься P S Я буду читать свои сообщения перед отправкой ... текст свёрнут, показать
     
  • 10.70, Michael Shigorin (ok), 20:26, 19/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    Не-а http fly osdn org ua mike img screenshots ... текст свёрнут, показать
     
     
  • 11.71, PNG (?), 01:42, 20/05/2014 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Ну да - скриншот десктопа с фоткой на фоне И по чему же это jpeg оказывается эф... текст свёрнут, показать
     
     
  • 12.73, Michael Shigorin (ok), 12:48, 20/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    По факту Пока из Вас, простите, получается -- Вы ляпнули, вот и покажите png ра... текст свёрнут, показать
     
     
  • 13.74, ZFS (?), 16:04, 20/05/2014 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Это был сарказм А так как ты его не понял, то можно сделать один единственный п... текст свёрнут, показать
     
     
  • 14.75, Michael Shigorin (ok), 21:36, 20/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    Ничего себе переопределения Давайте об этом я поговорю с кем-либо, кто хотя бы ... большой текст свёрнут, показать
     
     
  • 15.76, PNG (?), 03:10, 21/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    Нет аргументов по теме - переходи на личности Что не так Самый обычный скрин... большой текст свёрнут, показать
     
  • 4.19, A.Stahl (ok), 00:04, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    Почему-то мне кажется, что это невозможно.
    Точнее сканер покажет "чистый лист", а не "скриншот".
     
     
  • 5.24, Аноним (-), 00:45, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > Точнее сканер покажет "чистый лист", а не "скриншот".

    Да что-то показывает даже. Хреново, но показывает. Офисные удоды не гордые, их такое "качество" устраивает.

     
     
  • 6.26, Аноним (-), 01:43, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    > Да что-то показывает даже. Хреново, но показывает. Офисные удоды не гордые, их
    > такое "качество" устраивает.

    всю жизнь так сканирую, зато не привязан к вендору

     

  • 1.20, Zenitur (ok), 00:05, 17/05/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • –1 +/
    Обязательно куплю. Несколько лет назад я не знал что существует версия для консоли http://www.opennet.me/opennews/art.shtml?num=25800 Думал что есть только "Набор динамически подключаемых библиотек и средств разработки для встраивания функций распознавания текста в сторонние программы" http://www.opennet.me/opennews/art.shtml?num=26325

    Но почему всё ещё консоль? Так трудно было написать графический интерфейс на GTK2+GLIB+ATK+Pango+Cairo+gnomeui-2+glade-2+gnomevfs-2+Freetype+XML2?

     
     
  • 2.28, cmp (ok), 05:52, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • +3 +/
    > CLI-версия FineReader работает в режиме командной строки и поддерживает обработку документов в форматах RTF, HTML, XML и PDF.

    Вам это надо красным капсом 48 размера?

    > GTK2+GLIB+ATK+Pango+Cairo+gnomeui-2+glade-2+gnomevfs-2+Freetype+XML2

    QT

     
     
  • 3.37, Аноним (-), 13:11, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    CLI это и есть "для консоли".
     
  • 3.41, arisu (ok), 14:39, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • +4 +/
    > QT

    ещё и QuickTime для этого ставить?! O_O

     
     
  • 4.45, Аноним (-), 20:53, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    >> QT
    > ещё и QuickTime для этого ставить?! O_O

    А если бы он, например, написал его как qt, то что бы ты ставил?

     
  • 2.38, аноном (?), 13:13, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Ну так на линухах чаще консольная версия и нужна.  Для обычного распознавания используют винду с виндовой версией, а линуксовая чаще всего используется в различных веб порталах, когда пользователю нужно загрузить скан документа, а бэкенд на линуксе преобразует формат, распознает и так далее.

     

  • 1.29, Андрей (??), 09:44, 17/05/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    1. Помню, SDK для Linux у них лет 7 назад ещё готов был. Стоил, если память не изменяет, 25 тыр.
    2. А в вендовой версии такие ограничения есть? И почему такая дикая разница в цене?
     
  • 1.31, Аноним (-), 10:22, 17/05/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • –1 +/
    Для командной строки - вот извращение!
     
     
  • 2.33, Николай (??), 11:39, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Ага) Я Фотошоп предсиавил для командной строки)
     
     
  • 3.34, Николай (??), 11:41, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • –1 +/
    *представил
     
  • 3.39, Аноним (-), 14:26, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Называется imagemagick.
     
     
  • 4.46, Khariton (ok), 21:01, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    imagemagick+cli_finereader=нашефсе
     
  • 3.43, Michael Shigorin (ok), 17:33, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • +2 +/
    > Ага) Я Фотошоп предсиавил для командной строки)

    Предложите фотошоп вместо ImageMagick на веб-сервер, только не прячьтесь. :}

     
     
  • 4.57, rob pike (?), 19:56, 18/05/2014 [^] [^^] [^^^] [ответить]  
  • –1 +/
    А в чем вы видите большую проблему?
    Mozilla, например, использовали, массово-параллельно, и даже не headless (давно дело было), для парсинга - в общем ничего такого страшного.
    Тем более через COM рулится, еще удобней.
     

  • 1.35, trdm (ok), 12:03, 17/05/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    CuneiForm OpenOCR - неплохо распознает тексты.
    Я распознавал книжку с его помощью
    + STDUViewer
     
     
  • 2.47, Khariton (ok), 21:13, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    > CuneiForm OpenOCR - неплохо распознает тексты.
    > Я распознавал книжку с его помощью
    > + STDUViewer

    если нет графики и таблиц, то разбирало более-менее, хотя с кирилицей не все было хорошо...
    Значительно хуже латыницы.

     

  • 1.42, Аноним (-), 16:07, 17/05/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • +3 +/
    Хуже закрытых программ только закрытые программы с ограничением использования.
    > 149 евро с ограничением в 12 тыс. страниц в год

    А потом что? Байты программы устают?

    Желаю этой фирме закупить туалетную бумагу, которую можно использовать не чаше раза в неделю.

     
     
  • 2.44, нектоинечто (?), 20:01, 17/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    >Желаю этой фирме закупить туалетную бумагу, которую можно использовать не чаше раза в неделю

    Лучше, 20 см бумаги в три часа, если чаще то доплатить не менее 50% от первоначальной стоимости с уменьшением ограничивающего времени на 10%. С применинием (n!) (факториал)

     
     
  • 3.54, asavah (ok), 01:53, 18/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    лучше чтоб после 12:00 превращалась в наждачку.
     
  • 2.58, rob pike (?), 19:59, 18/05/2014 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Хотите чтобы был только один вариант - вместе с исходными текстами в неограниченное владение и навсегда? Догадайтесь сколько он будет стоить.
    Почему вы против того чтобы у покупателей был выбор и возможность купить ограниченную функциональность за устраивающую их сумму?
     
     
  • 3.61, arisu (ok), 09:03, 19/05/2014 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > Почему вы против того чтобы у покупателей был выбор и возможность купить
    > ограниченную функциональность за устраивающую их сумму?

    потому что при таких раскладах других вариантов не остаётся. да и в принципе: мнение идиотов никого не интересует. такие дела.

    (пошёл Лицензионно качать с торрентов очередной фильм)

     

  • 1.56, Аноним (-), 09:19, 18/05/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • –1 +/
    Еще бы сделали Lingvo словарь для Linux и вообще молодцы ребята!
     
     
  • 2.60, Аноним (-), 06:21, 19/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    dictd чем не устраивает ?
     
     
  • 3.69, Жека (??), 20:12, 19/05/2014 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Словарь хороший, просто в Lingvo есть tutor для обучения словам, там со словом всякие фразы подобраны, и конечно словари там обрабатываются профессионалами, и всегда свежая информация. Интересно обучаться, я вот для Windows 7 купил себе лицензию и учусь)
     

  • 1.65, yantux (??), 10:47, 19/05/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • –1 +/
    Лучше бы они делали железки, т.е. аппаратное распознавание.
     
     
  • 2.66, мимокрок (?), 12:24, 19/05/2014 [^] [^^] [^^^] [ответить]  
  • +/
    Любая железка использует какой-то софт.
     

  • 1.72, SiteMaster (?), 07:20, 20/05/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • –1 +/
    Цены под серверные решения ориентированы. На хомячков положили. Потому и GUI нет.
    Если есть предложение и выходят новые версии - значит спрос есть. Тут можно пыхтеть сколько влезет, но если что то происходит - значит это кому то выгодно.
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру