<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: WatchOCR - LiveCD для развертывания серверов распознавания о...</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID3/69118.html</link>
    <description>Началось бета-тестирование проекта WatchOCR (http://www.watchocr.com/), в рамках которого подготовлен основанный на Knoppix LiveCD-дистрибутив для быстрой организации работы сервера для распознавания и конвертации отсканированных документов. Контроль за прогрессом выполнения операций и настройка параметров дистрибутива осуществляется через web-интерфейс. Размер iso-образа (http://www.watchocr.com/files/watchocr-V0.2-2010-06-28-en.iso) 654 Мб. &lt;br&gt;&lt;br&gt;&lt;br&gt;Дистрибутив очень прост в настройке и позволяет с минимальными усилиями (достаточно просто загрузить диск и настроить сетевое соединение) организовать сервер преобразующий PDF с изображениями отсканированных страниц в PDF с данными в тестовом представлении для которых можно выполнять операции поиска внутри документа. После загрузки в web-интерфейсе определяются две директории - одна для входящих и одна для преобразованных документов. Вместо локальных директорий поддерживается монтирование удаленных Windows ресурсов. Пользователю достаточно ск...&lt;br&gt;&lt;br&gt;URL: http://linux.s</description>

<item>
    <title>WatchOCR - LiveCD для развертывания серверов распознавания о... (DocMan)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID3/69118.html#15</link>
    <pubDate>Sun, 25 Jul 2010 09:36:43 GMT</pubDate>
    <description>Проверил работу WatchOCR &quot;из коробки&quot; на выборке документов (кириллица/латиница) с различного уровня сложностью верстки (от двухколоночного текста, до форм счетов-фактур из 1С). На выходе, как и следовало, появляются PDF в том же виде, что и оригинальный скан. Текст можно выделять и копировать. С кириллицей (с предустановленными настройками дистрибутива) проблемы, Cuneiform не определяет ее, выдавая &quot;06&apos;+ecTBQ C QJPaHRVBHHOQNT B8TBTBBHHOC&quot; вместо &quot;Общество с ограниченной ответственностью&quot; (пример). С распознаванием латиницы тоже не все радужно. Но все это решаемо, интересно было, как оно работает при поставка &quot;как есть&quot;. Надеемся, что проекты Cuneiform и WatchOCR будут развиваться.&lt;br&gt;&lt;br&gt;P.S. А по поводу &quot;дистр это жирно, нужны скрипты установки&quot;, автор над этим работает, во всяком случае .deb пакет на оффсайте есть.&lt;br&gt;</description>
</item>

<item>
    <title>WatchOCR - LiveCD для развертывания серверов распознавания о... (ziceptor)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID3/69118.html#14</link>
    <pubDate>Sat, 24 Jul 2010 00:19:14 GMT</pubDate>
    <description>Отдельная ОСь.. Баш... Это полезная вещь!&lt;br&gt;LiveCD-дистрибутив для быстрой организации работы сервера для распознавания и конвертации отсканированных документов.&lt;br&gt;</description>
</item>

<item>
    <title>WatchOCR - LiveCD для развертывания серверов распознавания о... (Аноним)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID3/69118.html#13</link>
    <pubDate>Fri, 23 Jul 2010 19:41:17 GMT</pubDate>
    <description>К одной кнопке&lt;br&gt;</description>
</item>

<item>
    <title>WatchOCR - LiveCD для развертывания серверов распознавания о... (DocMan)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID3/69118.html#12</link>
    <pubDate>Fri, 23 Jul 2010 12:43:17 GMT</pubDate>
    <description>Суть в том, что PDF (image) преобразуется в PDF (image + текст &quot;поверх&quot; растрового) для возможности полнотекстового поиска. В данном случае распознавание сложной верстки документов не так важно, ИМХО.&lt;br&gt;</description>
</item>

<item>
    <title>WatchOCR - LiveCD для развертывания серверов распознавания о... (sHaggY_caT)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID3/69118.html#11</link>
    <pubDate>Fri, 23 Jul 2010 12:22:53 GMT</pubDate>
    <description>Можно и на виртуалку...&lt;br&gt;</description>
</item>

<item>
    <title>WatchOCR - LiveCD для развертывания серверов распознавания о... (анонимиус)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID3/69118.html#10</link>
    <pubDate>Fri, 23 Jul 2010 11:51:53 GMT</pubDate>
    <description>&amp;gt;Размер iso-образа 654 Мб. &lt;br&gt;&lt;br&gt;=O&lt;br&gt;&lt;br&gt;&amp;gt;задействован собственный набор скриптов&lt;br&gt;&lt;br&gt;Пара строчек на баш?&lt;br&gt;&lt;br&gt;Куда катится мир..&lt;br&gt;</description>
</item>

<item>
    <title>WatchOCR - LiveCD для развертывания серверов распознавания о... (zazik)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID3/69118.html#9</link>
    <pubDate>Fri, 23 Jul 2010 10:56:31 GMT</pubDate>
    <description>&amp;gt;Вообще, да, ставить для этого отдельный ос жирновато. Реквестирую готовых скриптов для &lt;br&gt;&amp;gt;этих целей. &lt;br&gt;&lt;br&gt;Скачай дистр и выпили оттуда.&lt;br&gt;</description>
</item>

<item>
    <title>WatchOCR - LiveCD для развертывания серверов распознавания о... (User294)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID3/69118.html#8</link>
    <pubDate>Fri, 23 Jul 2010 10:45:42 GMT</pubDate>
    <description>&amp;gt;При наличии прямых рук и холодной головы это можно на любом дистре сделать. &lt;br&gt;&lt;br&gt;Да, когда встает вопрос &quot;вам шашечки или ехать&quot; - почему-то вылезает очередной Вася из своего гаража и предлагает собрать вам автомобиль. За всего 2 недели, заметьте. Зато именно такой как вы хотели с точностью до винтика. Вот только если надо было например на самолет - небольшая проблема состоит в том что он две недели ждать не будет.&lt;br&gt;</description>
</item>

<item>
    <title>WatchOCR - LiveCD для развертывания серверов распознавания о... (KERNEL_PANIC)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID3/69118.html#7</link>
    <pubDate>Fri, 23 Jul 2010 10:33:05 GMT</pubDate>
    <description>Вроде как все пучком. Нужно только относительно хорошее разрешение скана и что бы не было художественных шрифтов.&lt;br&gt;</description>
</item>

</channel>
</rss>
