<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: Релиз системы распознавания текста Tesseract 4.1</title>
    <link>https://mobile.opennet.me/openforum/vsluhforumID3/117902.html</link>
    <description>Подготовлен (https://groups.google.com/forum/#!topic/tesseract-ocr/oKtTOIGIMaM) релиз системы оптического распознавания текста Tesseract 4.1 (https://github.com/tesseract-ocr/tesseract/), поддерживающей распознавание символов UTF-8 и текстов на более чем 100 языках, включая русский, казахский, белорусский  и украинский. Результат может сохраняться как открытым текстом, так и в форматах HTML (hOCR),  ALTO (XML), PDF и TSV. Изначально система была создана в 1985-1995 годах в лаборатории компании Hewlett Packard, в 2005 году код был открыт под лицензией Apache и в дальнейшем развивался при участии работников компании Google. Исходные тексты  проекта распространяются (https://github.com/tesseract-ocr/tesseract) под лицензией Apache 2.0.&lt;br&gt;&lt;br&gt;&lt;br&gt;&lt;br&gt;&lt;br&gt; Tesseract включает в себя консольную утилиту и библиотеку libtesseract для встраивания функций распознавания текста в другие приложения. Из поддерживающих Tesseract сторонних GUI-интерфейсов (https://github.com/tesseract-ocr/tesseract/wiki/User-Projects-&#037;E2&#037;80&#037;93-3rdParty)</description>

<item>
    <title>Релиз системы распознавания текста Tesseract 4.1 (www2)</title>
    <link>https://mobile.opennet.me/openforum/vsluhforumID3/117902.html#74</link>
    <pubDate>Fri, 19 Jul 2019 19:17:18 GMT</pubDate>
    <description>Тессеракт - это гиперкуб из четырёхмерного пространства, аналог двумерного квадрата и трёхмерного куба. Его &quot;гранями&quot; являются трёхмерные кубы.&lt;br&gt;</description>
</item>

<item>
    <title>Релиз системы распознавания текста Tesseract 4.1 (Фноним)</title>
    <link>https://mobile.opennet.me/openforum/vsluhforumID3/117902.html#73</link>
    <pubDate>Tue, 16 Jul 2019 21:19:13 GMT</pubDate>
    <description>Конкретных пяти символов же:&lt;br&gt;U,T,F,дефис и восемь&lt;br&gt;</description>
</item>

<item>
    <title>Релиз системы распознавания текста Tesseract 4.1 (none_first)</title>
    <link>https://mobile.opennet.me/openforum/vsluhforumID3/117902.html#72</link>
    <pubDate>Mon, 15 Jul 2019 14:16:02 GMT</pubDate>
    <description>&amp;gt; Я пробовал Тессерактом распознавать старые листы, сделанные на печатной машинке. Качество &lt;br&gt;&amp;gt; там сильно так себе. По дефолту Тессеракт вообще не справлялся. Я &lt;br&gt;&amp;gt; потратил время на создание модели обучения, вручную обводил в Box editor &lt;br&gt;&amp;gt; каждую буковку, всё сконвертировал как надо. На результат это сильно не &lt;br&gt;&amp;gt; повлияло - как был мусор, так и остался. Не готов пока &lt;br&gt;&amp;gt; Тессеракт.&lt;br&gt;&lt;br&gt;поставьте scantailor, у него есть пакетный режим обработки (по настройкам) из CLI (если надо несколько страниц), получите на выходе картинки в 600dpi, далее tesseract. Я получал результат лучше файнридера (в смысле рапознавания текста)&lt;br&gt;Скантейлор имеет ф-ции выравнивания строк (эксперементальные) - у меня работало без нареканий. Как пример: фотка (с сильными шумами, с искаженной перспективой) с банковскими реквизитами, сделанная телефоном, через пленку, была распознана достойно&lt;br&gt;</description>
</item>

<item>
    <title>Релиз системы распознавания текста Tesseract 4.1 (none_first)</title>
    <link>https://mobile.opennet.me/openforum/vsluhforumID3/117902.html#71</link>
    <pubDate>Mon, 15 Jul 2019 10:42:15 GMT</pubDate>
    <description>&amp;gt; Какой нормально, FineReader 3.0 20 давности распознавал лучше. С форматированием, с таблицами. &lt;br&gt;&amp;gt; Им реально можно книги распознавать.&lt;br&gt;&amp;gt; А это только утилита выдрать текст с картинки авось получится, для добавления &lt;br&gt;&amp;gt; индексов в поиск пойдет.&lt;br&gt;&lt;br&gt;на нек. сканах - файнридер (любой) тупо крашится или выжирает всю память от виндадко ;)&lt;br&gt;и да, ФР порой текст распознает отвратительно (если скан неважный)&lt;br&gt;надо понимать (отличать) просто распознавание текста и все задачу по распознаванию сканов (она гораздо масштабнее)&lt;br&gt;</description>
</item>

<item>
    <title>Релиз системы распознавания текста Tesseract 4.1 (none_first)</title>
    <link>https://mobile.opennet.me/openforum/vsluhforumID3/117902.html#70</link>
    <pubDate>Mon, 15 Jul 2019 10:31:41 GMT</pubDate>
    <description>&amp;gt; К сожалнию, качество распознавания - просто кошмар. ИМХО, для свободного софта сфера &lt;br&gt;&amp;gt; OCR - весьма слабое место.&lt;br&gt;&lt;br&gt;Применял с предобработкой Scan Tailor - результат был лучше продуктов ABBYY&lt;br&gt;&quot;Недостаток&quot; - отсутствие распознавание таблиц (хотя были зачатки) и макета страницы, но это не является задачей движка распознавания самого текста ;)&lt;br&gt;Графические надстройки (типа YAGF) как-то пытаются выполнять подобные ф-ции...&lt;br&gt;</description>
</item>

<item>
    <title>Релиз системы распознавания текста Tesseract 4.1 (Ordu)</title>
    <link>https://mobile.opennet.me/openforum/vsluhforumID3/117902.html#69</link>
    <pubDate>Mon, 15 Jul 2019 07:54:05 GMT</pubDate>
    <description>Из новости:&lt;br&gt;&lt;br&gt;&amp;gt; Предлагается два движка распознавания: &#091;...&#093; и новый, базирующийся на применении системы машинного обучения на базе рекуррентной нейронной сети LSTM, оптимизированной для распознавания целиком строк и позволяющей добиться существенного увеличения точности.</description>
</item>

<item>
    <title>Релиз системы распознавания текста Tesseract 4.1 (iPony129412)</title>
    <link>https://mobile.opennet.me/openforum/vsluhforumID3/117902.html#68</link>
    <pubDate>Mon, 15 Jul 2019 03:26:44 GMT</pubDate>
    <description>&amp;gt; Детсад &amp;#8212; ждать, что кто-то сделает вышеперечисленное за и ради тебя.&lt;br&gt;&lt;br&gt;Нет, тут полно тулкитофобов, которым особо делать нечего.&lt;br&gt;Поэтому вероятность встретить кого-то &quot;да, я вот пользуюсь&quot; вполне нормальная.&lt;br&gt;PS: хотя вероятность встретить неадекватов, которым просто пофлудить ради поднятия ЧСВ, явно больше&lt;br&gt;</description>
</item>

<item>
    <title>Релиз системы распознавания текста Tesseract 4.1 (Аноним)</title>
    <link>https://mobile.opennet.me/openforum/vsluhforumID3/117902.html#67</link>
    <pubDate>Sun, 14 Jul 2019 17:36:40 GMT</pubDate>
    <description>А что мешает запилить на основе нейросетей нормальный распознавальщик? Пусть он будет в 10 раз тормознее на CPU, тут главное - качество.&lt;br&gt;</description>
</item>

<item>
    <title>Релиз системы распознавания текста Tesseract 4.1 (Аноним)</title>
    <link>https://mobile.opennet.me/openforum/vsluhforumID3/117902.html#66</link>
    <pubDate>Sun, 14 Jul 2019 17:34:31 GMT</pubDate>
    <description>Что ещё предскажет нумерология?&lt;br&gt;</description>
</item>

</channel>
</rss>
