1.1, Аноним (-), 13:28, 23/07/2010 [ответить] [﹢﹢﹢] [ · · · ]
| +/– |
IMHO, именно тот пример когда создание нового дистрибутива на 100% оправдано. Давно искал такую самодостаточную штуку для сканирования.
| |
|
2.6, Михаил (??), 14:32, 23/07/2010 [^] [^^] [^^^] [ответить]
| +/– |
С кириллицей, судя по движку, все в порядке. А вот что оно со сложным форматированием и таблицами сделает -- вопрос. Виндовый кунейформ ни чего хорошего с таблиц не отдавал, только с простыней текста на отлично справлялся.
| |
|
3.12, DocMan (?), 16:43, 23/07/2010 [^] [^^] [^^^] [ответить]
| +1 +/– |
Суть в том, что PDF (image) преобразуется в PDF (image + текст "поверх" растрового) для возможности полнотекстового поиска. В данном случае распознавание сложной верстки документов не так важно, ИМХО.
| |
3.15, DocMan (?), 13:36, 25/07/2010 [^] [^^] [^^^] [ответить]
| +/– |
Проверил работу WatchOCR "из коробки" на выборке документов (кириллица/латиница) с различного уровня сложностью верстки (от двухколоночного текста, до форм счетов-фактур из 1С). На выходе, как и следовало, появляются PDF в том же виде, что и оригинальный скан. Текст можно выделять и копировать. С кириллицей (с предустановленными настройками дистрибутива) проблемы, Cuneiform не определяет ее, выдавая "06'+ecTBQ C QJPaHRVBHHOQNT B8TBTBBHHOC" вместо "Общество с ограниченной ответственностью" (пример). С распознаванием латиницы тоже не все радужно. Но все это решаемо, интересно было, как оно работает при поставка "как есть". Надеемся, что проекты Cuneiform и WatchOCR будут развиваться.
P.S. А по поводу "дистр это жирно, нужны скрипты установки", автор над этим работает, во всяком случае .deb пакет на оффсайте есть.
| |
|
2.7, KERNEL_PANIC (ok), 14:33, 23/07/2010 [^] [^^] [^^^] [ответить]
| +/– |
Вроде как все пучком. Нужно только относительно хорошее разрешение скана и что бы не было художественных шрифтов.
| |
|
|
2.8, User294 (ok), 14:45, 23/07/2010 [^] [^^] [^^^] [ответить]
| +/– |
>При наличии прямых рук и холодной головы это можно на любом дистре сделать.
Да, когда встает вопрос "вам шашечки или ехать" - почему-то вылезает очередной Вася из своего гаража и предлагает собрать вам автомобиль. За всего 2 недели, заметьте. Зато именно такой как вы хотели с точностью до винтика. Вот только если надо было например на самолет - небольшая проблема состоит в том что он две недели ждать не будет.
| |
|
1.5, Анон (?), 14:04, 23/07/2010 [ответить] [﹢﹢﹢] [ · · · ]
| +1 +/– |
Вообще, да, ставить для этого отдельный ос жирновато. Реквестирую готовых скриптов для этих целей.
| |
|
2.9, zazik (ok), 14:56, 23/07/2010 [^] [^^] [^^^] [ответить]
| +/– |
>Вообще, да, ставить для этого отдельный ос жирновато. Реквестирую готовых скриптов для
>этих целей.
Скачай дистр и выпили оттуда.
| |
|
1.10, анонимиус (?), 15:51, 23/07/2010 [ответить] [﹢﹢﹢] [ · · · ]
| +1 +/– |
>Размер iso-образа 654 Мб.
=O
>задействован собственный набор скриптов
Пара строчек на баш?
Куда катится мир..
| |
1.14, ziceptor (?), 04:19, 24/07/2010 [ответить] [﹢﹢﹢] [ · · · ]
| +/– |
Отдельная ОСь.. Баш... Это полезная вещь!
LiveCD-дистрибутив для быстрой организации работы сервера для распознавания и конвертации отсканированных документов.
| |
|