![]() |
Пред. тема | След. тема | ||
Форум Разговоры, обсуждение новостей | |||
---|---|---|---|
Изначальное сообщение | [ Отслеживать ] |
"Релиз системы распознавания текста Tesseract 5.4.0" | +/– | ![]() |
Сообщение от opennews (??), 06-Июн-24, 22:48 | ||
Опубликован релиз системы оптического распознавания текста Tesseract 5.4.0, поддерживающей распознавание символов UTF-8 и текстов на более чем 100 языках, включая русский, казахский, белорусский и украинский. Результат может сохраняться как открытым текстом, так и в форматах HTML (hOCR), ALTO (XML), PDF и TSV. Изначально система была создана в 1985-1995 годах в лаборатории компании Hewlett Packard, в 2005 году код был открыт под лицензией Apache и в дальнейшем развивался при участии работников компании Google. Исходные тексты проекта распространяются под лицензией Apache 2.0... | ||
Ответить | Правка | Cообщить модератору |
Оглавление |
Сообщения | [Сортировка по ответам | RSS] |
1. Сообщение от Аноним (1), 06-Июн-24, 22:48 | +/– | ![]() |
У кого-нибудь есть натренированные модели для китайского языка получше? Гугл зажал те, что использует сам. Штатно доступны только десятилетние и кривые, практически бесполезны. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #3, #17, #32 |
2. Сообщение от Аноним (2), 06-Июн-24, 23:00 | +/– | ![]() |
Ничего лучше из бесплатного нет, но: шрифт прибит гвоздями к pdf-у и размер рdf-а великоват. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
3. Сообщение от Аноним (3), 07-Июн-24, 01:45 | –1 +/– | ![]() |
Именно так. Толку от этих обновлений нет, фактически эта поделка люто проприетарная, публично выложена только демо-версия, ни на что не годное барахло, а нормальных моделей нет и не предвидится, даже спиратить нигде нельзя. "Тренируйте своё сами", идите нафиг. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #1 Ответы: #33 |
4.
Сообщение от kotpilot![]() | +3 +/– | ![]() |
Ну и кто его пробовал? Как он по сравнению с каким-нибудь файнридером. Как в установке, настройке, загрузке проца, памяти, как распознает кириллицу? В общем реальные кейсы использования имеются у кого? | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #6, #9, #15, #23, #25, #27, #29, #35 |
6.
Сообщение от Аноним![]() | +/– | ![]() |
Тут только теоретические выкладки на тему ЯП и корпораций. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #4 |
9. Сообщение от soarin (ok), 07-Июн-24, 03:50 | +/– | ![]() |
Традиционно было сильно хуже того же FineReader. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #4 |
15. Сообщение от Аноним (15), 07-Июн-24, 05:06 | +3 +/– | ![]() |
А разве было что-то лучше "какого-нибудь файнридра"? | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #4 Ответы: #39 |
16. Сообщение от нитгитлистер (?), 07-Июн-24, 05:52 | +1 +/– | ![]() |
ммда, найти интсал для винды оказалось несколько сложнее чем хотелось бы. весит 48 метров для х64, что уже само по себе настораживает. при установке на пункте выбора загрузки скриптов надо очень постараьбся чтобы найти кириллицу латиницу раусский и английский языки. выбрав такой минимум на диске засрётся неожиданно 354 метра. радует что загрузка доп можулей через тырнет на очень хороших скоростях. сосно на эьтом всё и заканчивается. потому что кроме запуска консоли ни какой другой оболочки взаимодействия с ней нет. инструкции как именно с ней работать. какие команды вводить нет. в общем какое то непонятное поделие непонятно для кого сделанное | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #26, #30 |
17. Сообщение от КО (?), 07-Июн-24, 06:42 | +2 +/– | ![]() |
Ну вот это попробуй подсунь в Crow Translate и будет счастье | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #1 |
19. Сообщение от pashev.ru (?), 07-Июн-24, 06:59 | +/– | ![]() |
> поддерживающей распознавание символов UTF-8 | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #20 |
20. Сообщение от Аноним (20), 07-Июн-24, 07:07 | +1 +/– | ![]() |
возможно имеются в виду символы типа такого : 😊 | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #19 |
22. Сообщение от Аноним (22), 07-Июн-24, 08:09 | +4 +/– | ![]() |
Иногда мне кажется, что ABBYY им приплачивает, чтобы они не развивались. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #34, #36, #42 |
23. Сообщение от Аноним (23), 07-Июн-24, 08:16 | +/– | ![]() |
Тут один админ если что. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #4 |
25.
Сообщение от dove1922![]() | +/– | ![]() |
Gimagereader + tesseract вполне неплохо распознаёт, и отдельно русский, и rus+eng. Пользуюсь почти каждый день. Из недостатков - не сращивает строки в предложения, достаёт вручную это делать. Ну и никакое распознавание таблиц - получается просто куча текста. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #4 Ответы: #37 |
26. Сообщение от Аноним (27), 07-Июн-24, 08:45 | –1 +/– | ![]() |
> кроме запуска консоли ни какой другой оболочки взаимодействия с ней нет | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #16 Ответы: #28 |
27. Сообщение от Аноним (27), 07-Июн-24, 08:46 | +/– | ![]() |
> В общем реальные кейсы использования имеются у кого? | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #4 Ответы: #44 |
28. Сообщение от нитгитлистер (?), 07-Июн-24, 09:31 | +/– | ![]() |
>> кроме запуска консоли ни какой другой оболочки взаимодействия с ней нет | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #26 |
29. Сообщение от Jh (?), 07-Июн-24, 09:55 | +/– | ![]() |
Я пробовал версию 4. сканы разрешением 200 dpi вполне прилично распознавал, причем сканы с ксерокопий из мед учреждений. Нам пдф не нужен был, в простой текст. тот же файнридер сколько не пробовал, если надо редактировать, один фиг всё едет и приходится руками много делать. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #4 |
30. Сообщение от Jh (?), 07-Июн-24, 10:00 | +/– | ![]() |
для винды есть фронт VietOCR, но он для 4 версии. А вообще не понимаю тех кто воротит нос от бесплатных программ. Зажрались | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #16 Ответы: #31 |
31. Сообщение от Аноним (31), 07-Июн-24, 10:53 | +/– | ![]() |
Вторая ссылка в Гугле, например, https://github.com/nguyenq/VietOCR3 | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #30 |
32. Сообщение от Аноним (32), 07-Июн-24, 11:10 | +1 +/– | ![]() |
PaddleOCR же. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #1 |
33. Сообщение от Павел Фадеев (-), 07-Июн-24, 11:12 | +10 +/– | ![]() |
> публично выложена только демо-версия, ни на что не годное барахло | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #3 Ответы: #45 |
34. Сообщение от nox. (?), 07-Июн-24, 13:53 | +/– | ![]() |
YAGF - последнее обновление 8 лет назад. Местами не работает. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #22 |
35. Сообщение от nox. (?), 07-Июн-24, 13:55 | +/– | ![]() |
> по сравнению с каким-нибудь файнридером | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #4 |
36. Сообщение от iPony129412 (?), 07-Июн-24, 14:02 | +1 +/– | ![]() |
Так тут наоборот. Надо бы денег заносить, чтобы развивались. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #22 Ответы: #41 |
37. Сообщение от Аноним (39), 07-Июн-24, 14:37 | +/– | ![]() |
Есть же механизм управления блоками. Для фиксированных таблиц годен. Для династических - нет. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #25 Ответы: #38 |
38. Сообщение от Аноним (39), 07-Июн-24, 14:38 | +/– | ![]() |
...динамических... Т9 | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #37 |
39. Сообщение от Аноним (39), 07-Июн-24, 15:12 | +4 +/– | ![]() |
Finereader лучше оного. Но при интеграции ядра Finereader в свое приложение за поделку ABBYY необходимо платить по тарифу за 10000 распознанных страниц в месяц, плюс доплата за превышение. Возможности купить лицензию на ядро Finereader для каждого экземпляра своего приложения разово - нет. Такое весьма сомнительное решение для разработчика ядра распознавания. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #15 Ответы: #40, #43 |
40. Сообщение от Аноним (39), 07-Июн-24, 15:13 | +/– | ![]() |
Core не дают даже возможности понять возможности. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #39 |
41. Сообщение от нах. (?), 07-Июн-24, 20:12 | +/– | ![]() |
нет столько деньгов | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #36 Ответы: #52 |
42. Сообщение от анон (?), 08-Июн-24, 01:08 | +/– | ![]() |
Ещё один коммерческий OCR-движок стал бесплатным, но исходников нет. Есть версия под линукс. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #22 |
43. Сообщение от Бывалый Смузихлёб (ok), 08-Июн-24, 09:08 | +1 +/– | ![]() |
Примечательно то, что файнридер ощутимо лучше работал ещё лет 10-15 назад в сравнении с тем что есть сейчас не-файн-ридерского. А ведь тогда и компы были слабее и ОЗУ было сильно меньше | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #39 Ответы: #51 |
44.
Сообщение от robot228![]() | +/– | ![]() |
Вась, бухнул? Там FR много где. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #27 |
45. Сообщение от Аноним (45), 08-Июн-24, 21:44 | +1 +/– | ![]() |
Ну нельзя же делать столько ошибок в слове FineReader! | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #33 |
46. Сообщение от Аноним (46), 08-Июн-24, 22:23 | +/– | ![]() |
Как оно работает с греческим, грузинским и армянским алфавитами? | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
48. Сообщение от EuPhobos (ok), 09-Июн-24, 16:31 | +1 +/– | ![]() |
Мне понадобилось пропарсить огромную кучу фоток без EXIF-данных с видеонаблюдения, но на которых есть жёсткий счётчик даты и времени. Тессеракт нифига не справился, 40% чуши, с учётом того, что парсить нужно было только жиные и контрастные цифры, и строго в определённом углу. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #49 |
49. Сообщение от AS (??), 10-Июн-24, 11:25 | +/– | ![]() |
такаяЖеФигня: | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #48 |
51. Сообщение от Аноним (51), 12-Июн-24, 01:31 | +/– | ![]() |
Да нет в файнридере ничего особенного, если речь о латинице. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #43 |
52. Сообщение от Аноним (52), 12-Июн-24, 02:30 | +/– | ![]() |
Деньгов есть столько просто не у тех и не на то... | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #41 |
Архив | Удалить |
Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема |
Закладки на сайте Проследить за страницей |
Created 1996-2025 by Maxim Chirkov Добавить, Поддержать, Вебмастеру |