Вариант для распечатки |
Пред. тема | След. тема | ||
Форум Разговоры, обсуждение новостей | |||
---|---|---|---|
Изначальное сообщение | [ Отслеживать ] |
"Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от opennews (??), 01-Дек-21, 12:59 | ||
Опубликован релиз системы оптического распознавания текста Tesseract 4.1, поддерживающей распознавание символов UTF-8 и текстов на более чем 100 языках, включая русский, казахский, белорусский и украинский. Результат может сохраняться как открытым текстом, так и в форматах HTML (hOCR), ALTO (XML), PDF и TSV. Изначально система была создана в 1985-1995 годах в лаборатории компании Hewlett Packard, в 2005 году код был открыт под лицензией Apache и в дальнейшем развивался при участии работников компании Google. Исходные тексты проекта распространяются под лицензией Apache 2.0... | ||
Ответить | Правка | Cообщить модератору |
Оглавление |
Сообщения | [Сортировка по времени | RSS] |
2. "Релиз системы распознавания текста Tesseract 5.0" | +5 +/– | |
Сообщение от А где же каменты (?), 01-Дек-21, 13:01 | ||
Название напоминает о фильме куб 2. | ||
Ответить | Правка | Наверх | Cообщить модератору |
26. "Релиз системы распознавания текста Tesseract 5.0" | –3 +/– | |
Сообщение от _hide_ (ok), 01-Дек-21, 15:14 | ||
Результаты распознавания напоминают "Приключения Алисы в Стране чудес" | ||
Ответить | Правка | Наверх | Cообщить модератору |
28. "Релиз системы распознавания текста Tesseract 5.0" | +1 +/– | |
Сообщение от _hide_ (ok), 01-Дек-21, 15:31 | ||
Всё зависит от того, какие использовать словари. | ||
Ответить | Правка | Наверх | Cообщить модератору |
33. "Релиз системы распознавания текста Tesseract 5.0" | –2 +/– | |
Сообщение от Аноним (33), 01-Дек-21, 16:00 | ||
А мне о игре | ||
Ответить | Правка | К родителю #2 | Наверх | Cообщить модератору |
52. "Релиз системы распознавания текста Tesseract 5.0" | –1 +/– | |
Сообщение от Аноним (52), 02-Дек-21, 06:00 | ||
И ещё "массаракш" из Обитаемого Острова | ||
Ответить | Правка | К родителю #2 | Наверх | Cообщить модератору |
3. "Релиз системы распознавания текста Tesseract 5.0" | +17 +/– | |
Сообщение от Аноним (3), 01-Дек-21, 13:02 | ||
>Ветка "master" в Git переименована в "main". | ||
Ответить | Правка | Наверх | Cообщить модератору |
4. "Релиз системы распознавания текста Tesseract 5.0" | +3 +/– | |
Сообщение от Аноним (4), 01-Дек-21, 13:06 | ||
Всё как у дистрибутивов. Теперь по фен-шую. | ||
Ответить | Правка | Наверх | Cообщить модератору |
29. "Релиз системы распознавания текста Tesseract 5.0" | +1 +/– | |
Сообщение от Аноним (29), 01-Дек-21, 15:32 | ||
Всё как у других IT-проектов. | ||
Ответить | Правка | Наверх | Cообщить модератору |
41. "Релиз системы распознавания текста Tesseract 5.0" | +2 +/– | |
Сообщение от Тот_Самый_Анонимус (?), 01-Дек-21, 18:57 | ||
>Всё как патрия приказала. | ||
Ответить | Правка | К родителю #4 | Наверх | Cообщить модератору |
51. "Релиз системы распознавания текста Tesseract 5.0" | +2 +/– | |
Сообщение от Аноним (51), 02-Дек-21, 03:28 | ||
Это свобода, как говорят у них там | ||
Ответить | Правка | Наверх | Cообщить модератору |
54. "Релиз системы распознавания текста Tesseract 5.0" | –1 +/– | |
Сообщение от Аноним (54), 02-Дек-21, 09:33 | ||
это единственное, что привело к такому увеличению номера версии. блм и прочие чернильники только так узнают безопасность продукта. | ||
Ответить | Правка | К родителю #3 | Наверх | Cообщить модератору |
80. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Анонимян (?), 06-Дек-21, 12:09 | ||
Это самое важное! Лишь бы не оскорблять нигеров. Хотя казалось бы , неужели они читают сорцы? | ||
Ответить | Правка | К родителю #3 | Наверх | Cообщить модератору |
5. "Релиз системы распознавания текста Tesseract 5.0" | +3 +/– | |
Сообщение от anonymous (??), 01-Дек-21, 13:10 | ||
Так 5.0 или 4.1?! Вы уж там как-нибудь определитесь. | ||
Ответить | Правка | Наверх | Cообщить модератору |
8. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от anonymous (??), 01-Дек-21, 13:24 | ||
По ходу зарелизился 4.1, а теперь начинается развитие 5. | ||
Ответить | Правка | Наверх | Cообщить модератору |
10. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от s.d.s. (?), 01-Дек-21, 13:37 | ||
https://github.com/tesseract-ocr/tesseract/releases/tag/5.0.0 | ||
Ответить | Правка | Наверх | Cообщить модератору |
13. "Релиз системы распознавания текста Tesseract 5.0" | +2 +/– | |
Сообщение от nymous (?), 01-Дек-21, 13:55 | ||
4.1.0 Release | ||
Ответить | Правка | К родителю #5 | Наверх | Cообщить модератору |
14. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от nymous (?), 01-Дек-21, 13:56 | ||
Так и есть | ||
Ответить | Правка | Наверх | Cообщить модератору |
30. "Релиз системы распознавания текста Tesseract 5.0" | +9 +/– | |
Сообщение от Аноним (29), 01-Дек-21, 15:33 | ||
5 + 0 == 4 + 1 | ||
Ответить | Правка | К родителю #5 | Наверх | Cообщить модератору |
6. "Релиз системы распознавания текста Tesseract 5.0" | +4 +/– | |
Сообщение от Аноним (6), 01-Дек-21, 13:11 | ||
Проприетарные типы данных? | ||
Ответить | Правка | Наверх | Cообщить модератору |
15. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним (15), 01-Дек-21, 14:03 | ||
Тоже удивился. | ||
Ответить | Правка | Наверх | Cообщить модератору |
17. "Релиз системы распознавания текста Tesseract 5.0" | +2 +/– | |
Сообщение от Аноним (17), 01-Дек-21, 14:08 | ||
Да чушь какая-то в новости. | ||
Ответить | Правка | К родителю #6 | Наверх | Cообщить модератору |
46. "Релиз системы распознавания текста Tesseract 5.0" | +1 +/– | |
Сообщение от Аноним (46), 01-Дек-21, 22:10 | ||
Это просто перевод кривой. Propietary переводится как собственный, что в контексте типов данных — вполне нормальный эпитет. | ||
Ответить | Правка | Наверх | Cообщить модератору |
53. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним (52), 02-Дек-21, 06:05 | ||
Не знаю на счёт проприетарной алгебры, но незаконные числа уже есть: | ||
Ответить | Правка | К родителю #6 | Наверх | Cообщить модератору |
7. "Релиз системы распознавания текста Tesseract 5.0" | +1 +/– | |
Сообщение от Аноним (7), 01-Дек-21, 13:23 | ||
Довольно слабо распознаёт, я не знаю. Но лучше всё равно ничего нет. Приходится возиться с наложением фильтров, контрастностью, монохромными форматами и всем остальным. Как у гугла на телефонах работает распознование? Другие модели? | ||
Ответить | Правка | Наверх | Cообщить модератору |
9. "Релиз системы распознавания текста Tesseract 5.0" | +1 +/– | |
Сообщение от Кир (?), 01-Дек-21, 13:31 | ||
Странно, по моему опыту -- распознает шикарно: без ошибок распознает даже не слишком качественные фотки с телефона. Можно пример плохо распознанного текста (ссылочку на картинку)? | ||
Ответить | Правка | Наверх | Cообщить модератору |
11. "Релиз системы распознавания текста Tesseract 5.0" | +1 +/– | |
Сообщение от Аноним (7), 01-Дек-21, 13:38 | ||
Любой текст. Мне иероглифы распознавать надо. -_- | ||
Ответить | Правка | Наверх | Cообщить модератору |
12. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним (17), 01-Дек-21, 13:47 | ||
Как показывает практика, 90% успеха - в препроцессинге картиночки. | ||
Ответить | Правка | Наверх | Cообщить модератору |
18. "Релиз системы распознавания текста Tesseract 5.0" | +4 +/– | |
Сообщение от Аноним (18), 01-Дек-21, 14:09 | ||
Лучше FineReaderа ничего не знаю. | ||
Ответить | Правка | К родителю #11 | Наверх | Cообщить модератору |
19. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от ананоша (?), 01-Дек-21, 14:11 | ||
По моему опыту в 4.х есть проблемки, потратил несколько недель чтобы добиться корректного распознавания, но все равно есть ошибки на ровном месте, иногда вместо одного символа определяет два других, смешновато получается. Очень ждал 5ый релиз, надеюсь ситуация улучшилась, осталось дождаться порта на жс :) | ||
Ответить | Правка | К родителю #9 | Наверх | Cообщить модератору |
38. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от lockywolf (ok), 01-Дек-21, 17:35 | ||
Он чувствителен к искажениям картинки. Так то распознаёт хорошо, но именно распознаёт. | ||
Ответить | Правка | К родителю #7 | Наверх | Cообщить модератору |
55. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним (55), 02-Дек-21, 10:38 | ||
> лучше всё равно ничего нет | ||
Ответить | Правка | К родителю #7 | Наверх | Cообщить модератору |
62. "Релиз системы распознавания текста Tesseract 5.0" | +1 +/– | |
Сообщение от Аноним (7), 02-Дек-21, 12:59 | ||
Сравнивали, сравнивали. Китайского нет в списке поддерживаемых -- толку с него как с козла молока. Последний раз шевелилось 10+ лет назад. Спасибо, сами используйте. | ||
Ответить | Правка | Наверх | Cообщить модератору |
66. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Jh (?), 02-Дек-21, 22:52 | ||
ну не знаю, для бесплатного вполне прилично. Если распечатать текст и отсканировать, то практически 100%. | ||
Ответить | Правка | К родителю #7 | Наверх | Cообщить модератору |
68. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним (7), 02-Дек-21, 23:02 | ||
Нестандартные красивые шрифты вообще не распознаёт. | ||
Ответить | Правка | Наверх | Cообщить модератору |
16. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним (18), 01-Дек-21, 14:08 | ||
>базирующийся на применении системы машинного обучения на базе рекуррентной нейронной сети LSTM | ||
Ответить | Правка | Наверх | Cообщить модератору |
27. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Nuzhny (?), 01-Дек-21, 15:26 | ||
Так текст - это и есть последовательность. Вполне можно распознать символы и для каждого выдать топ-3 самых вероятных, а дальше скормить эту последовательность символов в тот же LSTM для исправления ошибок распознавания. | ||
Ответить | Правка | Наверх | Cообщить модератору |
44. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним (18), 01-Дек-21, 21:14 | ||
>Так текст - это и есть последовательность. Вполне можно распознать символы и для каждого выдать топ-3 самых вероятных, а дальше скормить эту последовательность символов в тот же LSTM | ||
Ответить | Правка | Наверх | Cообщить модератору |
34. "Релиз системы распознавания текста Tesseract 5.0" | +3 +/– | |
Сообщение от Андрей (??), 01-Дек-21, 16:05 | ||
При посимвольном распознавании будет много опечаток-ошибок, поэтому распознают словами-последовательностями, для чего собсна и используют ЛСТМ. | ||
Ответить | Правка | К родителю #16 | Наверх | Cообщить модератору |
20. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним (-), 01-Дек-21, 14:16 | ||
Djvu распознавать уже осилили? | ||
Ответить | Правка | Наверх | Cообщить модератору |
21. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Tesseract50 (?), 01-Дек-21, 14:23 | ||
За километр распознаю, и со словами "мусорное ненужно из прошлого века" удаляю. | ||
Ответить | Правка | Наверх | Cообщить модератору |
61. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним (-), 02-Дек-21, 12:49 | ||
> Изначально система была создана в 1985-1995 годах в лаборатории компании Hewlett Packard | ||
Ответить | Правка | Наверх | Cообщить модератору |
24. "Релиз системы распознавания текста Tesseract 5.0" | +1 +/– | |
Сообщение от Аноним (24), 01-Дек-21, 14:27 | ||
Предварительно генерируй изображения страниц через ddjvu, распознавай. То же и распознавания любых PDF и касается - Ghostscript в помощь. | ||
Ответить | Правка | К родителю #20 | Наверх | Cообщить модератору |
63. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним (63), 02-Дек-21, 16:13 | ||
Давно уже видел скрипт на perl, который разбирает djvu на картинки (ddjvu), распознает их tesseract, и запихивает результат обратно в djvu текстовым слоем | ||
Ответить | Правка | К родителю #20 | Наверх | Cообщить модератору |
65. "Релиз системы распознавания текста Tesseract 5.0" | –1 +/– | |
Сообщение от Аноним (-), 02-Дек-21, 17:26 | ||
Нужно в epub из всяких djvu и pdf и желательно без костылей, а напрямую. Finereader, к примеру, так умеет. | ||
Ответить | Правка | Наверх | Cообщить модератору |
69. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним (63), 02-Дек-21, 23:44 | ||
epub теряет look&feel оригинального документа. Он может быть довеском к djvu для тех, кто читает с телефона, но реально djvu не заменит для старых сканированных доков. | ||
Ответить | Правка | Наверх | Cообщить модератору |
73. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним (73), 03-Дек-21, 11:31 | ||
Ну тут я бы не был столь категоричен. Потеря look&feel - это скорее проблема fb2, a не epub | ||
Ответить | Правка | Наверх | Cообщить модератору |
22. "Релиз системы распознавания текста Tesseract 5.0" | +3 +/– | |
Сообщение от Аноним (22), 01-Дек-21, 14:26 | ||
больше всего не хватает сегментирования текста как в файнридере | ||
Ответить | Правка | Наверх | Cообщить модератору |
39. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним (39), 01-Дек-21, 18:15 | ||
Оно там есть как минимум с версии 3, но таблицы действительно до сих пор не распознает. | ||
Ответить | Правка | Наверх | Cообщить модератору |
25. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним (24), 01-Дек-21, 14:29 | ||
Какие-то бенчмарки 4.1 vs 5.0 уже подвезли? | ||
Ответить | Правка | Наверх | Cообщить модератору |
31. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Иваня (?), 01-Дек-21, 15:38 | ||
Чем оно лучше PaddleOCR? 🤔 | ||
Ответить | Правка | Наверх | Cообщить модератору |
37. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним (24), 01-Дек-21, 16:39 | ||
А PaddleOCR чем лучше? Распознаёт точнее, работает быстрее? | ||
Ответить | Правка | Наверх | Cообщить модератору |
43. "Релиз системы распознавания текста Tesseract 5.0" | –1 +/– | |
Сообщение от Неанон (?), 01-Дек-21, 19:43 | ||
да | ||
Ответить | Правка | Наверх | Cообщить модератору |
49. "Релиз системы распознавания текста Tesseract 5.0" | +2 +/– | |
Сообщение от Аноним (-), 02-Дек-21, 00:55 | ||
А где твои тесты, сравнения, анализ? | ||
Ответить | Правка | Наверх | Cообщить модератору |
32. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от макпыф (ok), 01-Дек-21, 15:39 | ||
> Релиз системы распознавания текста Tesseract 5.0 | ||
Ответить | Правка | Наверх | Cообщить модератору |
36. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним12345 (?), 01-Дек-21, 16:39 | ||
Насколько я помню, лет 5 назад с тренировкой моделей и распознаванием текста было не очень | ||
Ответить | Правка | Наверх | Cообщить модератору |
40. "Релиз системы распознавания текста Tesseract 5.0" | +5 +/– | |
Сообщение от Аноним (-), 01-Дек-21, 18:38 | ||
А нормальное GUI-приложение когда появится, а не васянские поделки? | ||
Ответить | Правка | Наверх | Cообщить модератору |
45. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним (39), 01-Дек-21, 21:41 | ||
А какие критерии нормальности? Имхо, 95% случаев gImageReader более чем достаточно. | ||
Ответить | Правка | Наверх | Cообщить модератору |
48. "Релиз системы распознавания текста Tesseract 5.0" | +5 +/– | |
Сообщение от Аноним (-), 02-Дек-21, 00:54 | ||
Ты FineReader видел? Можно хотя-бы 10% его функциональности и нормальный человеческий интерфейс? | ||
Ответить | Правка | Наверх | Cообщить модератору |
50. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним (50), 02-Дек-21, 01:55 | ||
А что входит в эти 10% процентов? | ||
Ответить | Правка | Наверх | Cообщить модератору |
59. "Релиз системы распознавания текста Tesseract 5.0" | +1 +/– | |
Сообщение от Аноним (59), 02-Дек-21, 12:10 | ||
Ты цену на его серверную (да-да, есть, linoops compatible) версию без ограничений использования видел? А то - да, можно - и интерфейс человеческий, rest api. | ||
Ответить | Правка | К родителю #48 | Наверх | Cообщить модератору |
67. "Релиз системы распознавания текста Tesseract 5.0" | +1 +/– | |
Сообщение от Jh (?), 02-Дек-21, 22:56 | ||
Сколько стоит лицензия на файнридер? | ||
Ответить | Правка | К родителю #48 | Наверх | Cообщить модератору |
75. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним (24), 03-Дек-21, 13:21 | ||
https://github.com/manisandro/gImageReader выглядит довольно неплохо. | ||
Ответить | Правка | К родителю #40 | Наверх | Cообщить модератору |
42. "Релиз системы распознавания текста Tesseract 5.0" | +1 +/– | |
Сообщение от anonymous (??), 01-Дек-21, 19:21 | ||
> поддерживающей распознавание символов UTF-8 | ||
Ответить | Правка | Наверх | Cообщить модератору |
77. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним (77), 03-Дек-21, 17:41 | ||
"распознавание всех символов входящих в кодировку УТФ-8" | ||
Ответить | Правка | Наверх | Cообщить модератору |
47. "Релиз системы распознавания текста Tesseract 5.0" | –1 +/– | |
Сообщение от Аноним (47), 02-Дек-21, 00:21 | ||
А "готовые натренированные модели" не обновлялись? Для нейросетей главное даже не движек, а чтоб сами сети качественными были. | ||
Ответить | Правка | Наверх | Cообщить модератору |
79. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним (79), 05-Дек-21, 12:49 | ||
Забавно! Было слово "движок", потом человек за недостаточностью грамотности подумал (или увидел где-то), что там "ё". Будучи нелюбителем "ё" (или лениво её печатать), стал писать "движек". И вот, теперь это похоже на какую-то чешскую фамилию :) | ||
Ответить | Правка | Наверх | Cообщить модератору |
56. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним (55), 02-Дек-21, 10:40 | ||
> YAGF | ||
Ответить | Правка | Наверх | Cообщить модератору |
57. "Релиз системы распознавания текста Tesseract 5.0" | –1 +/– | |
Сообщение от InuYasha (??), 02-Дек-21, 11:26 | ||
Быдстограм нормально парсит. Гламурные кисы под колпаком. | ||
Ответить | Правка | Наверх | Cообщить модератору |
71. "Релиз системы распознавания текста Tesseract 5.0" | +1 +/– | |
Сообщение от Аноним (71), 03-Дек-21, 09:55 | ||
Ну теперь то появится бесплатный софт распозначание текста? | ||
Ответить | Правка | Наверх | Cообщить модератору |
74. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Аноним (24), 03-Дек-21, 13:16 | ||
FineReader и так бесплатен в торрентах. Лучше него всё равно ничего нет. | ||
Ответить | Правка | Наверх | Cообщить модератору |
82. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Vasyan (??), 07-Дек-21, 22:31 | ||
Есь и много, САБЖ, например. | ||
Ответить | Правка | Наверх | Cообщить модератору |
81. "Релиз системы распознавания текста Tesseract 5.0" | +/– | |
Сообщение от Vasyan (??), 07-Дек-21, 22:30 | ||
Типа раньше небыло. | ||
Ответить | Правка | К родителю #71 | Наверх | Cообщить модератору |
Архив | Удалить |
Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема |
Закладки на сайте Проследить за страницей |
Created 1996-2024 by Maxim Chirkov Добавить, Поддержать, Вебмастеру |