forum.opennet.ru - "Выпуск системы распознавания текста GNU Ocrad 0.28" (40)

"Выпуск системы распознавания текста GNU Ocrad 0.28"

Форум Разговоры, обсуждение новостей
Вариант для распечатки		Пред. тема \| След. тема
Изначальное сообщение		[ Отслеживать ]

"Выпуск системы распознавания текста GNU Ocrad 0.28"	+/–
Сообщение от opennews (??), 21-Янв-22, 08:30
После трёх лет с момента прошлого выпуска сформирован релиз системы распознавания текста Ocrad 0.28 (Optical Character Recognition), развиваемой под эгидой проекта GNU. Ocrad может применяться как в форме библиотеки для интеграции функций OCR в другие приложения, так и в форме обособленной утилиты, которая на основе переданного на вход изображения выдаёт текст в UTF-8 или 8-битных кодировках... Подробнее: https://www.opennet.me/opennews/art.shtml?num=56553
Ответить \| Правка \| Cообщить модератору

Оглавление

Ваша новость очень важна для нас , Аноним (1), 08:30 , 21-Янв-22, (1) +31

распознавание символов - это буквально самое первое, чему учат в TensorFlow Эда, Аноним (3), 08:43 , 21-Янв-22, (3) –5

Если кому-то нужны не шашечки, а ехать тот же tesseract можно обучать самому А , Аноним (6), 10:48 , 21-Янв-22, (6) +2

Ну да Тоже про tesseract подумал А сабж едва едва только научился один распрост, rvs2016 (ok), 12:33 , 21-Янв-22, (9)

Сабж нужен чтобы взять и запустить, а не учиться тензорфлоу, программировать и, , Урри (ok), 16:40 , 21-Янв-22, (14) +1

так у тессеракта также - просто собираешь и скармливаешь ему нужную сетку словар, Андрей (??), 17:50 , 21-Янв-22, (16)

Ну я просто рассказал о том, что знаю и использовал А что, действительно работае, Урри (ok), 18:27 , 21-Янв-22, (18)

Распознавал капчу tesseract, а картинку подготавливал плагинами для GIMP на пито, Аноним (28), 00:24 , 22-Янв-22, (28)

господа, вы о чём тессеракт уже много лет из коробки русский знает проблема то, лютый жабби__ (?), 08:50 , 23-Янв-22, (36)

Дядя Распознаванию символов учили ещё в самом начале девяностых И уже тогда эт, Аноним (23), 23:55 , 21-Янв-22, (23) +1
Распознавание символов никому не нужно Все хотят распознавание документов с пон, Nuzhny (?), 00:04 , 23-Янв-22, (33) +3

GNU как обычно собирает лучших представителей Большой успех за 19 лет разработ, Аноним (2), 08:33 , 21-Янв-22, (2) +6
А можно ли его научить показывать автобусы, лодки, или самолёты на картинке Спр, lockywolf (ok), 08:44 , 21-Янв-22, (4) +3

Можно, но это он научится делать лет через 15-20 - , _hide_ (ok), 10:29 , 21-Янв-22, (5)
В tesseract можно Юникодный моноцветный думаю легко можно научить распознавать , Аноним (6), 10:49 , 21-Янв-22, (7) +2
Возьми https pjreddie com darknet yolo , она умеет из коробки https www yout, Урри (ok), 16:43 , 21-Янв-22, (15)

Оно запущено через дев сервер от джанги Ржу всем офисом над этой поделкой , Аноним (28), 00:19 , 22-Янв-22, (27) –4

Оно запускается через git clone и make Уверен, что не над тобой весь офис ржет , Урри (ok), 14:24 , 22-Янв-22, (29) +4

А есть что готовое кроме Tesseract и CuneiForm, что можно легко и быстро использ, Аноним (8), 12:26 , 21-Янв-22, (8) +1

Abbyy fine reader server for Linux , lockywolf (ok), 14:37 , 21-Янв-22, (13) –1

это оно ABBYY CLI OCR for Linux - End of Life as of 31 March 2020, Аноним (38), 08:16 , 24-Янв-22, (38)

Можно его в Докере запустить, со старыми библиотеками , lockywolf (ok), 08:43 , 24-Янв-22, (39)

Отсутствие поддержки кириллицы просто означает, что надо найти энтузиастов, орга, Аноним (10), 12:41 , 21-Янв-22, (10) +1

Или послать нах гнутое поделие и пользоваться нормальным софтом Как тебе такое,, Тот_Самый_Анонимус (?), 23:38 , 21-Янв-22, (22) –1

Хороший специалист всегда востребован Чтобы быть хорошим специалистом, надо трен, Аноним (10), 00:19 , 22-Янв-22, (26)

ищет восторженных энтузи W лохов, готовых забесплатно доделать потенциально п, IRASoldier_registered (ok), 04:04 , 23-Янв-22, (34) –1
В принципе есть рациональное зерно Только гну и прочие гпл имеют недостаток пр, Тот_Самый_Анонимус (?), 09:09 , 23-Янв-22, (37) +1

Самая убогая из программ распознавания Доля ошибок 10-70 в идеальных условиях,, Аноним (11), 14:13 , 21-Янв-22, (11) +1

Ты не понимаешь, это всё не важно Единственно важные вещи слово GNU в названии, Аноним (12), 14:27 , 21-Янв-22, (12)
когда программа пытается думать и заменяет целые слова особенно смешно, когда н, Аноним (17), 18:14 , 21-Янв-22, (17)
CuneiForm разве живой - это убогое Г из 90-ых Оно сдохло вроде, но выкинув исх, Аноним (-), 18:35 , 21-Янв-22, (19) +1

да, забыл сказать - код их овно , Аноним (-), 18:36 , 21-Янв-22, (20) +1
В таком случае, ocrad -- убожество, которое было стыдно показывать в 1980х Даже, Аноним (11), 19:45 , 21-Янв-22, (21) –1
apt install cuneiform -y, Аноним (30), 14:43 , 22-Янв-22, (30)

По сравнению с ABBYY это конечно, говнo , Аноним (23), 23:56 , 21-Янв-22, (24) –2

А, под винду бинарников нет Не нужно , Аноним (23), 00:05 , 22-Янв-22, (25) –1
если он исходники выложит тогда о сравнении и поговорим А так нет предмета срав, Аноним (30), 16:53 , 22-Янв-22, (31)

Документ на русском языке, Аноним (32), 19:23 , 22-Янв-22, (32) –1
Предмет сравнения инструментов есть всегда - результат работы этих инструментов , IRASoldier_registered (ok), 04:07 , 23-Янв-22, (35) +2

Он говно по сравнению с ABBYY, tesseract, cuneiform, ReadIris и, наверняка, ещё , Аноним (40), 01:54 , 25-Янв-22, (40)

Сообщения [Сортировка по времени | RSS]

1. "Выпуск системы распознавания текста GNU Ocrad 0.28" +31 +/–

Сообщение от Аноним (1), 21-Янв-22, 08:30

> поддержка кириллицы отсутствует
Ваша новость очень важна для нас.

Ответить | Правка | Наверх | Cообщить модератору

3. "Выпуск системы распознавания текста GNU Ocrad 0.28" –5 +/–

Сообщение от Аноним (3), 21-Янв-22, 08:43

распознавание символов - это буквально самое первое, чему учат в TensorFlow. Эдакий хелловорлд от нейросетей. В этой связи нафиг нужен сабж, да еще и без кириллицы - не ясно.

Ответить | Правка | Наверх | Cообщить модератору

6. "Выпуск системы распознавания текста GNU Ocrad 0.28" +2 +/–

Сообщение от Аноним (6), 21-Янв-22, 10:48

Если кому-то нужны не шашечки, а ехать тот же tesseract можно обучать самому. А сабж походу не обучаемый, как минимум бегло в мануле я про это ничего не нашел.

Ответить | Правка | Наверх | Cообщить модератору

9. "Выпуск системы распознавания текста GNU Ocrad 0.28" +/–

Сообщение от rvs2016 (ok), 21-Янв-22, 12:33

> Если кому-то нужны не шашечки, а ехать тот же tesseract
Ну да. Тоже про tesseract подумал.
А сабж едва едва только научился один распространённый формат распознавать - PNG.
А остальные форматы наверно лет через 20 научится распознавать?

Ответить | Правка | Наверх | Cообщить модератору

14. "Выпуск системы распознавания текста GNU Ocrad 0.28" +1 +/–

Сообщение от Урри (ok), 21-Янв-22, 16:40

Сабж нужен чтобы взять и запустить, а не учиться тензорфлоу, программировать и, главное, долго и нудно обучать.

Ответить | Правка | К родителю #3 | Наверх | Cообщить модератору

16. "Выпуск системы распознавания текста GNU Ocrad 0.28" +/–

Сообщение от Андрей (??), 21-Янв-22, 17:50

так у тессеракта также - просто собираешь и скармливаешь ему нужную сетку/словарь, только с поддержкой кучи языков

Ответить | Правка | Наверх | Cообщить модератору

18. "Выпуск системы распознавания текста GNU Ocrad 0.28" +/–

Сообщение от Урри (ok), 21-Янв-22, 18:27

Ну я просто рассказал о том, что знаю и использовал.
А что, действительно работает? Вы пробовали?
https://nanonets.com/blog/ocr-with-tesseract/

Ответить | Правка | Наверх | Cообщить модератору

28. "Выпуск системы распознавания текста GNU Ocrad 0.28" +/–

Сообщение от Аноним (28), 22-Янв-22, 00:24

Распознавал капчу tesseract, а картинку подготавливал плагинами для GIMP на питоне. Все работало точность распознавания была выше 50%. Чего хватало.
Кстати в последних гимпах из коробки не идет функционал написания плагинов на питоне, его надо с бубном ставить.

Ответить | Правка | Наверх | Cообщить модератору

36. "Выпуск системы распознавания текста GNU Ocrad 0.28" +/–

Сообщение от лютый жабби__ (?), 23-Янв-22, 08:50

>просто собираешь и скармливаешь ему нужную сетку/словарь, только с поддержкой кучи языков
господа, вы о чём? тессеракт уже много лет из коробки русский знает. проблема только с несколькими языками на одной странице (и то может уже ОК)

Ответить | Правка | К родителю #16 | Наверх | Cообщить модератору

23. "Выпуск системы распознавания текста GNU Ocrad 0.28" +1 +/–

Сообщение от Аноним (23), 21-Янв-22, 23:55

Дядя. Распознаванию символов учили ещё в самом начале девяностых. И уже тогда это сносно работало. Двигай со своим TensorFlow в Windows 3.1, давай!

Ответить | Правка | К родителю #3 | Наверх | Cообщить модератору

33. "Выпуск системы распознавания текста GNU Ocrad 0.28" +3 +/–

Сообщение от Nuzhny (?), 23-Янв-22, 00:04

Распознавание символов никому не нужно. Все хотят распознавание документов с пониманием его внутренней структуры (таблицы, колонки, графики, чертежи), превращение скана в читабельный документ, исправление ошибок от засветки, геометрических и оптических искажений, понимания языка всего текста и его частей (термины на другом языке внутри текста), семантическое выделение отдельных частей (заголовки, шапки, подписи, даты и т.п.)

Ответить | Правка | К родителю #3 | Наверх | Cообщить модератору

2. "Выпуск системы распознавания текста GNU Ocrad 0.28" +6 +/–

Сообщение от Аноним (2), 21-Янв-22, 08:33

GNU как обычно собирает лучших представителей. Большой успех за 19+ лет разработки.

Ответить | Правка | Наверх | Cообщить модератору

4. "Выпуск системы распознавания текста GNU Ocrad 0.28" +3 +/–

Сообщение от lockywolf (ok), 21-Янв-22, 08:44

А можно ли его научить показывать автобусы, лодки, или самолёты на картинке? Спрашиваю для сестры.

Ответить | Правка | Наверх | Cообщить модератору

5. "Выпуск системы распознавания текста GNU Ocrad 0.28" +/–

Сообщение от _hide_ (ok), 21-Янв-22, 10:29

Можно, но это он научится делать лет через 15-20 (((-:

Ответить | Правка | Наверх | Cообщить модератору

7. "Выпуск системы распознавания текста GNU Ocrad 0.28" +2 +/–

Сообщение от Аноним (6), 21-Янв-22, 10:49

В tesseract можно. Юникодный моноцветный думаю легко можно научить распознавать.

Ответить | Правка | К родителю #4 | Наверх | Cообщить модератору

15. "Выпуск системы распознавания текста GNU Ocrad 0.28" +/–

Сообщение от Урри (ok), 21-Янв-22, 16:43

Возьми https://pjreddie.com/darknet/yolo/, она умеет из коробки.
https://www.youtube.com/watch?v=MPU2HistivI

Ответить | Правка | К родителю #4 | Наверх | Cообщить модератору

27. "Выпуск системы распознавания текста GNU Ocrad 0.28" –4 +/–

Сообщение от Аноним (28), 22-Янв-22, 00:19

Оно запущено через дев сервер от джанги. Ржу всем офисом над этой поделкой.

Ответить | Правка | Наверх | Cообщить модератору

29. "Выпуск системы распознавания текста GNU Ocrad 0.28" +4 +/–

Сообщение от Урри (ok), 22-Янв-22, 14:24

> Оно запущено через дев сервер от джанги. Ржу всем офисом над этой
> поделкой.
Оно запускается через git clone и make.
Уверен, что не над тобой весь офис ржет?

Ответить | Правка | Наверх | Cообщить модератору

8. "Выпуск системы распознавания текста GNU Ocrad 0.28" +1 +/–

Сообщение от Аноним (8), 21-Янв-22, 12:26

А есть что готовое кроме Tesseract и CuneiForm, что можно легко и быстро использовать (включая кириллицу)?

Ответить | Правка | Наверх | Cообщить модератору

13. "Выпуск системы распознавания текста GNU Ocrad 0.28" –1 +/–

Сообщение от lockywolf (ok), 21-Янв-22, 14:37

Abbyy fine reader server for Linux.

Ответить | Правка | Наверх | Cообщить модератору

38. "Выпуск системы распознавания текста GNU Ocrad 0.28" +/–

Сообщение от Аноним (38), 24-Янв-22, 08:16

это оно?
ABBYY CLI OCR for Linux - End of Life as of 31 March 2020

Ответить | Правка | Наверх | Cообщить модератору

39. "Выпуск системы распознавания текста GNU Ocrad 0.28" +/–

Сообщение от lockywolf (ok), 24-Янв-22, 08:43

> это оно?
> ABBYY CLI OCR for Linux - End of Life as of 31
> March 2020
Можно его в Докере запустить, со старыми библиотеками.

Ответить | Правка | Наверх | Cообщить модератору

10. "Выпуск системы распознавания текста GNU Ocrad 0.28" +1 +/–

Сообщение от Аноним (10), 21-Янв-22, 12:41

Отсутствие поддержки кириллицы просто означает, что надо найти энтузиастов, организовать их и запилить поддержку.
А если не получается, значит не очень-то она и востребована.

Ответить | Правка | Наверх | Cообщить модератору

22. "Выпуск системы распознавания текста GNU Ocrad 0.28" –1 +/–

Сообщение от Тот_Самый_Анонимус (?), 21-Янв-22, 23:38

Или послать нах гнутое поделие и пользоваться нормальным софтом. Как тебе такое, анон?

Ответить | Правка | Наверх | Cообщить модератору

26. "Выпуск системы распознавания текста GNU Ocrad 0.28" +/–

Сообщение от Аноним (10), 22-Янв-22, 00:19

Хороший специалист всегда востребован.
Чтобы быть хорошим специалистом, надо тренироваться много и всегда.
Чтобы было, на чём тренироваться, нужны проекты, в которых что-то не реализовано и что следовало бы реализовать.
Поэтому недопиленные проекты -- это возможности для тех, кто может.
-- учись конструктивно мыслить.

Ответить | Правка | Наверх | Cообщить модератору

34. "Выпуск системы распознавания текста GNU Ocrad 0.28" –1 +/–

Сообщение от IRASoldier_registered (ok), 23-Янв-22, 04:04

>Поэтому недопиленные проекты -- это возможности для тех, кто
...ищет восторженных энтузи^W лохов, готовых забесплатно доделать потенциально перспективный продукт.

Ответить | Правка | Наверх | Cообщить модератору

37. "Выпуск системы распознавания текста GNU Ocrad 0.28" +1 +/–

Сообщение от Тот_Самый_Анонимус (?), 23-Янв-22, 09:09

> Поэтому недопиленные проекты -- это возможности для тех, кто может.
В принципе есть рациональное зерно. Только гну и прочие гпл имеют недостаток: придётся на них работать. Фонд очень не любит принимать код под своей лицензией, они предпочитают передачу прав.
Так что амбициозный человек предпочтёт более свободные проекты (под бсд, или апачем), дающие ему право распоряжаться своим кодом на своё усмотрение, а не навязывающие глупые условия. И, как я и сказал ранее, пошлёт нах гнутое поделие.

Ответить | Правка | К родителю #26 | Наверх | Cообщить модератору

11. "Выпуск системы распознавания текста GNU Ocrad 0.28" +1 +/–

Сообщение от Аноним (11), 21-Янв-22, 14:13

Самая убогая из программ распознавания. Доля ошибок 10-70% в идеальных условиях, когда Tesseract и CuneiForm дают менее 1%.

Ответить | Правка | Наверх | Cообщить модератору

12. "Выпуск системы распознавания текста GNU Ocrad 0.28" +/–

Сообщение от Аноним (12), 21-Янв-22, 14:27

Ты не понимаешь, это всё не важно. Единственно важные вещи: слово GNU в названии, лицензия GPL и передача копирайтов фонду GNU.

Ответить | Правка | Наверх | Cообщить модератору

17. "Выпуск системы распознавания текста GNU Ocrad 0.28" +/–

Сообщение от Аноним (17), 21-Янв-22, 18:14

когда программа пытается думать и заменяет целые слова? особенно смешно, когда новообразование вписывается в контекст и вычитка становится нетривиальной

Ответить | Правка | К родителю #11 | Наверх | Cообщить модератору

19. "Выпуск системы распознавания текста GNU Ocrad 0.28" +1 +/–

Сообщение от Аноним (-), 21-Янв-22, 18:35

CuneiForm разве живой? - это убогое Г из 90-ых. Оно сдохло вроде, но выкинув исходники.

Ответить | Правка | К родителю #11 | Наверх | Cообщить модератору

20. "Выпуск системы распознавания текста GNU Ocrad 0.28" +1 +/–

Сообщение от Аноним (-), 21-Янв-22, 18:36

да, забыл сказать - код их овно.

Ответить | Правка | Наверх | Cообщить модератору

21. "Выпуск системы распознавания текста GNU Ocrad 0.28" –1 +/–

Сообщение от Аноним (11), 21-Янв-22, 19:45

В таком случае, ocrad -- убожество, которое было стыдно показывать в 1980х. Даже до появления свободных Cuneiform и Tesseract он сливал свободному gocr.
А Cuneiform и Tesseract отлично работают.

Ответить | Правка | К родителю #19 | Наверх | Cообщить модератору

30. "Выпуск системы распознавания текста GNU Ocrad 0.28" +/–

Сообщение от Аноним (30), 22-Янв-22, 14:43

apt install cuneiform -y

Ответить | Правка | К родителю #19 | Наверх | Cообщить модератору

24. "Выпуск системы распознавания текста GNU Ocrad 0.28" –2 +/–

Сообщение от Аноним (23), 21-Янв-22, 23:56

По сравнению с ABBYY это. конечно, говнo?

Ответить | Правка | Наверх | Cообщить модератору

25. "Выпуск системы распознавания текста GNU Ocrad 0.28" –1 +/–

Сообщение от Аноним (23), 22-Янв-22, 00:05

А, под винду бинарников нет. Не нужно.

Ответить | Правка | Наверх | Cообщить модератору

31. "Выпуск системы распознавания текста GNU Ocrad 0.28" +/–

Сообщение от Аноним (30), 22-Янв-22, 16:53

> По сравнению с ABBYY
если он исходники выложит тогда о сравнении и поговорим. А так нет предмета сравнения.

Ответить | Правка | К родителю #24 | Наверх | Cообщить модератору

32. "Выпуск системы распознавания текста GNU Ocrad 0.28" –1 +/–

Сообщение от Аноним (32), 22-Янв-22, 19:23

Документ на русском языке

Ответить | Правка | Наверх | Cообщить модератору

35. "Выпуск системы распознавания текста GNU Ocrad 0.28" +2 +/–

Сообщение от IRASoldier_registered (ok), 23-Янв-22, 04:07

Предмет сравнения инструментов есть всегда - результат работы этих инструментов. А как и из чего производились инструменты интересно или узкому кругу специалистов, которые делают инструменты или религиозным фанатикам, боящимся оскверниться "нечистым" инструментом. Так что в первую очередь надо сравнивать качество сканов.

Ответить | Правка | К родителю #31 | Наверх | Cообщить модератору

40. "Выпуск системы распознавания текста GNU Ocrad 0.28" +/–

Сообщение от Аноним (40), 25-Янв-22, 01:54

Он говно по сравнению с ABBYY, tesseract, cuneiform, ReadIris и, наверняка, ещё кучей. Хотя в 2010 году существовали и успешно продавались сливавшие ему коммерческие системы.

Ответить | Правка | К родителю #24 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема

Партнёры:

Хостинг:

Закладки на сайте
Проследить за страницей

Created 1996-2026 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру

1. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+31 +/–
Сообщение от Аноним (1), 21-Янв-22, 08:30
> поддержка кириллицы отсутствует Ваша новость очень важна для нас.
Ответить \| Правка \| Наверх \| Cообщить модератору


	3. "Выпуск системы распознавания текста GNU Ocrad 0.28"	–5 +/–
	Сообщение от Аноним (3), 21-Янв-22, 08:43
	распознавание символов - это буквально самое первое, чему учат в TensorFlow. Эдакий хелловорлд от нейросетей. В этой связи нафиг нужен сабж, да еще и без кириллицы - не ясно.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	6. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+2 +/–
	Сообщение от Аноним (6), 21-Янв-22, 10:48
	Если кому-то нужны не шашечки, а ехать тот же tesseract можно обучать самому. А сабж походу не обучаемый, как минимум бегло в мануле я про это ничего не нашел.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	9. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+/–
	Сообщение от rvs2016 (ok), 21-Янв-22, 12:33
	> Если кому-то нужны не шашечки, а ехать тот же tesseract Ну да. Тоже про tesseract подумал. А сабж едва едва только научился один распространённый формат распознавать - PNG. А остальные форматы наверно лет через 20 научится распознавать?
	Ответить \| Правка \| Наверх \| Cообщить модератору


	14. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+1 +/–
	Сообщение от Урри (ok), 21-Янв-22, 16:40
	Сабж нужен чтобы взять и запустить, а не учиться тензорфлоу, программировать и, главное, долго и нудно обучать.
	Ответить \| Правка \| К родителю #3 \| Наверх \| Cообщить модератору


	16. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+/–
	Сообщение от Андрей (??), 21-Янв-22, 17:50
	так у тессеракта также - просто собираешь и скармливаешь ему нужную сетку/словарь, только с поддержкой кучи языков
	Ответить \| Правка \| Наверх \| Cообщить модератору


	18. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+/–
	Сообщение от Урри (ok), 21-Янв-22, 18:27
	Ну я просто рассказал о том, что знаю и использовал. А что, действительно работает? Вы пробовали? https://nanonets.com/blog/ocr-with-tesseract/
	Ответить \| Правка \| Наверх \| Cообщить модератору


	28. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+/–
	Сообщение от Аноним (28), 22-Янв-22, 00:24
	Распознавал капчу tesseract, а картинку подготавливал плагинами для GIMP на питоне. Все работало точность распознавания была выше 50%. Чего хватало. Кстати в последних гимпах из коробки не идет функционал написания плагинов на питоне, его надо с бубном ставить.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	36. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+/–
	Сообщение от лютый жабби__ (?), 23-Янв-22, 08:50
	>просто собираешь и скармливаешь ему нужную сетку/словарь, только с поддержкой кучи языков господа, вы о чём? тессеракт уже много лет из коробки русский знает. проблема только с несколькими языками на одной странице (и то может уже ОК)
	Ответить \| Правка \| К родителю #16 \| Наверх \| Cообщить модератору


	23. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+1 +/–
	Сообщение от Аноним (23), 21-Янв-22, 23:55
	Дядя. Распознаванию символов учили ещё в самом начале девяностых. И уже тогда это сносно работало. Двигай со своим TensorFlow в Windows 3.1, давай!
	Ответить \| Правка \| К родителю #3 \| Наверх \| Cообщить модератору


	33. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+3 +/–
	Сообщение от Nuzhny (?), 23-Янв-22, 00:04
	Распознавание символов никому не нужно. Все хотят распознавание документов с пониманием его внутренней структуры (таблицы, колонки, графики, чертежи), превращение скана в читабельный документ, исправление ошибок от засветки, геометрических и оптических искажений, понимания языка всего текста и его частей (термины на другом языке внутри текста), семантическое выделение отдельных частей (заголовки, шапки, подписи, даты и т.п.)
	Ответить \| Правка \| К родителю #3 \| Наверх \| Cообщить модератору

2. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+6 +/–
Сообщение от Аноним (2), 21-Янв-22, 08:33
GNU как обычно собирает лучших представителей. Большой успех за 19+ лет разработки.
Ответить \| Правка \| Наверх \| Cообщить модератору

4. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+3 +/–
Сообщение от lockywolf (ok), 21-Янв-22, 08:44
А можно ли его научить показывать автобусы, лодки, или самолёты на картинке? Спрашиваю для сестры.
Ответить \| Правка \| Наверх \| Cообщить модератору


	5. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+/–
	Сообщение от _hide_ (ok), 21-Янв-22, 10:29
	Можно, но это он научится делать лет через 15-20 (((-:
	Ответить \| Правка \| Наверх \| Cообщить модератору


	7. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+2 +/–
	Сообщение от Аноним (6), 21-Янв-22, 10:49
	В tesseract можно. Юникодный моноцветный думаю легко можно научить распознавать.
	Ответить \| Правка \| К родителю #4 \| Наверх \| Cообщить модератору


	15. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+/–
	Сообщение от Урри (ok), 21-Янв-22, 16:43
	Возьми https://pjreddie.com/darknet/yolo/, она умеет из коробки. https://www.youtube.com/watch?v=MPU2HistivI
	Ответить \| Правка \| К родителю #4 \| Наверх \| Cообщить модератору


	27. "Выпуск системы распознавания текста GNU Ocrad 0.28"	–4 +/–
	Сообщение от Аноним (28), 22-Янв-22, 00:19
	Оно запущено через дев сервер от джанги. Ржу всем офисом над этой поделкой.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	29. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+4 +/–
	Сообщение от Урри (ok), 22-Янв-22, 14:24
	> Оно запущено через дев сервер от джанги. Ржу всем офисом над этой > поделкой. Оно запускается через git clone и make. Уверен, что не над тобой весь офис ржет?
	Ответить \| Правка \| Наверх \| Cообщить модератору

8. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+1 +/–
Сообщение от Аноним (8), 21-Янв-22, 12:26
А есть что готовое кроме Tesseract и CuneiForm, что можно легко и быстро использовать (включая кириллицу)?
Ответить \| Правка \| Наверх \| Cообщить модератору


	13. "Выпуск системы распознавания текста GNU Ocrad 0.28"	–1 +/–
	Сообщение от lockywolf (ok), 21-Янв-22, 14:37
	Abbyy fine reader server for Linux.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	38. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+/–
	Сообщение от Аноним (38), 24-Янв-22, 08:16
	это оно? ABBYY CLI OCR for Linux - End of Life as of 31 March 2020
	Ответить \| Правка \| Наверх \| Cообщить модератору


	39. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+/–
	Сообщение от lockywolf (ok), 24-Янв-22, 08:43
	> это оно? > ABBYY CLI OCR for Linux - End of Life as of 31 > March 2020 Можно его в Докере запустить, со старыми библиотеками.
	Ответить \| Правка \| Наверх \| Cообщить модератору

10. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+1 +/–
Сообщение от Аноним (10), 21-Янв-22, 12:41
Отсутствие поддержки кириллицы просто означает, что надо найти энтузиастов, организовать их и запилить поддержку. А если не получается, значит не очень-то она и востребована.
Ответить \| Правка \| Наверх \| Cообщить модератору


	22. "Выпуск системы распознавания текста GNU Ocrad 0.28"	–1 +/–
	Сообщение от Тот_Самый_Анонимус (?), 21-Янв-22, 23:38
	Или послать нах гнутое поделие и пользоваться нормальным софтом. Как тебе такое, анон?
	Ответить \| Правка \| Наверх \| Cообщить модератору


	26. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+/–
	Сообщение от Аноним (10), 22-Янв-22, 00:19
	Хороший специалист всегда востребован. Чтобы быть хорошим специалистом, надо тренироваться много и всегда. Чтобы было, на чём тренироваться, нужны проекты, в которых что-то не реализовано и что следовало бы реализовать. Поэтому недопиленные проекты -- это возможности для тех, кто может. -- учись конструктивно мыслить.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	34. "Выпуск системы распознавания текста GNU Ocrad 0.28"	–1 +/–
	Сообщение от IRASoldier_registered (ok), 23-Янв-22, 04:04
	>Поэтому недопиленные проекты -- это возможности для тех, кто ...ищет восторженных энтузи^W лохов, готовых забесплатно доделать потенциально перспективный продукт.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	37. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+1 +/–
	Сообщение от Тот_Самый_Анонимус (?), 23-Янв-22, 09:09
	> Поэтому недопиленные проекты -- это возможности для тех, кто может. В принципе есть рациональное зерно. Только гну и прочие гпл имеют недостаток: придётся на них работать. Фонд очень не любит принимать код под своей лицензией, они предпочитают передачу прав. Так что амбициозный человек предпочтёт более свободные проекты (под бсд, или апачем), дающие ему право распоряжаться своим кодом на своё усмотрение, а не навязывающие глупые условия. И, как я и сказал ранее, пошлёт нах гнутое поделие.
	Ответить \| Правка \| К родителю #26 \| Наверх \| Cообщить модератору

11. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+1 +/–
Сообщение от Аноним (11), 21-Янв-22, 14:13
Самая убогая из программ распознавания. Доля ошибок 10-70% в идеальных условиях, когда Tesseract и CuneiForm дают менее 1%.
Ответить \| Правка \| Наверх \| Cообщить модератору


	12. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+/–
	Сообщение от Аноним (12), 21-Янв-22, 14:27
	Ты не понимаешь, это всё не важно. Единственно важные вещи: слово GNU в названии, лицензия GPL и передача копирайтов фонду GNU.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	17. "Выпуск системы распознавания текста GNU Ocrad 0.28"	+/–
	Сообщение от Аноним (17), 21-Янв-22, 18:14
	когда программа пытается думать и заменяет целые слова? особенно смешно, когда новообразование вписывается в контекст и вычитка становится нетривиальной
	Ответить \| Правка \| К родителю #11 \| Наверх \| Cообщить модератору