1.2, Аноним (2), 17:10, 07/07/2022 [ответить] [﹢﹢﹢] [ · · · ]
| +1 +/– |
Гугл последний раз раздавал модели (хоть какие-нибудь) 5 лет назад и не совсем понятно как можно натренировать свои собственные и сколько на это ресурсов потребуется (скорее всего много, недоступно много). Толку то с обновлений, если оно не распознаёт?
| |
|
2.4, Аноним12345 (?), 17:13, 07/07/2022 [^] [^^] [^^^] [ответить]
| –1 +/– |
В тессеракте как бы есть модель обучения, но она очень далека от обычных вычислительных мощностей
| |
|
|
|
3.10, tty0 (?), 18:52, 07/07/2022 [^] [^^] [^^^] [ответить]
| +1 +/– |
Я проверю, но мне так кажется, что проблема только в настройках контрастности (раньше так было). Не забуду - попробую.
| |
|
2.16, Аноним (16), 04:36, 08/07/2022 [^] [^^] [^^^] [ответить]
| +6 +/– |
Нет. Это как исходник на Perl. Сам автор не всегда разобрать может.
| |
|
3.17, Жироватт (ok), 08:38, 08/07/2022 [^] [^^] [^^^] [ответить]
| +/– |
Жаль. Но вот приложение переводящее с врачебного в нормальный печатный было бы просто бомба
| |
|
|
1.13, Геймер (?), 22:48, 07/07/2022 [ответить] [﹢﹢﹢] [ · · · ]
| +3 +/– |
"релиз системы оптического распознавания текста, поддерживающей распознавание символов UTF-8"
Это как? Может быть WTF?
| |
|
|
3.21, анон_тот самый (?), 01:04, 09/07/2022 [^] [^^] [^^^] [ответить]
| +/– |
(00)/........ мыслительный процесс останавливается от ваших заявлений. хотя меня больше беспокоит возможность увидеть именно utf-8 на бумаге. правда очень хочу. это было бы чудо)))) в компе понятно, но на бумаге как?))) но по теме все эти OCR жутко лаговые.
| |
|
|
5.28, анон_тот самый (?), 21:00, 13/07/2022 [^] [^^] [^^^] [ответить]
| +/– |
он что сказал? распечатал ютф-8 на бумаге. на бумаге в принципе ничего кроме чернильных точек быть не может. вы это как то разберитесь. представление шрифта в операционной системе и на бумаге. не вводите народ в заблуждение. а его отображение в системе и при просмотре в проге без правильной кодировки это другое. на бумаге нет кодировок как таковых. а в принтерах сплошной постскрипт.
| |
|
|
|
2.23, InuYasha (??), 10:25, 09/07/2022 [^] [^^] [^^^] [ответить]
| +/– |
Скорее просто несколько языков отдельно + смайлы и всякая экзотическая пунктуация.
| |
|
1.24, Аноним (24), 14:26, 09/07/2022 [ответить] [﹢﹢﹢] [ · · · ]
| +/– |
Эта штука может распознать только текст со скриншота, да и то не всегда.
| |
1.27, mandms (ok), 11:26, 13/07/2022 [ответить] [﹢﹢﹢] [ · · · ]
| +/– |
> поддерживающей распознавание(...)текстов на более чем 100 языках, включая русский, казахский, белорусский и украинский
На самом деле начиная с версии 4 распознаются тексты на языках всех республик бывшего СССР кроме туркменского.
(а всего на 123+ языках)
То есть, включая: армянский, грузинский, молдавский, все 3 прибалтийских, 4 среднеазиатских кроме туркменского, азербайджанский. [1]
[1] https://github.com/tesseract-ocr/tesseract/blob/main/doc/tesseract.1.asc#langu
hye (Armenian), kat (Georgian), kat_old (Georgian - Old),
ron (Romanian; Moldavian; Moldovan),
lav (Latvian), lit (Lithuanian), est (Estonian),
kaz (Kazakh), uzb (Uzbek), uzb_cyrl (Uzbek - Cyrilic),
kir (Kirghiz; Kyrgyz), tgk (Tajik),
aze (Azerbaijani), aze_cyrl (Azerbaijani - Cyrilic),
Только про туркменский не написано что поддерживается (его 3-буквенный код в ISO 639-2 - tuk)
| |
|