|
2.8, Аноним (8), 22:34, 02/03/2022 [^] [^^] [^^^] [ответить]
| +1 +/– |
Даёшь распознавание ятей(Ѣ)!! (для дореволюционного текста нужно, не руками же это всё править)
| |
|
|
|
5.11, Гнъ Анонимъ (?), 12:49, 03/03/2022 [^] [^^] [^^^] [ответить]
| +/– |
> Право голубчикъ, чтож вы изволите такого писать?
Я самъ ничего, но много интересныхъ книгъ написано до насъ нашими великими предками
| |
|
|
|
|
1.3, Аноним (3), 12:55, 02/03/2022 [ответить] [﹢﹢﹢] [ · · · ]
| –5 +/– |
Пока не запилят восстановление стиля и структуры, с детекцией шрифтов, картинок, таблиц и т.д., с сохранением всей обнаруженной инфы, с возможностью для пользователя вмешиваться в процесс, как сделано в FineReader, так и будет бесполезной поделкой.
| |
1.4, Аноним (3), 12:56, 02/03/2022 [ответить] [﹢﹢﹢] [ · · · ]
| +/– |
>на базе рекуррентной нейронной сети LSTM
Продвинутые ребята уже 7 лет как используют трансформеры.
| |
|
2.5, iLex (ok), 16:27, 02/03/2022 [^] [^^] [^^^] [ответить]
| +/– |
У трансформеров есть неприятный недостаток - они требуют ОЧЕНЬ большого объёма обучающей выборки, чтобы механизм Multi-head attention нормально работал. Подозреваю, у разработчиков Tesseract попросту нет ресурсов, чтоб вручную разметить нужные объёмы. Так что трансформеры - это игрушка крупных корпораций.
А на малых выборках LSTM'ки кроют трансформеры по полной.
| |
|
3.7, Аноним (3), 20:27, 02/03/2022 [^] [^^] [^^^] [ответить]
| +/– |
>Подозреваю, у разработчиков Tesseract попросту нет ресурсов, чтоб вручную разметить нужные объёмы
Трансформеры тренируют на неразмеченных данных. Им нужна модель, понимающая структуру текста, к которой можно приделать распознающую модель, чтобы предсказывать распределение вероятностей для символа при заданной картинке. Для этого разметка не нужна. Нужна модель трансформер на чистом тексте (входы и выходы - 1-hot) + модель-распознавалка, выдающая распределение вероятностей для символа. Веса трансформера для начала можно и нужно заморозить.
| |
|
|
|
2.15, Jh (?), 04:42, 05/03/2022 [^] [^^] [^^^] [ответить]
| +/– |
Есть. Есть даже GUI - VietOCR. В принципе можно пользоваться
| |
|
|