The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

форумы  помощь  поиск  регистрация  майллист  вход/выход  слежка  RSS
"gocr: распознавание текста"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Открытые системы на сервере (Системное и пользовательское ПО / Linux)
Изначальное сообщение [ Отслеживать ]

"gocr: распознавание текста"  –1 +/
Сообщение от ALex_hha (ok) on 16-Май-16, 18:10 
Собственно появилась необходимость для распозновании простенькой капчи. Все работает, за исключением того, что некоторые символы - 5,6 не определяет. Попробовал обучающий режим


# gocr -C 0-9 -m 130 6335_gs.png -p ./db/
# show box + environment
# show box     x=    1    0 d=  14  15 r= 6 0
# show pattern x=    0    0 d=  40  16 t= 1 1
,......#.......,,,,,,,,,,,,,O,,,,,,,,,,,<-
,.######.......,,,OOOOOOOOOOOO,,,,OOOOOO
,#######.......,,OOOOOOOOOOOOOO,,OOOOOOO
,#######.......,,OOOOOOOOOOOOOO,,OOOOOOO
,####..........,,,,,,,,,,,,OOOO,,,,,,,,,<
,####.......#..,,,,,,,,,,,,OOO,,,,,,,,,,
,#############.,,OOOOOOOOOOOOO,,,OOOOOOO
,##############,,OOOOOOOOOOOOO,,,OOOOOOO
,##############,,OOOOOOOOOOOOOO,,OOOOOOO
,####......####,,,,,,,,,,,,OOOO,,,,,,,,,
,####......####,,,,,,,,,,,,OOOO,,,,,,,,,
,####......####,,,,,,,,,,,,OOOO,,,,,,,,,
,##############,,OOOOOOOOOOOOOO,,OOOOOOO
,.############.,,OOOOOOOOOOOOO,,,OOOOOOO
,..##########..,,OOOOOOOOOOOO,,,,OOOOOOO<-
,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
The above pattern was not recognized.
Enter UTF8 char or string for above pattern. Leave empty if unsure.
Press RET at the end (ALT+RET to store into RAM only) : 6
...
6335

Запускаю с учетом базы


# gocr -C 0-9 -m 1 6335_gs.png -p ./db/
_33_

6 и 5 все равно не определяет. Как победить?
Ответить | Правка | Cообщить модератору

Оглавление

Сообщения по теме [Сортировка по времени | RSS]


1. "gocr: распознавание текста"  +/
Сообщение от ALex_hha (ok) on 17-Май-16, 00:12 
Если кому пригодится

$ gocr -d 0 -a 99 -f UTF8 -m 386 -p db/ -i test.pnm

Одной командой


$ curl -s http://www.example.com/captcha.png | convert png:- -auto-level -quality 99% -compress none -colorspace Gray -background "#00FF00" -border 2x2 -threshold 50% -flatten pnm:- | gocr - -d 0 -a 99 -f ASCII -m 386 -p db/

З.Ы.
ну и параметры для convert будут сильно отличаться от самой капчи. У меня после обучения результат детекта 100%

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

2. "gocr: распознавание текста"  +1 +/
Сообщение от Pahanivo (ok) on 17-Май-16, 13:49 
благое дело замышляешь?
Ответить | Правка | ^ к родителю #1 | Наверх | Cообщить модератору

3. "gocr: распознавание текста"  +/
Сообщение от ALex_hha (ok) on 17-Май-16, 16:34 
> благое дело замышляешь?

конечно :) На самом деле нужно для автоматизированного тестирования (codeception), благо капча на проекте это позволила сделать быстро и просто. С google captcha v2 уже такой фокус не пройдет. Ну или с таким

https://s-media-cache-ak0.pinimg.com/736x/50/1b/96/501b967f6...

Ответить | Правка | ^ к родителю #2 | Наверх | Cообщить модератору

4. "gocr: распознавание текста"  +/
Сообщение от Pahanivo (ok) on 17-Май-16, 23:50 
> https://s-media-cache-ak0.pinimg.com/736x/50/1b/96/501b967f6...

Роршах? По таким в другом месте распознают :)


Ответить | Правка | ^ к родителю #3 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2025 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру