В статье "Fight Image Spam With FuzzyOCR And SpamAssassin On Debian/Ubuntu (http://www.howtoforge.com/fight_image_spam_with_fuzzyocr_spa...)" рассказывается об интересном плагине к SpamAssassin - FuzzyOCR (http://www.fuzzyocr.net/), способном анализировать текст во вложенных картингах. Блокировка происходит если на картинке обнаружено одно из слов занесенных в черный список.URL: http://www.howtoforge.com/fight_image_spam_with_fuzzyocr_spa...
Новость: http://www.opennet.me/opennews/art.shtml?num=9869
кто проверял ужо, али нет еще?
Уже пол года почти молотит без проблем, при достаточно большой нагрузке.
Пришлось правда его помягче настроить. При дефолтовых установках было много ложных срабатываний.
+1
а каких ресурсов он требует?
до чего прогресс дошел! обязательно прикручу эту вещь у себя на первой работе:)
работает. не нагружает систему. gocr собрался без проблем. набил базу слов для поиска в картинках. все довольны
а если текст набран под кглом или разными шрифтами, ловит?
то, что распознает gocr. а кому нужен спам с перевернутым текстом? :)
ААААА - он в Генте в портах есть ! Ураа! генточка хорошая
+1 Я тоже рад!
пприкрутил. работает. только косяк в ocrad. у меня gentoo. ocrad там версии 0.10 и
при работе FuzzyOCR требуется выполнение команды ocrad -s. Такой ключ не поддерживается ocrad. Удалил ocrad. Все равно работает.
http://fxp0.org.ua/2006/sep/27/setup-fuzzyocr-plugin-spamass...
>В статье "Fight Image Spam With FuzzyOCR And SpamAssassin On Debian/Ubuntu
А потом придут подлые спамеры и поломают этой штукoй Captcha-и на сайтах :(
Стравнно как-то работает FuzzyOCR среди успешно обработанных писем встречаются такие, что не отмечены в заголовке FuzzyOCR-ом. Такое впечатление, что он либо не успевает обрабатывать поток писем, либо иногда падает и сам поднимается!
> Такое впечатление, что он либо не успевает обрабатывать поток
> писем, либо иногда падает и сам поднимается!
Мне кажется, он не падает и поднимается, а просто запускается на каждое письмо отдельно. Судя по логам, по крайней мере. Что быстродействия ему, само собой, не прибавляет. А вообще, штука очень классная... мне нравится.
>> Такое впечатление, что он либо не успевает обрабатывать поток
>> писем, либо иногда падает и сам поднимается!
>Мне кажется, он не падает и поднимается, а просто запускается на каждое
>письмо отдельно. Судя по логам, по крайней мере. Что быстродействия ему,
>само собой, не прибавляет. А вообще, штука очень классная... мне нравится.
>Оказалось - это не баг, а фича! fuzzy запускается в последнюю очередь, если письмо не признано спамом. Типа для ресурсосбережения!