The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Вычисление спама в графических файлах средствами SpamAssassin

16.02.2007 15:13

В статье "Fight Image Spam With FuzzyOCR And SpamAssassin On Debian/Ubuntu" рассказывается об интересном плагине к SpamAssassin - FuzzyOCR, способном анализировать текст во вложенных картинках. Блокировка происходит если на картинке обнаружено одно из слов занесенных в черный список.

  1. Главная ссылка к новости (http://www.howtoforge.com/figh...)
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/9869-spam
Ключевые слова: spam, ocr, spamassassin, mail, block
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (16) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.2, Nagios (?), 15:42, 16/02/2007 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    кто проверял ужо, али нет еще?
     
     
  • 2.3, dukie (??), 15:58, 16/02/2007 [^] [^^] [^^^] [ответить]  
  • +/
    Уже пол года почти молотит без проблем, при достаточно большой нагрузке.
    Пришлось правда его помягче настроить. При дефолтовых установках было много ложных срабатываний.
     
     
  • 3.4, McLaud (?), 16:21, 16/02/2007 [^] [^^] [^^^] [ответить]  
  • +/
    +1
     
  • 3.12, aim (??), 13:18, 19/02/2007 [^] [^^] [^^^] [ответить]  
  • +/
    а каких ресурсов он требует?
     

  • 1.5, soko1 (??), 17:41, 16/02/2007 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    до чего прогресс дошел! обязательно прикручу эту вещь у себя на первой работе:)
     
  • 1.6, Роман (??), 18:42, 16/02/2007 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    работает. не нагружает систему. gocr собрался без проблем. набил базу слов для поиска в картинках. все довольны
     
  • 1.7, Аноним (-), 22:05, 16/02/2007 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    а если текст набран под кглом или разными шрифтами, ловит?
     
     
  • 2.10, Роман (??), 09:54, 17/02/2007 [^] [^^] [^^^] [ответить]  
  • +/
    то, что распознает gocr. а кому нужен спам с перевернутым текстом? :)
     

  • 1.8, Суслик (?), 00:13, 17/02/2007 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    ААААА - он в Генте в портах есть ! Ураа! генточка хорошая
     
     
  • 2.9, sy (ok), 08:11, 17/02/2007 [^] [^^] [^^^] [ответить]  
  • +/
    +1 Я тоже рад!
     

  • 1.11, spiner (?), 11:37, 19/02/2007 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    пприкрутил. работает. только косяк в ocrad. у меня gentoo. ocrad там версии 0.10 и
    при работе FuzzyOCR требуется выполнение команды ocrad -s. Такой ключ не поддерживается ocrad. Удалил ocrad. Все равно работает.
     
  • 1.13, tagore (?), 12:19, 20/02/2007 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    http://fxp0.org.ua/2006/sep/27/setup-fuzzyocr-plugin-spamassassin/
     
  • 1.14, lamer (??), 01:46, 27/02/2007 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    >В статье "Fight Image Spam With FuzzyOCR And SpamAssassin On Debian/Ubuntu
    А потом придут подлые спамеры и поломают этой штукoй Captcha-и на сайтах :(


     
     
  • 2.15, igorka (?), 09:03, 12/03/2007 [^] [^^] [^^^] [ответить]  
  • +/
    Стравнно как-то работает FuzzyOCR среди успешно обработанных писем встречаются такие, что не отмечены в заголовке FuzzyOCR-ом. Такое впечатление, что он либо не успевает обрабатывать поток писем, либо иногда падает и сам поднимается!
     
     
  • 3.16, toor99 (??), 09:08, 17/03/2007 [^] [^^] [^^^] [ответить]  
  • +/
    > Такое впечатление, что он либо не успевает обрабатывать поток
    > писем, либо иногда падает и сам поднимается!
    Мне кажется, он не падает и поднимается, а просто запускается на каждое письмо отдельно. Судя по логам, по крайней мере. Что быстродействия ему, само собой, не прибавляет. А вообще, штука очень классная... мне нравится.
     
     
  • 4.17, igorka (?), 11:57, 19/03/2007 [^] [^^] [^^^] [ответить]  
  • +/
    >> Такое впечатление, что он либо не успевает обрабатывать поток
    >> писем, либо иногда падает и сам поднимается!
    >Мне кажется, он не падает и поднимается, а просто запускается на каждое
    >письмо отдельно. Судя по логам, по крайней мере. Что быстродействия ему,
    >само собой, не прибавляет. А вообще, штука очень классная... мне нравится.
    >

    Оказалось - это не баг, а фича! fuzzy запускается в последнюю очередь, если письмо не признано спамом. Типа для ресурсосбережения!

     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру