URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID1
Нить номер: 45125
[ Назад ]

Исходное сообщение
"Тренируем spamassassin"

Отправлено MacD , 15-Июн-04 17:59 
Добрый день, коллеги!

Есть postfix+spamassassin со стандартным набором плагов. Хотел бы узнать о вашем опыте тренировки.

В идеале хотелось бы так: юзера направляют неотфильтрованный спам и ham, ошибочно помеченный как спам, на специальные ящики, а уже их содержимое периодически скармливается для тренировки.


Содержание

Сообщения в этом обсуждении
"Тренируем spamassassin"
Отправлено Purple , 16-Июн-04 06:37 
>Добрый день, коллеги!
>
>Есть postfix+spamassassin со стандартным набором плагов. Хотел бы узнать о вашем опыте
>тренировки.
>
>В идеале хотелось бы так: юзера направляют неотфильтрованный спам и ham, ошибочно
>помеченный как спам, на специальные ящики, а уже их содержимое периодически
>скармливается для тренировки.
Есть хороший ключик dir у модуля sa-learn.



"Тренируем spamassassin"
Отправлено Purple , 16-Июн-04 06:39 
>>В идеале хотелось бы так: юзера направляют неотфильтрованный спам
>>на специальные ящики..
Мечтатель. Никто этого делать не будет.



"Тренируем spamassassin"
Отправлено MacD , 17-Июн-04 16:58 

>Есть хороший ключик dir у модуля sa-learn.

А зачем dir? У меня файловые мэйлбоксы.

Проблему пытаюсь решить сам таким макаром: завел два ящика для форварда 100% неотловленного спама и для не-спама, которые тем не менее набирает очки. Юзера форвардят на эти адреса соответствующие письма.
По крону пускается простейший скрипт:
#!/bin/sh
sa-learn --spam --mbox /var/mail/yesspam | mail root
sa-learn --ham --mbox /var/mail/ham | mail root

Сомнение вызывает то обстоятельство, что форварднутые письма в обеих случаях содержат соответствующие заголовки.



"Тренируем spamassassin"
Отправлено MacD , 23-Июн-04 18:44 
>
>>Есть хороший ключик dir у модуля sa-learn.
>
>А зачем dir? У меня файловые мэйлбоксы.
>
>Проблему пытаюсь решить сам таким макаром: завел два ящика для форварда 100%
>неотловленного спама и для не-спама, которые тем не менее набирает очки.
>Юзера форвардят на эти адреса соответствующие письма.
>По крону пускается простейший скрипт:
>#!/bin/sh
>sa-learn --spam --mbox /var/mail/yesspam | mail root
>sa-learn --ham --mbox /var/mail/ham | mail root
>
>Сомнение вызывает то обстоятельство, что форварднутые письма в обеих случаях содержат соответствующие
>заголовки.

Ну чего, никто СА не тренирует что ли? У всех фильтрация со 100 процентным попаданием в обе стороны?


"Тренируем spamassassin"
Отправлено DimMan , 24-Июн-04 10:40 
>Ну чего, никто СА не тренирует что ли? У всех фильтрация со
>100 процентным попаданием в обе стороны?

SpamAssasin может работать и без тренировки, ибо анализирует письмо не только по конкретным словам, ни и по:

-наличию адреса в блэк листах;
-подделке адреса;
-html-содержимое;
-крупные и яркие шрифты;
-и собссно по бейсовской статистике слов
-и т.д. куча параметров

можно поставить опцию autolearn и при превышении определенного коэффициента спама содержимое будет проанализировано и добавлено в базу


"Тренируем spamassassin"
Отправлено _KAV_ , 24-Июн-04 11:07 
>>
>>Сомнение вызывает то обстоятельство, что форварднутые письма в обеих случаях содержат соответствующие
>>заголовки.
>
Правильно вызывает - в документации на SA это явно указано. Посему здесь же пробегала история, как человек это делал - он экспортировал спамовые письма в формат UNIX, а затем по фтп заливал автоматом на сервер для обучения... Читайте находящиеся здесь же статьи, сэр!!!!


"Тренируем spamassassin"
Отправлено DimMan , 24-Июн-04 12:30 
>>>
>>>Сомнение вызывает то обстоятельство, что форварднутые письма в обеих случаях содержат соответствующие
>>>заголовки.
>>
>Правильно вызывает - в документации на SA это явно указано. Посему здесь
>же пробегала история, как человек это делал - он экспортировал спамовые
>письма в формат UNIX, а затем по фтп заливал автоматом на
>сервер для обучения... Читайте находящиеся здесь же статьи, сэр!!!!

он отлично понимает формат .msg
я прямо в бате делал "сохранить как..." и заливал на фтп
причем sa-learn сам определяет какие письма он уже отсканировал, какие еще нет, а в настройках можно указать какие заголовки использовать в обучении, а какие нет