Добрый день, коллеги!Есть postfix+spamassassin со стандартным набором плагов. Хотел бы узнать о вашем опыте тренировки.
В идеале хотелось бы так: юзера направляют неотфильтрованный спам и ham, ошибочно помеченный как спам, на специальные ящики, а уже их содержимое периодически скармливается для тренировки.
>Добрый день, коллеги!
>
>Есть postfix+spamassassin со стандартным набором плагов. Хотел бы узнать о вашем опыте
>тренировки.
>
>В идеале хотелось бы так: юзера направляют неотфильтрованный спам и ham, ошибочно
>помеченный как спам, на специальные ящики, а уже их содержимое периодически
>скармливается для тренировки.
Есть хороший ключик dir у модуля sa-learn.
>>В идеале хотелось бы так: юзера направляют неотфильтрованный спам
>>на специальные ящики..
Мечтатель. Никто этого делать не будет.
>Есть хороший ключик dir у модуля sa-learn.А зачем dir? У меня файловые мэйлбоксы.
Проблему пытаюсь решить сам таким макаром: завел два ящика для форварда 100% неотловленного спама и для не-спама, которые тем не менее набирает очки. Юзера форвардят на эти адреса соответствующие письма.
По крону пускается простейший скрипт:
#!/bin/sh
sa-learn --spam --mbox /var/mail/yesspam | mail root
sa-learn --ham --mbox /var/mail/ham | mail rootСомнение вызывает то обстоятельство, что форварднутые письма в обеих случаях содержат соответствующие заголовки.
>
>>Есть хороший ключик dir у модуля sa-learn.
>
>А зачем dir? У меня файловые мэйлбоксы.
>
>Проблему пытаюсь решить сам таким макаром: завел два ящика для форварда 100%
>неотловленного спама и для не-спама, которые тем не менее набирает очки.
>Юзера форвардят на эти адреса соответствующие письма.
>По крону пускается простейший скрипт:
>#!/bin/sh
>sa-learn --spam --mbox /var/mail/yesspam | mail root
>sa-learn --ham --mbox /var/mail/ham | mail root
>
>Сомнение вызывает то обстоятельство, что форварднутые письма в обеих случаях содержат соответствующие
>заголовки.Ну чего, никто СА не тренирует что ли? У всех фильтрация со 100 процентным попаданием в обе стороны?
>Ну чего, никто СА не тренирует что ли? У всех фильтрация со
>100 процентным попаданием в обе стороны?SpamAssasin может работать и без тренировки, ибо анализирует письмо не только по конкретным словам, ни и по:
-наличию адреса в блэк листах;
-подделке адреса;
-html-содержимое;
-крупные и яркие шрифты;
-и собссно по бейсовской статистике слов
-и т.д. куча параметровможно поставить опцию autolearn и при превышении определенного коэффициента спама содержимое будет проанализировано и добавлено в базу
>>
>>Сомнение вызывает то обстоятельство, что форварднутые письма в обеих случаях содержат соответствующие
>>заголовки.
>
Правильно вызывает - в документации на SA это явно указано. Посему здесь же пробегала история, как человек это делал - он экспортировал спамовые письма в формат UNIX, а затем по фтп заливал автоматом на сервер для обучения... Читайте находящиеся здесь же статьи, сэр!!!!
>>>
>>>Сомнение вызывает то обстоятельство, что форварднутые письма в обеих случаях содержат соответствующие
>>>заголовки.
>>
>Правильно вызывает - в документации на SA это явно указано. Посему здесь
>же пробегала история, как человек это делал - он экспортировал спамовые
>письма в формат UNIX, а затем по фтп заливал автоматом на
>сервер для обучения... Читайте находящиеся здесь же статьи, сэр!!!!он отлично понимает формат .msg
я прямо в бате делал "сохранить как..." и заливал на фтп
причем sa-learn сам определяет какие письма он уже отсканировал, какие еще нет, а в настройках можно указать какие заголовки использовать в обучении, а какие нет