URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID1
Нить номер: 76370
[ Назад ]

Исходное сообщение
"Вопрос по обучению SpamAssassin, поделитесь опытом."

Отправлено Heretic , 22-Сен-07 16:55 
Доброго времени суток, all!

Хотелось бы чтоб кто-нибудь поделился своим опытом по обучению spamassassin'а.
У меня cyrus-imapd и spamassassin, сделаны общие папки в cyrus: "forspam" и "notspam". Через  крон в определенное время они обрабатываются. Начальство поставило задачу чтоб у каждого пользователя была отдельная папка для спама и папка для не спама(то бишь остальные пользователи не могут видеть то чего я кинул в папке спам или не спам), у меня идеи на этот счет, только как написать скрипт, который искал бы эти папки у пользователей и обрабатывал бы их.
Итак, хотелось бы узнать кто как делал автообучение, и возможно ли связать MUA с spamassassin, если можно то как?

ЗЫ: MUA - на ваш вкус, но больше всего интересует TheBat!, KMail, Thunderbird.

ЗЫЫ: Спасибо за ответ.


Содержание

Сообщения в этом обсуждении
"Вопрос по обучению SpamAssassin, поделитесь опытом."
Отправлено alfss , 24-Сен-07 01:05 
>[оверквотинг удален]
>чего я кинул в папке спам или не спам), у меня
>идеи на этот счет, только как написать скрипт, который искал бы
>эти папки у пользователей и обрабатывал бы их.
>Итак, хотелось бы узнать кто как делал автообучение, и возможно ли связать
>MUA с spamassassin, если можно то как?
>
>ЗЫ: MUA - на ваш вкус, но больше всего интересует TheBat!, KMail,
>Thunderbird.
>
>ЗЫЫ: Спасибо за ответ.

скорми ему 1000-1500 спама и 2000 нормальных писем
потом он сам обучается постепенно- даже вроде в конфиге есть опция


"Вопрос по обучению SpamAssassin, поделитесь опытом."
Отправлено Heretic , 24-Сен-07 10:03 
>[оверквотинг удален]
>>Итак, хотелось бы узнать кто как делал автообучение, и возможно ли связать
>>MUA с spamassassin, если можно то как?
>>
>>ЗЫ: MUA - на ваш вкус, но больше всего интересует TheBat!, KMail,
>>Thunderbird.
>>
>>ЗЫЫ: Спасибо за ответ.
>
>скорми ему 1000-1500 спама и 2000 нормальных писем
>потом он сам обучается постепенно- даже вроде в конфиге есть опция

Ну это понятно, что скормить ему нужно энное количество писем, но как я понимаю нужно что бы пользователи кидали письма в определенную папку спам (например общую) и он будет обрабатывать по крону эту папку и обучаться. Есть еще какой то способ?

Может я не правильно высказался?
Как я понимаю образцы  спама и благонадежных писем могут попадать в Bayesian базу двумя способами: 1.автоматически,  с помощью Autolearn. 2. вручную  (или  при  помощи  скрипта)  командой  sa-learn. Для этого нужно скормить письмо или целый ящик.
Вообщем ситуация такая: в конфиге стоит автообучение, но как сделать чтобы когда приходит спам пользователь маркировал его как спам (или перекидывал в папку спам) и по крону SpamAssassin обучается. Я сделал общую папку и по крону скармливаю ему эту папку. Но так как она общая то все туда кидают письма и видят письма которые там. Вот хочется сделать что бы у каждого пользователя была своя папка спам, хам, это сделать тоже не проблема, но тогда придется написать скрипт который бы искал эти папка у пользователей и обрабатывал их. Вот и советуюсь есть ли какой еще способ?


"Вопрос по обучению SpamAssassin, поделитесь опытом."
Отправлено biffant , 24-Сен-07 12:47 
У нас реализован механизм сбора вредных и полезных писем из личных папок пользователей в одну общую, приватную папку с последующим обучением. По сути скрипт обучения фильтра из набора папок не проще скрипта копирования писем в одно место с обучением из него

P.S.
Рекомендую не слишком полагаться на bayes и другие самообучающиеся фильтры, по крайней мере не делать их вклад в оценку письма решающим. У spamassassin есть отличный механизм AWL, поддержка баз "слепков" спам-писем pyzor, razor2, dcc, поиск письма во многих DNSBL-листах (также рекомендую выключить поддержку dnsbl у sendmail, если не хочешь чтобы куча полезных писем бесконтрольно удалялась только по одному этому признаку).


"Вопрос по обучению SpamAssassin, поделитесь опытом."
Отправлено Nik , 07-Сен-23 00:31 
>[оверквотинг удален]
> sa-learn. Для этого нужно скормить письмо или целый ящик.
> Вообщем ситуация такая: в конфиге стоит автообучение, но как сделать чтобы когда
> приходит спам пользователь маркировал его как спам (или перекидывал в папку
> спам) и по крону SpamAssassin обучается. Я сделал общую папку и
> по крону скармливаю ему эту папку. Но так как она общая
> то все туда кидают письма и видят письма которые там. Вот
> хочется сделать что бы у каждого пользователя была своя папка спам,
> хам, это сделать тоже не проблема, но тогда придется написать скрипт
> который бы искал эти папка у пользователей и обрабатывал их. Вот
> и советуюсь есть ли какой еще способ?

1.Обновим данные:
sa-update
sa-compile

2.Создадим скрипт обучения:
nano /usr/local/bin/spam-learn.sh

#!/usr/bin/env bash

sa-learn --no-sync --spam /home/mail/*/*/.Junk >> /var/log/sa-learn.log 2>&1
sa-learn --no-sync --ham /home/mail/*/*/cur >> /var/log/sa-learn.log 2>&1
sa-learn --sync

3.Назначим права на выполнение:
chmod +x /usr/local/bin/spam-learn.sh

4.Добавим запуск скрипта в cron, мы будем выполнять его каждый день в 4 утра.
crontab -e

0 4 * * * /usr/local/bin/spam-learn.sh

5.Смотрим отчет обучения:
more /var/log/sa-learn.log
Learned tokens from 34 message(s) (34 message(s) examined)
Learned tokens from 4590 message(s) (4590 message(s) examined)