URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID1
Нить номер: 70615
[ Назад ]

Исходное сообщение
"Spamassassin не хочет проверять спам баесом"

Отправлено fa , 29-Ноя-06 19:11 
Всем привет. Пытаюсь настроить bayes фильтры в spamassassin. Скормил ему несколько spam-ов и ham-ов. Тепеть, когда скармливаю ему спам-текст из консоли:
spamassassin -D < spam_text_file
распознает все на ура. Если посылаю тот же текст в письме - не распознает. Кто-нибудь сталкивался с таким?
система: CentOS 4.4.
Spamassassin запущен так:
/usr/bin/spamd -u spamd -x -d -c -m5 -H -r /var/run/spamd.pid
В /etc/mail/spamassassin/local.cf
use_bayes 1
bayes_min_ham_num 100
bayes_min_spam_num 50
use_auto_whitelist 0
required_hits 5
report_safe 0
rewrite_header Subject [SPAM]
Зараннее спасибо

Содержание

Сообщения в этом обсуждении
"Spamassassin не хочет проверять спам баесом"
Отправлено rad87 , 30-Ноя-06 08:25 
>Всем привет. Пытаюсь настроить bayes фильтры в spamassassin. Скормил ему несколько spam-ов
>и ham-ов. Тепеть, когда скармливаю ему спам-текст из консоли:
>spamassassin -D < spam_text_file
>распознает все на ура. Если посылаю тот же текст в письме -
>не распознает. Кто-нибудь сталкивался с таким?
>система: CentOS 4.4.
>Spamassassin запущен так:
>/usr/bin/spamd -u spamd -x -d -c -m5 -H -r /var/run/spamd.pid
>В /etc/mail/spamassassin/local.cf
>use_bayes 1
>bayes_min_ham_num 100
>bayes_min_spam_num 50
>use_auto_whitelist 0
>required_hits 5
>report_safe 0
>rewrite_header Subject [SPAM]
>Зараннее спасибо
bayes наверное ещё не обучился по полной программе. Ты с корми ему больше писем и он заработает
PS Я точно такой же вопрос задавал в этом же форуме. И у меня он через некоторое время стал отсеивать
:)


"Spamassassin не хочет проверять спам баесом"
Отправлено _KAV_ , 30-Ноя-06 10:42 
1 - Несколько - это сколько?
у тебя указано что должно быть не меньше 100 нормальных и не меньше 50 спама...
2 - посмотри, для кого создается база... если ты работаешь от рута, то база создается от рута и на оставшуюся почту не влияет

"Spamassassin не хочет проверять спам баесом"
Отправлено fa , 30-Ноя-06 18:44 
>1 - Несколько - это сколько?
>у тебя указано что должно быть не меньше 100 нормальных и не
>меньше 50 спама...
>2 - посмотри, для кого создается база... если ты работаешь от рута,
>то база создается от рута и на оставшуюся почту не влияет
>

Большое спасибо за ответ.
И спама и хама больше 100.
Родительский процесс - рут. Подскажите, как называется его база? Где она?
root     25038  0.0  2.4 29644 24884 ?       Ss   Nov29   0:00 /usr/bin/spamd -u spamd -x -d -c -m5 -H /home/spamd -r /var/run/spamd.pid
spamd    25041  0.0  6.6 73136 68912 ?       S    Nov29   0:18 spamd child
spamd    25042  0.0  2.3 29644 23824 ?       S    Nov29   0:00 spamd child

Вообще, теперь меня терзают сомненья. В логах bayes все-таки проскакивает (как BAYES_50 в нижеприведенном логе). Так что я теряюсь.          
Вот как выглядит проверка письма в логе:
Nov 30 16:24:49 malaga spamd[25041]: spamd: connection from malaga [127.0.0.1] at port 49733
Nov 30 16:24:49 malaga spamd[25041]: spamd: checking message <E1GpnqE-0006b2-00.facha2002-mail-ru@f49.mail.ru> for nobody:509
Nov 30 16:24:49 malaga spamd[25041]: spamd: clean message (0.1/5.0) for nobody:509 in 0.3 seconds, 1651 bytes.
Nov 30 16:24:49 malaga spamd[25041]: spamd: result: . 0 - BAYES_50,RATWARE_MPOP_WEBMAIL scantime=0.3,size=1651,user=nobody,uid=509,required_score=5.0,rhost=malaga,raddr=127.0.0.1,rport=49733,mid=<E1GpnqE-0006b2-00.facha2002-mail-ru@f49.mail.ru>,bayes=0.572697744086362,autolearn=no
Nov 30 16:24:49 malaga spamd[25038]: prefork: child states: II

Подскажите, есть ли че странное? Почему, например, проскакивает user=nobody? До того, как поставил в опциях запуска -x, выдавало так же ошибку
Nov 26 15:59:43 malaga spamd[22077]: spamd: creating default_prefs: //.spamassassin/user_prefs
Nov 26 15:59:43 malaga spamd[22077]: mkdir /.spamassassin: Permission denied at /usr/lib/perl5/vendor_perl/5.8.5/Mail/SpamAssassin.pm line 153
0
Нужен ли мне user_prefs (как я понимаю это настройки под конкретного пользователя). Если да, то как задать правильный путь к user_prefs (чтоб spamd пытался его создавать в /home/spamd)


"Spamassassin не хочет проверять спам баесом"
Отправлено _KAV_ , 01-Дек-06 10:57 
Общие положения....
Есть разные варианты проверки почты на спам. Если ассассин запускается демоном, то он запускается _как_правило_ от рута, но потом сваливается в того пользователя, который указан в его конфиге. Вот база спама этого пользователя и является основной - и отдельно указывается в конфиге. Обучение - я использую скрипт, запускающий sa-learn от рута, с указанием полного пути к базам, и потом делающий chown на базы.
По поводу оценок - если проскакивает bayes_50, то байесовский классификатор работает, но базы нерепрезентативны - оценка 50 переводится как "хрен его знает, не пойму".
Внимательнее к обучению... как пример - если спам форвардится для обучения, то классификатор замечает, что на всех спамовых письмах есть хидеры форварда - и именно эти хидеры считает признаком спама - вот как... так что в таких случаях настраиватся игнор определенных хидеров. Есть и другие варианты.
По поводу local prefs - если ты не знаешь, что это такое, то тебе это не нужно. Это может использоваться только в том случае, если юзверг имеет возможность работать с своей почтой непосредственно на сервере - через веб-интерфейс с установленым плугином взаимодействия со спамодавом, к примеру.
Конкретнее сказать трудно, т.к. я не знаю конкретного построения системы - а их много.
P.S. Сам использую связку postfix - amavisd-new - spamassassin - clamav, там куча своих особенностей - в частности, нет нужды запускать spamd вообще Ж8-)

"Spamassassin не хочет проверять спам баесом"
Отправлено fa , 02-Дек-06 04:39 
Большое спасибо за ответ