URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID1
Нить номер: 68205
[ Назад ]

Исходное сообщение
"Как правельней обучить Spamassassin ?"

Отправлено mis_tery , 14-Авг-06 09:20 
Понимаю, что данный вопрос уже скорее всего звучал в форуме - но поиск, для меня так и не дал точного ответа. Как эффективней обучить SA ?  Я скармливаю ему ящик sa-learn --spam --mbox /var/spool/mail/spambox - ложу туда спам который он ошибочно пропускает или туда нужно ложить все письма которые принимаются за спам. На старом шлюзе стояла ещё старая ветка SA - там я сам просто игрался с оценками вручную анализируя заголовки - не использовал обучение, добился вприниципе неплохих результатов + procmail в котором тоже иногда добавлял некоторые правила , стоит ли вернутся к такой практике или всё таки игратся с его обучением. Надеюсь на ваше желание поделится опытом.

Содержание

Сообщения в этом обсуждении
"Как правельней обучить Spamassassin ?"
Отправлено Apossum , 14-Авг-06 09:33 
>Понимаю, что данный вопрос уже скорее всего звучал в форуме - но
>поиск, для меня так и не дал точного ответа. Как эффективней
>обучить SA ?  Я скармливаю ему ящик sa-learn --spam --mbox
>/var/spool/mail/spambox - ложу туда спам который он ошибочно пропускает или туда
>нужно ложить все письма которые принимаются за спам. На старом шлюзе
>стояла ещё старая ветка SA - там я сам просто игрался
>с оценками вручную анализируя заголовки - не использовал обучение, добился вприниципе
>неплохих результатов + procmail в котором тоже иногда добавлял некоторые правила
>, стоит ли вернутся к такой практике или всё таки игратся
>с его обучением. Надеюсь на ваше желание поделится опытом.


Вот сайток нашел..но еще не изучал...может поможет.


"Как правельней обучить Spamassassin ?"
Отправлено Apossum , 14-Авг-06 09:33 
>>Понимаю, что данный вопрос уже скорее всего звучал в форуме - но
>>поиск, для меня так и не дал точного ответа. Как эффективней
>>обучить SA ?  Я скармливаю ему ящик sa-learn --spam --mbox
>>/var/spool/mail/spambox - ложу туда спам который он ошибочно пропускает или туда
>>нужно ложить все письма которые принимаются за спам. На старом шлюзе
>>стояла ещё старая ветка SA - там я сам просто игрался
>>с оценками вручную анализируя заголовки - не использовал обучение, добился вприниципе
>>неплохих результатов + procmail в котором тоже иногда добавлял некоторые правила
>>, стоит ли вернутся к такой практике или всё таки игратся
>>с его обучением. Надеюсь на ваше желание поделится опытом.
>
>
>Вот сайток нашел..но еще не изучал...может поможет.

Вот и сайток сам
http://www.rulesemporium.com/


"Как правельней обучить Spamassassin ?"
Отправлено _KAV_ , 14-Авг-06 13:18 
Если вспомнить математику, (или почитать ман) то очевидно, что для обучения байеса требуется 2 группы для оценок - спам и рабочая почта.
Так что для начала ему скармливается не меньше 200 спамовых и 200 рабочих писем.
Дальше возможны варианты - либо дообучать, т.е. скармливать ему как спам ошибочно нераспознаный спам и как хам рабочую почту, уходящую в спам, либо постоянно тренировать - скармливать ему весь спам и хам через сервер.

"Как правельней обучить Spamassassin ?"
Отправлено mis_tery , 14-Авг-06 14:08 
Да слышал такое - а не идёт ли он сразу после установки уже наученным - как он тогда определяет кто спа а кто не спам

"Как правельней обучить Spamassassin ?"
Отправлено iasb , 15-Авг-06 12:07 
>Да слышал такое - а не идёт ли он сразу после установки
>уже наученным - как он тогда определяет кто спа а кто
>не спам


Говорю о Mailscanner + Mailwatch

первые 600 писем - в основном ручками - из MailWatch.

На это время выставить HiScore Spam (кажется так) - пониже - скажем до 6 - тогда оно все в уровне Mailscanner + Spamass учит автоматом

Потом уровень поднимаем до стандартных 9 или больше

Проблема в том что готовые базы могут не подходить - другой регион (принятия)
Спама, другой язык и т.д. Поэтому прийдется в любом случае брать в руки напильник.

Никаких телодвижений из-под клиента не делал. Не получилось. Письмо завернутое на адрес типа "спамообучалка" - приходит от имени пользователя его пославшего а не от реального  отправителя.


"Как правельней обучить Spamassassin ?"
Отправлено mis_tery , 15-Авг-06 17:39 
я письма в вебмине разворачиваю на адрес типа спамообучалка - заголовки не меняются.



"Как правельней обучить Spamassassin ?"
Отправлено _KAV_ , 16-Авг-06 13:23 
>Да слышал такое - а не идёт ли он сразу после установки
>уже наученным - как он тогда определяет кто спа а кто
>не спам
Байес  - только один из критериев обучения. Там еще куча правил...

"Как правельней обучить Spamassassin ?"
Отправлено Apossum , 16-Авг-06 14:33 
>>Да слышал такое - а не идёт ли он сразу после установки
>>уже наученным - как он тогда определяет кто спа а кто
>>не спам
>Байес  - только один из критериев обучения. Там еще куча правил...
>


я собственно совсем недавно вступил в борьбу со спамом...и еще принцип толком в голове не улегся..

Вот задам дурацкий(уж простите) вопрос:
Чем система sa-searn отличается от Байес или Razor2 кпримеру..

:-|


"Как правельней обучить Spamassassin ?"
Отправлено _KAV_ , 16-Авг-06 14:44 
>я собственно совсем недавно вступил в борьбу со спамом...и еще принцип толком
>в голове не улегся..
>
>Вот задам дурацкий(уж простите) вопрос:
>Чем система sa-searn отличается от Байес или Razor2 кпримеру..
sa-learn - это команда обучения байесовского классификатора в spamassassin.
Razor - система серверов в инете.

"Как правельней обучить Spamassassin ?"
Отправлено Apossum , 17-Авг-06 10:42 
>>я собственно совсем недавно вступил в борьбу со спамом...и еще принцип толком
>>в голове не улегся..
>>
>>Вот задам дурацкий(уж простите) вопрос:
>>Чем система sa-searn отличается от Байес или Razor2 кпримеру..
>sa-learn - это команда обучения байесовского классификатора в spamassassin.
>Razor - система серверов в инете.


А поделитесь пожалуйста опытом: как правильно обучать SA..


"Как правельней обучить Spamassassin ?"
Отправлено _KAV_ , 17-Авг-06 11:18 
>А поделитесь пожалуйста опытом: как правильно обучать SA..
Здесь я уже раза три это писал.... поиск по форуму

"Как правельней обучить Spamassassin ?"
Отправлено Apossum , 18-Авг-06 10:34 
>>я собственно совсем недавно вступил в борьбу со спамом...и еще принцип толком
>>в голове не улегся..
>>
>>Вот задам дурацкий(уж простите) вопрос:
>>Чем система sa-searn отличается от Байес или Razor2 кпримеру..
>sa-learn - это команда обучения байесовского классификатора в spamassassin.
>Razor - система серверов в инете.


А еще вопрос:
У меня в спаме что проскальзывает таки, в заголовке нет ничего типа X-Spam-Flag,X-Spam-Score  
и т.д.

Это так и должно быть?


"Как правельней обучить Spamassassin ?"
Отправлено _KAV_ , 18-Авг-06 10:39 
>А еще вопрос:
>У меня в спаме что проскальзывает таки, в заголовке нет ничего типа
>X-Spam-Flag,X-Spam-Score
>и т.д.
>
>Это так и должно быть?
Обучать надо спамассассин


"Как правельней обучить Spamassassin ?"
Отправлено mis_tery , 19-Авг-06 10:54 
если использеш amawisd то там выставляется порог оценок при котором добавлять в заголовок инфу или нет - по этой причине может и не быть

"Как правельней обучить Spamassassin ?"
Отправлено mis_tery , 19-Авг-06 11:05 
>Дальше возможны варианты - либо дообучать, т.е. скармливать ему как спам ошибочно
>нераспознаный спам и как хам рабочую почту, уходящую в спам, либо
>постоянно тренировать - скармливать ему весь спам и хам через сервер.
>

Кстати вот интерестно мне какая разница между дообучением и тренировкой

Ато чего то мой после дообучения похуже работать стал


"Как правельней обучить Spamassassin ?"
Отправлено _KAV_ , 21-Авг-06 10:59 
>>Дальше возможны варианты - либо дообучать, т.е. скармливать ему как спам ошибочно
>>нераспознаный спам и как хам рабочую почту, уходящую в спам, либо
>>постоянно тренировать - скармливать ему весь спам и хам через сервер.
>>
>
>Кстати вот интерестно мне какая разница между дообучением и тренировкой
Я уже написал - дообучение - это когда sa-learn скармливаются только ошибки, тренировка - когда ему скармливают весь поток, просмотренный своими глазами.
>
>Ато чего то мой после дообучения похуже работать стал
Смотря как дообучать...
В школьном курсе математики говорится, что байесовская оценка - это статистическая оценка, складывающаяяся из статистических результатов сравнения с набором образцов, характерных для одного или другого случая... Мутно написано, вот пример (донельзя упрощенный).
Пришло письмо, его сравнили с 500 письмами spam и 500 письмами ham. Результат - оно похоже на 160 спамовых писем и на 90 нормальных. Итого - байесовская оценка спама - 64 процента. А если в образцах для сравнения будет 20 нормальных писем и 5000 спамовых???
А если учесть, что спамасассин в своем байесовском классификаторе постоянно чистит базу от записей старших чем... (настраивается)???
В общем, из этого примера можно сделать кучу практических выодов о том, как тренировать спамодав. А дальше - думайте...


"Как правельней обучить Spamassassin ?"
Отправлено mis_tery , 23-Авг-06 13:07 
Теперь стало ястно - спасибо за теорию её и нехватало

"Как правельней обучить Spamassassin ?"
Отправлено weldpua2008 , 22-Фев-09 06:18 
Кто бы мог спама поотсылать на spam@skm.net.ua