Понимаю, что данный вопрос уже скорее всего звучал в форуме - но поиск, для меня так и не дал точного ответа. Как эффективней обучить SA ? Я скармливаю ему ящик sa-learn --spam --mbox /var/spool/mail/spambox - ложу туда спам который он ошибочно пропускает или туда нужно ложить все письма которые принимаются за спам. На старом шлюзе стояла ещё старая ветка SA - там я сам просто игрался с оценками вручную анализируя заголовки - не использовал обучение, добился вприниципе неплохих результатов + procmail в котором тоже иногда добавлял некоторые правила , стоит ли вернутся к такой практике или всё таки игратся с его обучением. Надеюсь на ваше желание поделится опытом.
>Понимаю, что данный вопрос уже скорее всего звучал в форуме - но
>поиск, для меня так и не дал точного ответа. Как эффективней
>обучить SA ? Я скармливаю ему ящик sa-learn --spam --mbox
>/var/spool/mail/spambox - ложу туда спам который он ошибочно пропускает или туда
>нужно ложить все письма которые принимаются за спам. На старом шлюзе
>стояла ещё старая ветка SA - там я сам просто игрался
>с оценками вручную анализируя заголовки - не использовал обучение, добился вприниципе
>неплохих результатов + procmail в котором тоже иногда добавлял некоторые правила
>, стоит ли вернутся к такой практике или всё таки игратся
>с его обучением. Надеюсь на ваше желание поделится опытом.
Вот сайток нашел..но еще не изучал...может поможет.
>>Понимаю, что данный вопрос уже скорее всего звучал в форуме - но
>>поиск, для меня так и не дал точного ответа. Как эффективней
>>обучить SA ? Я скармливаю ему ящик sa-learn --spam --mbox
>>/var/spool/mail/spambox - ложу туда спам который он ошибочно пропускает или туда
>>нужно ложить все письма которые принимаются за спам. На старом шлюзе
>>стояла ещё старая ветка SA - там я сам просто игрался
>>с оценками вручную анализируя заголовки - не использовал обучение, добился вприниципе
>>неплохих результатов + procmail в котором тоже иногда добавлял некоторые правила
>>, стоит ли вернутся к такой практике или всё таки игратся
>>с его обучением. Надеюсь на ваше желание поделится опытом.
>
>
>Вот сайток нашел..но еще не изучал...может поможет.Вот и сайток сам
http://www.rulesemporium.com/
Если вспомнить математику, (или почитать ман) то очевидно, что для обучения байеса требуется 2 группы для оценок - спам и рабочая почта.
Так что для начала ему скармливается не меньше 200 спамовых и 200 рабочих писем.
Дальше возможны варианты - либо дообучать, т.е. скармливать ему как спам ошибочно нераспознаный спам и как хам рабочую почту, уходящую в спам, либо постоянно тренировать - скармливать ему весь спам и хам через сервер.
Да слышал такое - а не идёт ли он сразу после установки уже наученным - как он тогда определяет кто спа а кто не спам
>Да слышал такое - а не идёт ли он сразу после установки
>уже наученным - как он тогда определяет кто спа а кто
>не спам
Говорю о Mailscanner + Mailwatchпервые 600 писем - в основном ручками - из MailWatch.
На это время выставить HiScore Spam (кажется так) - пониже - скажем до 6 - тогда оно все в уровне Mailscanner + Spamass учит автоматом
Потом уровень поднимаем до стандартных 9 или больше
Проблема в том что готовые базы могут не подходить - другой регион (принятия)
Спама, другой язык и т.д. Поэтому прийдется в любом случае брать в руки напильник.Никаких телодвижений из-под клиента не делал. Не получилось. Письмо завернутое на адрес типа "спамообучалка" - приходит от имени пользователя его пославшего а не от реального отправителя.
я письма в вебмине разворачиваю на адрес типа спамообучалка - заголовки не меняются.
>Да слышал такое - а не идёт ли он сразу после установки
>уже наученным - как он тогда определяет кто спа а кто
>не спам
Байес - только один из критериев обучения. Там еще куча правил...
>>Да слышал такое - а не идёт ли он сразу после установки
>>уже наученным - как он тогда определяет кто спа а кто
>>не спам
>Байес - только один из критериев обучения. Там еще куча правил...
>
я собственно совсем недавно вступил в борьбу со спамом...и еще принцип толком в голове не улегся..Вот задам дурацкий(уж простите) вопрос:
Чем система sa-searn отличается от Байес или Razor2 кпримеру..:-|
>я собственно совсем недавно вступил в борьбу со спамом...и еще принцип толком
>в голове не улегся..
>
>Вот задам дурацкий(уж простите) вопрос:
>Чем система sa-searn отличается от Байес или Razor2 кпримеру..
sa-learn - это команда обучения байесовского классификатора в spamassassin.
Razor - система серверов в инете.
>>я собственно совсем недавно вступил в борьбу со спамом...и еще принцип толком
>>в голове не улегся..
>>
>>Вот задам дурацкий(уж простите) вопрос:
>>Чем система sa-searn отличается от Байес или Razor2 кпримеру..
>sa-learn - это команда обучения байесовского классификатора в spamassassin.
>Razor - система серверов в инете.
А поделитесь пожалуйста опытом: как правильно обучать SA..
>А поделитесь пожалуйста опытом: как правильно обучать SA..
Здесь я уже раза три это писал.... поиск по форуму
>>я собственно совсем недавно вступил в борьбу со спамом...и еще принцип толком
>>в голове не улегся..
>>
>>Вот задам дурацкий(уж простите) вопрос:
>>Чем система sa-searn отличается от Байес или Razor2 кпримеру..
>sa-learn - это команда обучения байесовского классификатора в spamassassin.
>Razor - система серверов в инете.
А еще вопрос:
У меня в спаме что проскальзывает таки, в заголовке нет ничего типа X-Spam-Flag,X-Spam-Score
и т.д.Это так и должно быть?
>А еще вопрос:
>У меня в спаме что проскальзывает таки, в заголовке нет ничего типа
>X-Spam-Flag,X-Spam-Score
>и т.д.
>
>Это так и должно быть?
Обучать надо спамассассин
если использеш amawisd то там выставляется порог оценок при котором добавлять в заголовок инфу или нет - по этой причине может и не быть
>Дальше возможны варианты - либо дообучать, т.е. скармливать ему как спам ошибочно
>нераспознаный спам и как хам рабочую почту, уходящую в спам, либо
>постоянно тренировать - скармливать ему весь спам и хам через сервер.
>Кстати вот интерестно мне какая разница между дообучением и тренировкой
Ато чего то мой после дообучения похуже работать стал
>>Дальше возможны варианты - либо дообучать, т.е. скармливать ему как спам ошибочно
>>нераспознаный спам и как хам рабочую почту, уходящую в спам, либо
>>постоянно тренировать - скармливать ему весь спам и хам через сервер.
>>
>
>Кстати вот интерестно мне какая разница между дообучением и тренировкой
Я уже написал - дообучение - это когда sa-learn скармливаются только ошибки, тренировка - когда ему скармливают весь поток, просмотренный своими глазами.
>
>Ато чего то мой после дообучения похуже работать стал
Смотря как дообучать...
В школьном курсе математики говорится, что байесовская оценка - это статистическая оценка, складывающаяяся из статистических результатов сравнения с набором образцов, характерных для одного или другого случая... Мутно написано, вот пример (донельзя упрощенный).
Пришло письмо, его сравнили с 500 письмами spam и 500 письмами ham. Результат - оно похоже на 160 спамовых писем и на 90 нормальных. Итого - байесовская оценка спама - 64 процента. А если в образцах для сравнения будет 20 нормальных писем и 5000 спамовых???
А если учесть, что спамасассин в своем байесовском классификаторе постоянно чистит базу от записей старших чем... (настраивается)???
В общем, из этого примера можно сделать кучу практических выодов о том, как тренировать спамодав. А дальше - думайте...
Теперь стало ястно - спасибо за теорию её и нехватало
Кто бы мог спама поотсылать на spam@skm.net.ua