Здравствуйте.
Кто что может сказать по поводу яндексовской спамообороны? Сейчас стоит спамассасин, есть некоторая проблема с русскоязычным спамом, кое-что пропускается... Встал вопрос о переходе. Имеет ли смысл?
> Здравствуйте.
> Кто что может сказать по поводу яндексовской спамообороны? Сейчас стоит спамассасин, есть
> некоторая проблема с русскоязычным спамом, кое-что пропускается... Встал вопрос о переходе.
> Имеет ли смысл?Пользуемся. Спам фильтрует хорошо, стабильность работы на троечку.
> Пользуемся. Спам фильтрует хорошо, стабильность работы на троечку.э-э... поподробней, если можно....если спам фильтрует хорошо, то что понимается под стабильностью?
- спам действительно фильтрует хорошо
- стабильность - раньше частенько падала, но в последней версии (3.4) всё нормально, впрочем, нагрузка у нас маленькая
- поддержка так себе, например, сложно добиться устранения ложных срабатываний, когда хорошие письма в спам попадают
- впрочем, если вы им понравитесь, то могут сказать, как писать собственные правила фильтрации
- привязка к IP-адресу сервера, при изменении приходится выписывать новый ключ, причём старый прекращает действие немедленно, а новый может заработать с некоторой задержкой, бывает неприятно
> Здравствуйте.
> Кто что может сказать по поводу яндексовской спамообороны? Сейчас стоит спамассасин, есть
> некоторая проблема с русскоязычным спамом, кое-что пропускается... Встал вопрос о переходе.
> Имеет ли смысл?В каком смысле - "кое-что пропускается"? Ведется ли у вас дообучение СА на распознаных юзерами письмах? Делаете ли вы регулярный sa-update?
> В каком смысле - "кое-что пропускается"? Ведется ли у вас дообучение СА
> на распознаных юзерами письмах? Делаете ли вы регулярный sa-update?В прямом... основная масса спама режется самим почтовым сервером, кое-что режется потом спамассассином...
но некоторые письма с русскоязычным спамом просачиваются...
обучение ведется... с бесом экспериментировал...
> но некоторые письма с русскоязычным спамом просачиваются...
> обучение ведется... с бесом экспериментировал...Как много писем просачивается? Можете прикинуть хотя бы на глаз три показателя:
- отношение входящего спама к хэму
- отношение пропущенного спама к отсеяному
- отношение пропущенного спама к хэмуСтопроцентного отсеивания не гарантирует ни одна система. Даже гугломейл, при всей его моще, на прошлой неделе пропустил ко мне около десятка спамовых писем. Спамеры ищут обходов вокруг байесов, и время от времени появляются новые техники, которые приводят к пробою спаморезки. Единственное, что может помочь - это постоянное дообучение байеса силами юзеров. Кстати, платные сервисы, продающие доступ к спам-фильтрам, эти спам-фильтры формируют тоже вручную, артелями молотобойцев, которые сортируют письма. Никакого волшебства.
Поэтому, если СА пропускает некоторое количество спама - это нормально. Другое дело, что это количество не должно быть слишком высоко. На моих серверах на тысячу попыток впихнуть спам, удачей завершаются 1-2. На 1-2 спамовых письма приходится 50-60 нормальных писем. То-есть, абсолютный показатель фильтрации - 99.8%, относительный - 97%. Можно получить и более высокие значения, но тогда резко возрастает риск получить фальш-позитив. А мои клиенты этого не любят.
> Как много писем просачивается? Можете прикинуть хотя бы на глазв цифрах не скажу, сейчас лениво точно считать...
на вскидку, спамассассин на данный момент видит не больше 80% спама, весь просачивающийся спам - русскоязычный. Если бы не правила приема писем самого почтовика, который на данный момент не пропускает просто подавляющую часть спама, то спамассасин работал бы еще хуже...Я к чему веду, ведь спамассасин изначально, вроде как, разрабатывался под англоязычный спам, поэтому по определению должен хуже находить русскоязычный спам.... или вы с этим утверждением не согласны?
> ведь спамассасин изначально, вроде как, разрабатывался под англоязычный
> спам, поэтому по определению должен хуже находить русскоязычный спам.... или вы
> с этим утверждением не согласны?Мнэ-эээ... как бы это сказать... покомплементарнее...
Спамассассин не работает с языками. Он не понимает, на каком языке написано письмо. Ему просто нечем понимать, это всего лишь несколько тысяч строк на перле. СА работает с последовательностями байтов, разделенных пробелами, табами и символами новой строки. СА совершенно безразлично, являются ли обрабатываемые последовательности байтов однобайтовыми кодировками вроде СР866, КОИ8-Р или еще какой ВИН1251. Ему даже по барабану двухбайтовые УТФ и ЦЖК, ему без разницы даже еврейские тексты справа налево с пропущенными гласными. От пробела до пробела, цепочка байт, смысла которых СА не понимает - ибо не нуждается в этом.
А в чем он нуждается - это в построении базы с цепочками байтов и связанными с ними вероятностяями спамовости письма, содержащего каждую отдельную цепочку. Получив тело письма, байесовский фильтр всего лишь проверяет его на предмет вхождения цепочек байтов, накапливает полученные вероятности и перемножает их, в строгом соответствии с теоремой Байеса. Все. Будет обрабатываемое письмо на английском, на суахили или, извиняюсь, на русском - это СА глубоко и широко безразлично.
> Здравствуйте.
> Кто что может сказать по поводу яндексовской спамообороны? Сейчас стоит спамассасин, есть
> некоторая проблема с русскоязычным спамом, кое-что пропускается... Встал вопрос о переходе.
> Имеет ли смысл?Ну, во-первых грамотно администрируемый SA может быть очень полезен, а во-вторых такие вещи как spamoborona и spamassasin - это уже последние средства, когда всё остальное не помогает. Вы для начала хотя бы greylisting пробывали? Отсеивает огромный процент спама и не отсеивает ниодного нужного письма.
> Вы для начала хотя бы greylisting пробывали?
> Отсеивает огромный процент спама и не отсеивает ниодного нужного письма.Грейлистинг мертв.
С развитием спамботов и ботсетей, когда один бот отсылает 30-50 писем в час, уже не представляет сложности повторить отправку при получении 452. Чтобы получить хотя бы 75% фильтрации посредством грейлистинга, приходится задирать таймауты до совершенно неприемлемых значений. Да, как альтернатива полному отсутствию входного контроля, грейлистинг впечатляет. Но есть гораздо более эффективные техники.
Я использую систему начисления штрафных очков на стадии RCPT. Ни одно отдельное нарушение - ни кривое невовремя поданное хело, ни отсутствие корректного резолва, ни наличие плохих слов в имени хоста - не приводит к отлупу. Но два тяжелых косяка (скажем, кривое хело и *dynamic* в имени хоста) или три-четыре легких означают неминуемый отлуп. Так режется ~90% спама. Остальное скармливается СА.
>> Вы для начала хотя бы greylisting пробывали?
>> Отсеивает огромный процент спама и не отсеивает ниодного нужного письма.
> Грейлистинг мертв.ну уж мертв. далеко не все боты работают так интеллектуально, вместе с гритинг паузой (в начале сеанса) и проверкой существования отправителя режется прилично - от 90% и выше