URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID1
Нить номер: 91017
[ Назад ]

Исходное сообщение
"Спамооборона"

Отправлено alex , 25-Фев-11 11:18 
Здравствуйте.
Кто что может сказать по поводу яндексовской спамообороны? Сейчас стоит спамассасин, есть некоторая проблема с русскоязычным спамом, кое-что пропускается... Встал вопрос о переходе. Имеет ли смысл?

Содержание

Сообщения в этом обсуждении
"Спамооборона"
Отправлено ze6ra , 25-Фев-11 11:53 
> Здравствуйте.
> Кто что может сказать по поводу яндексовской спамообороны? Сейчас стоит спамассасин, есть
> некоторая проблема с русскоязычным спамом, кое-что пропускается... Встал вопрос о переходе.
> Имеет ли смысл?

Пользуемся. Спам фильтрует хорошо, стабильность работы на троечку.


"Спамооборона"
Отправлено alex , 25-Фев-11 12:05 
> Пользуемся. Спам фильтрует хорошо, стабильность работы на троечку.

э-э... поподробней, если можно....если спам фильтрует хорошо, то что понимается под стабильностью?


"Спамооборона"
Отправлено Гайбруш Трипвуд , 25-Фев-11 12:27 
- спам действительно фильтрует хорошо
- стабильность - раньше частенько падала, но в последней версии (3.4) всё нормально, впрочем, нагрузка у нас маленькая
- поддержка так себе, например, сложно добиться устранения ложных срабатываний, когда хорошие письма в спам попадают
- впрочем, если вы им понравитесь, то могут сказать, как писать собственные правила фильтрации
- привязка к IP-адресу сервера, при изменении приходится выписывать новый ключ, причём старый прекращает действие немедленно, а новый может заработать с некоторой задержкой, бывает неприятно



"Спамооборона"
Отправлено DeadLoco , 25-Фев-11 13:02 
> Здравствуйте.
> Кто что может сказать по поводу яндексовской спамообороны? Сейчас стоит спамассасин, есть
> некоторая проблема с русскоязычным спамом, кое-что пропускается... Встал вопрос о переходе.
> Имеет ли смысл?

В каком смысле - "кое-что пропускается"? Ведется ли у вас дообучение СА на распознаных юзерами письмах? Делаете ли вы регулярный sa-update?


"Спамооборона"
Отправлено alex , 25-Фев-11 13:17 
> В каком смысле - "кое-что пропускается"? Ведется ли у вас дообучение СА
> на распознаных юзерами письмах? Делаете ли вы регулярный sa-update?

В прямом... основная масса спама режется самим почтовым сервером, кое-что режется потом спамассассином...
но некоторые письма с русскоязычным спамом просачиваются...
обучение ведется... с бесом экспериментировал...


"Спамооборона"
Отправлено DeadLoco , 25-Фев-11 13:36 
> но некоторые письма с русскоязычным спамом просачиваются...
> обучение ведется... с бесом экспериментировал...

Как много писем просачивается? Можете прикинуть хотя бы на глаз три показателя:
- отношение входящего спама к хэму
- отношение пропущенного спама к отсеяному
- отношение пропущенного спама к хэму

Стопроцентного отсеивания не гарантирует ни одна система. Даже гугломейл, при всей его моще, на прошлой неделе пропустил ко мне около десятка спамовых писем. Спамеры ищут обходов вокруг байесов, и время от времени появляются новые техники, которые приводят к пробою спаморезки. Единственное, что может помочь - это постоянное дообучение байеса силами юзеров. Кстати, платные сервисы, продающие доступ к спам-фильтрам, эти спам-фильтры формируют тоже вручную, артелями молотобойцев, которые сортируют письма. Никакого волшебства.

Поэтому, если СА пропускает некоторое количество спама - это нормально. Другое дело, что это количество не должно быть слишком высоко. На моих серверах на тысячу попыток впихнуть спам, удачей завершаются 1-2. На 1-2 спамовых письма приходится 50-60 нормальных писем. То-есть, абсолютный показатель фильтрации - 99.8%, относительный - 97%. Можно получить и более высокие значения, но тогда резко возрастает риск получить фальш-позитив. А мои клиенты этого не любят.


"Спамооборона"
Отправлено alex , 25-Фев-11 14:11 
> Как много писем просачивается? Можете прикинуть хотя бы на глаз

в цифрах не скажу, сейчас лениво точно считать...
на вскидку, спамассассин на данный момент видит не больше 80% спама, весь просачивающийся спам - русскоязычный. Если бы не правила приема писем самого почтовика, который на данный момент не пропускает просто подавляющую часть спама, то спамассасин работал бы еще хуже...

Я к чему веду, ведь спамассасин изначально, вроде как, разрабатывался под англоязычный спам, поэтому по определению должен хуже находить русскоязычный спам.... или вы с этим утверждением не согласны?


"Спамооборона"
Отправлено DeadLoco , 25-Фев-11 22:25 
> ведь спамассасин изначально, вроде как, разрабатывался под англоязычный
> спам, поэтому по определению должен хуже находить русскоязычный спам.... или вы
> с этим утверждением не согласны?

Мнэ-эээ... как бы это сказать... покомплементарнее...

Спамассассин не работает с языками. Он не понимает, на каком языке написано письмо. Ему просто нечем понимать, это всего лишь несколько тысяч строк на перле. СА работает с последовательностями байтов, разделенных пробелами, табами и символами новой строки. СА совершенно безразлично, являются ли обрабатываемые последовательности байтов однобайтовыми кодировками вроде СР866, КОИ8-Р или еще какой ВИН1251. Ему даже по барабану двухбайтовые УТФ и ЦЖК, ему без разницы даже еврейские тексты справа налево с пропущенными гласными. От пробела до пробела, цепочка байт, смысла которых СА не понимает - ибо не нуждается в этом.

А в чем он нуждается - это в построении базы с цепочками байтов и связанными с ними вероятностяями спамовости письма, содержащего каждую отдельную цепочку. Получив тело письма, байесовский фильтр всего лишь проверяет его на предмет вхождения цепочек байтов, накапливает полученные вероятности и перемножает их, в строгом соответствии с теоремой Байеса. Все. Будет обрабатываемое письмо на английском, на суахили или, извиняюсь, на русском - это СА глубоко и широко безразлично.


"Спамооборона"
Отправлено Xaionaro , 26-Фев-11 00:09 
> Здравствуйте.
> Кто что может сказать по поводу яндексовской спамообороны? Сейчас стоит спамассасин, есть
> некоторая проблема с русскоязычным спамом, кое-что пропускается... Встал вопрос о переходе.
> Имеет ли смысл?

Ну, во-первых грамотно администрируемый SA может быть очень полезен, а во-вторых такие вещи как spamoborona и spamassasin - это уже последние средства, когда всё остальное не помогает. Вы для начала хотя бы greylisting пробывали? Отсеивает огромный процент спама и не отсеивает ниодного нужного письма.


"Спамооборона"
Отправлено DeadLoco , 26-Фев-11 03:58 
> Вы для начала хотя бы greylisting пробывали?
> Отсеивает огромный процент спама и не отсеивает ниодного нужного письма.

Грейлистинг мертв.

С развитием спамботов и ботсетей, когда один бот отсылает 30-50 писем в час, уже не представляет сложности повторить отправку при получении 452. Чтобы получить хотя бы 75% фильтрации посредством грейлистинга, приходится задирать таймауты до совершенно неприемлемых значений. Да, как альтернатива полному отсутствию входного контроля, грейлистинг впечатляет. Но есть гораздо более эффективные техники.

Я использую систему начисления штрафных очков на стадии RCPT. Ни одно отдельное нарушение - ни кривое невовремя поданное хело, ни отсутствие корректного резолва, ни наличие плохих слов в имени хоста - не приводит к отлупу. Но два тяжелых косяка (скажем, кривое хело и *dynamic* в имени хоста) или три-четыре легких означают неминуемый отлуп. Так режется ~90% спама. Остальное скармливается СА.


"Спамооборона"
Отправлено zerot , 26-Фев-11 15:36 
>> Вы для начала хотя бы greylisting пробывали?
>> Отсеивает огромный процент спама и не отсеивает ниодного нужного письма.
> Грейлистинг мертв.

ну уж мертв. далеко не все боты работают так интеллектуально, вместе с гритинг паузой (в начале сеанса) и проверкой существования отправителя режется прилично - от 90% и выше