URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 93998
[ Назад ]

Исходное сообщение
"Увидел свет Apache SpamAssassin 3.4.0"

Отправлено opennews , 11-Фев-14 21:33 
После двух лет разработки и четырёх лет с момента прошлого значительного выпуска представлен (https://blogs.apache.org/foundation/entry/the_apache_softwar... релиз платформы для организации фильтрации спама - SpamAssassin 3.4.0 (http://spamassassin.apache.org). Код SpamAssassin написан на языке Perl и распространяется в рамках лицензии Apache. SpamAssassin является одним из самых эффективных и широкоиспользуемых  платформ для фильтрации спама. По данным январской статистики загрузки обновлений правил фильтрации спама пакет используется на более чем миллионе почтовых серверов.

Наряду с http-сервером Apache, SpamAssassin  включен изданием eWeek в список 11 технологий Apache, которые изменили компьютерные системы за последние 10 лет.


В SpamAssassin реализован комплексный подход в принятии решения о блокировании: сообщение подвергается ряду проверок (контекстный анализ, черные и белые списки DNSBL, обучаемые байесовские классификаторы, проверка по сигнатурам, аутентификация отправителя по SPF и DKIM и т.п.). После оценки сообщения разными методами, накапливается определенный весовой коэффициент. Если вычисленный коэффициент превышает определенный порог - сообщение блокируется или помечается как спам.  Поддерживаются средства автоматического обновления правил фильтрации. Пакет может использоваться как на клиентских, так и на серверных системах.

Особенности нового выпуска:


-  Реализация поддержки IPv6;
-  Улучшение технологии блокирования с использованием проверки по черным спискам через DNS (DNSBL);
-  Реализация высокомасштабируемых вероятностных байесовских фильтров (http://ru.wikipedia.org/wiki/%D0%91%D0%B... с хранением накопленных статистических данных в БД Redis.


URL: https://blogs.apache.org/foundation/entry/the_apache_softwar...
Новость: http://www.opennet.me/opennews/art.shtml?num=39065


Содержание

Сообщения в этом обсуждении
"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 11-Фев-14 21:33 
Ну слава богу, я уже думал что проект впал в глубокую стагнацию и давно не развивается.

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено AlexAT , 11-Фев-14 21:41 
Неплохо бы уже переписать его на чем-нибудь вменяемом - C++, или хотя бы питоне или PHP. Глядишь и популярность подымется.

Основная проблема таких умирающих олдскульных проектов (sendmail, spamassasin, ...) на перле - оно тупо несаппортабельно и очень плохо поддается модификации под собственные нужды.


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 11-Фев-14 21:43 
С PHP получился перебор, без него я бы решил что это всё-таки не троллинг.

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено AlexAT , 11-Фев-14 21:58 
> С PHP получился перебор, без него я бы решил что это всё-таки не троллинг.

Это всерьез не троллинг, в данном случае PHP подразумевается именно в прямой своей функции - как удобная и гибкая обвязка вокруг различных сишных библиотек :) Прелесть - в читабельности, и отсутствии необходимости постоянно перелинковывать код при отладке.

Да, можно еще на жаве переписать, но у нее рантайм выйдет даже потяжелее. Плюс-таки махровая проприетарь, если каноничная.


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Ф , 11-Фев-14 22:08 
PHP, конечно хорош, но лучше обратить внимание на более динамически развивающиеся языки с огромным пулом профессиональных программистов, чтобы нивелировать вклад фанатичных студентиков, например, C#.

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено AlexAT , 11-Фев-14 22:12 
> PHP, конечно хорош, но лучше обратить внимание на более динамически развивающиеся языки
> с огромным пулом профессиональных программистов, чтобы нивелировать вклад фанатичных
> студентиков, например, C#.

Можно и на C#, на там то же, что и с джавой - нев****нных размеров рантайм, и махровая проприетарь с вендорлоком.

Плюсы всем хороши в данном аспекте, за исключением одного - изменил в одном из макросов/темплейтов в часто юзаемом хедере плюс на минус, и будь добр пересобрать полпроекта.


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 11-Фев-14 22:15 
>  PHP, конечно хорош, но лучше обратить внимание на более динамически развивающиеся языки с огромным пулом профессиональных программистов, чтобы нивелировать вклад фанатичных студентиков, например, C#.

Это C# как раз формирует субкультуру юношей бледных со взором горящим.
А на PHP просто лабают за бабки.

Тем временем, матерые профессионалы вообще с жабы не слезали.


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено SubGun , 11-Фев-14 23:04 
"Матерые профессионалы" используют инструмент под задачи, а не с оглядкой на моду и понты.

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 11-Фев-14 23:36 
> "Матерые профессионалы" используют инструмент под задачи, а не с оглядкой на моду и пoнты.

Для этого нужно знать много инструментов. Поэтому навыки владения каждым из них у ваших "профессионалов" будут уступать навыкам реальных профессионалов - очень узких специалистов.
Не они выбирают инструмент под задачи, а их направляют туда, где их навыки востребованы.


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 12-Фев-14 00:15 
Навыки владения, конечно, будут немного уступать, но обычно намного эффективней использовать для вкручивания шурупов всё-таки шуруповерт, которым профессионал владеет на 90%, чем молоток, которым узкий специалист владеет на 100%.

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Анонима , 12-Фев-14 03:35 
Вы, видимо не поняли, что Вам написали.
В контексте Вашего сообщения: Узкого специалиста по молоткам отправят на работу по забиванию гвоздей

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 12-Фев-14 03:59 
Вы, видимо, не очень видели матёрых профессионалов, и представляете себе какой "утренний развод на работы" PHP-шников первого года обучения.

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 11-Фев-14 22:16 
> Это всерьез не троллинг, в данном случае PHP подразумевается именно в прямой
> своей функции - как удобная и гибкая обвязка вокруг различных сишных
> библиотек :) Прелесть - в читабельности, и отсутствии необходимости постоянно перелинковывать код при отладке.

По всем этим параметрам - posix shell подходит гораздо лучше.


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено 1 , 12-Фев-14 10:16 
Ээээ - это главное преимущество PHP перед Perl ?

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено AlexAT , 12-Фев-14 10:17 
> Ээээ - это главное преимущество PHP перед Perl ?

Читабельность? Одно из. В принципе почти любой из используемых всерьёз языков имеет это преимущество перед Perl.


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Некто , 12-Фев-14 10:41 
Скажи что просто не осилил Perl:))

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 12-Фев-14 20:44 
> Скажи что просто не осилил Perl:))

Ну что же поделаешь если подрастающее племя - слабаки?

Кстати - покажите мне реализацию SA __не__ на Перле?
А хрен - это тот редкий случай когда язык был выбран под задачу абсолютно точно!


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено www2 , 12-Фев-14 17:09 
>Это всерьез не троллинг, в данном случае PHP подразумевается именно в прямой своей функции - как удобная и гибкая обвязка вокруг различных сишных библиотек :)

Perl - это не только удобная и гибкая обвязка вокруг различных сишных библиотек, но ещё и большое внимание к совместимости и удобные и быстрые регулярки, на которые половина SpamAssassin'а завязана.

>Прелесть - в читабельности, и отсутствии необходимости постоянно перелинковывать код при отладке.

Освой Perl, читабельность будет такая же. Проблем-то. PHP не сильно читабельнее Perl'а. Лучше уж бидон, который - не вариант, потому что такая же хреновая _платформа_, как и PHP (в каждом релизе что-то устаревает, а модули в массе - говно, за редкими исключениями).

Вместо бидона по читабельности, и в качестве альтернативы голому C++, можно предложить lua. Читабелен, быстр и модули повменяемее.


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 12-Фев-14 22:39 
Был бы для Lua еще CPAN.

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено www2 , 15-Фев-14 10:57 
> Был бы для Lua еще CPAN.

Этого, уж извините, нет. Это отдельное культурное явление, которое не удалось воспроизвести ни Python'у, ни PHP. Есть такой вот каталог: http://luaforge.net/projects/


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 16-Фев-14 12:09 
Ну так и я о чем - свалки есть, а CPAN'a нет. Нигде. Совсем. Мистика какая-то.

Ну а так-то luarocks есть.


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено жопка3 , 11-Фев-14 22:11 
rspamd

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено oops , 12-Фев-14 10:40 
Эх, так и не нашел времени его попробовать. Есть какой-то опыт?

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено жопка3 , 12-Фев-14 11:37 
Опыт есть.
Работает, тюнить под себя можно сколько угодно, баги есть, быстрый.

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено www2 , 12-Фев-14 17:11 
> Опыт есть.
> Работает, тюнить под себя можно сколько угодно, баги есть, быстрый.

Смущает наличие багов. Какие встречались? Насколько критичные?


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено жопка3 , 12-Фев-14 17:47 
0.6.7 достаточно стабильный.
Корок в продакшене я от него не видел. Правда там оторвана обработка SIGHUP, так что только хардкор, только TERM или KILL.
Плюс ловил баг обработки писем с корявой mime частью (где то в < 0.6.7).

Такого что рандомные, постоянные, сегфолты, утечки памяти или что-то подобное - нет.
Автор адекватен, спрашивал о всех проблемах его в IRC, получал ответы :)

Видно, что писался rspamd под нужды и требования больших почтовых хостингов e.g. возможность репликации логов обучения bayes, возможность обучения через HTTP bayes, fuzzy, возможность проверки писем через HTTP.

15К писем менеджера на xen контейнере с гигом мозгов и двумя ядрами проверялись наверное около 5 минут



"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено www2 , 12-Фев-14 19:39 
> 0.6.7 достаточно стабильный.
> Корок в продакшене я от него не видел. Правда там оторвана обработка
> SIGHUP, так что только хардкор, только TERM или KILL.
> Плюс ловил баг обработки писем с корявой mime частью (где то в
> < 0.6.7).
> Такого что рандомные, постоянные, сегфолты, утечки памяти или что-то подобное - нет.

Это хорошо, спасибо.

> Автор адекватен, спрашивал о всех проблемах его в IRC, получал ответы :)

Автор мне знаком по блогу и статьям в "Системном администраторе", это Всеволод Стахов.

> Видно, что писался rspamd под нужды и требования больших почтовых хостингов e.g.
> возможность репликации логов обучения bayes, возможность обучения через HTTP bayes, fuzzy,
> возможность проверки писем через HTTP.

Для Rambler'а делалось, очевидно. Вместе с rmilter.

> 15К писем менеджера на xen контейнере с гигом мозгов и двумя ядрами
> проверялись наверное около 5 минут


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено FrBrGeorge , 11-Фев-14 23:04 
Второе предложение доставляет неиллюзорно. Для ясности:
- sendmail написан на Си
- spamassassin очень даже живой проект
- программы на perl кроссплатформенные по определению (тот же spamassassin: Win ,*nix, Mac, ...)
- особенность spamassassin именно в том, что он крайне гибко приспособлен к модификации под собственные нужды

Трудно поверить, что это не троллинг, право же.


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено rshadow , 12-Фев-14 01:11 
> Трудно поверить, что это не троллинг, право же.

Ему просто не нравиться что на перл. Это очевидно.


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено SubGun , 12-Фев-14 11:31 
Да никому не нравится, тормоза дикие.

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено oops , 12-Фев-14 10:38 
не тратьте свое время. человек просто совсем не в теме.

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Добрый доктор , 11-Фев-14 23:34 
«C++»!!! — вы издалека хотя бы видели плюсы?? :)

На перле оно тянет нагрузки, которые вам, как не имеющему понятия о хай-лоад, и не снились.

Амависы и полиси тоже «перписать на ++»? :) :) :)


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 12-Фев-14 00:36 
Вы рвете мои паттерны: хайлоад и интерпретируемый язык без jit и garbage collector — практически взаимоисключающие понятия.

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Добрый доктор , 12-Фев-14 01:05 
Ваши паттерны порвала вам акушерка.

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено rshadow , 12-Фев-14 01:13 
Скажите это фейсбуку на пхп =) </троллинг>

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 12-Фев-14 05:44 
> Скажите это фейсбуку на пхп =)

Это которые хипхоп запилили, чтобы его в си++ транслировать? Ну да, они доперли что так быстрее :).


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 12-Фев-14 01:30 
А garbage collector-то в ту же кучу с какого свалили?
Он в хайлоаде как раз немножечко вреден, мягко говоря.
Хорошо что в Perl его нет.

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 12-Фев-14 02:27 
хайлоад и с JIT не дружит.
внезапно.
man erlang, man haskell
с обоих нативный код, генерируемый - рвет как грелку, все альтернативы на большинстве целевых/поддерживаемых платформ.

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 12-Фев-14 02:47 
Это смотря какой JIT. С LuaJIT всё более в порядке, в том числе в ngx_lua.

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 12-Фев-14 15:26 
Это с каких пор в erlang нативный код?
По все бенчмаркам, которые я видел, допотопный beam остается далеко позади java/scala.

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено hummermania , 13-Фев-14 17:00 
erlang-hipe не оно?

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 13-Фев-14 22:48 
да уж лет пять как смерджили в апстриме в основную тушку эранга - компилятор бинарников(раньше звалось hi-perf).
вылазьте уж из анабиоза, Пора !!
vm-ка Эрланга - хороша лишь для разработки и отладки.
выкатывается - именно Нативный код.

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Perl_Jam , 12-Фев-14 03:33 
> Вы рвете мои паттерны: хайлоад и интерпретируемый язык без jit и garbage
> collector — практически взаимоисключающие понятия.

не троллинга ради.. научитесь готовить perl и забудьте о моде. вы сейчас его еще предложите на javascript переписать


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 12-Фев-14 06:29 
хайлоад и язык _с_ jit и garbage collector - тоже взаимоисключающие понятия

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 12-Фев-14 08:38 
Расскажите taobao об этом, пусть с Java и LuaJIT быстрей на PHP переходят

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено AlexAT , 12-Фев-14 10:17 
> Расскажите taobao об этом, пусть с Java и LuaJIT быстрей на PHP
> переходят

Может еще микрософту рассказать?


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 12-Фев-14 15:27 
Вам показалось, советую проспаться.

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено www2 , 12-Фев-14 17:15 
> Вы рвете мои паттерны: хайлоад и интерпретируемый язык без jit и garbage
> collector — практически взаимоисключающие понятия.

Язык полукомпилируемый, у него унутре - PVM. GC там, к сведению, есть, потому что это язык с автоматическим управлением памятью. На хайлоаде он себя хорошо зарекомендовал потому что на большинство критичных функций есть модули XS, которые написаны на C или C++.


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 13-Фев-14 04:08 
Это с каких пор reference counting стал считаться GC?

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено www2 , 15-Фев-14 11:00 
> Это с каких пор reference counting стал считаться GC?

Кагбэ это один из возможных алгоритмов реализации GC. А что подразумеваете под GC Вы?


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено ALex_hha , 12-Фев-14 00:49 
> Неплохо бы уже переписать его на чем-нибудь вменяемом - C++, или хотя
> бы питоне или PHP. Глядишь и популярность подымется.
> Основная проблема таких умирающих олдскульных проектов (sendmail, spamassasin, ...) на
> перле - оно тупо несаппортабельно и очень плохо поддается модификации под
> собственные нужды.

вы еще на асемблере предложите :D


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Pilat , 12-Фев-14 11:09 
>> Неплохо бы уже переписать его на чем-нибудь вменяемом - C++, или хотя
>> бы питоне или PHP. Глядишь и популярность подымется.
> вы еще на асемблере предложите :D

Лучше на Руби.



"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 12-Фев-14 11:22 
Чтоб тормозил посильней и юникод отвалился?

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Pilat , 12-Фев-14 11:54 
> Чтоб тормозил посильней и юникод отвалился?

Нет, что бы дураки успокоились. Юмор это был.


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Perl_Jam , 12-Фев-14 03:24 
> Неплохо бы уже переписать его на чем-нибудь вменяемом - C++, или хотя
> бы питоне или PHP. Глядишь и популярность подымется.
> Основная проблема таких умирающих олдскульных проектов (sendmail, spamassasin, ...) на
> перле - оно тупо несаппортабельно и очень плохо поддается модификации под
> собственные нужды.

ИМХО perl тут никаким боком. а проблема sendmail'a явно в другом.


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено AlexAT , 12-Фев-14 07:26 
> ИМХО perl тут никаким боком. а проблема sendmail'a явно в другом.

Ну да, про sendmail я тут явно протупил. Но всё остальное без изменений.


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено oops , 12-Фев-14 10:54 
остальное - это то, что именно вам просто не нравится perl. Возможно вы даже не писали на нем никогда.

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 11-Фев-14 22:12 
Ах, он оказывается апачевский... то-то он так тормозит.

А посоветуйте, нет ли ему нормальных аналогов? Чтобы не тормозили, не пропускали 95% спама, не требовали работы от рута и не срaли логами razar-agent в корень. Это просто феерия какая-то...


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено AlexAT , 11-Фев-14 22:15 
> Чтобы не тормозили, не пропускали 95% спама, не требовали работы от рута и не срaли логами

man omgwtf


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено FrBrGeorge , 11-Фев-14 23:08 
> Ах, он оказывается апачевский... то-то он так тормозит.

Нет, тормозит он не от этого. Математика там густая и в полной оснастке довольно много трафика (правда, есть ручка "не использовать модули, которым нужна сеть"). А апачевский он сравнительно недавно.

> А посоветуйте, нет ли ему нормальных аналогов?

IMHO, нет.


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Andrey Mitrofanov , 12-Фев-14 10:51 
>А апачевский он сравнительно недавно.

С 2004-го, судя по википедии. Недавно, по масштабам Вселенной?


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено FrBrGeorge , 14-Фев-14 14:48 
Упс. И верно ведь. Какой я старый :(

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено umbr , 11-Фев-14 23:17 
можно включить голову и читать маны и RFC, до полного просветления

"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено SubGun , 11-Фев-14 22:59 
> Он в течение года проходил тестирования на многих крупных почтовых системах

В мемориз.


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 12-Фев-14 03:04 
У меня 12K RCPT фронтэндит. Вообще без напряга. средний траффик 8К msgs/h

Так чта ... "ПионЭры! Идите в >|<опу!"(С)ФР


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Andrey Mitrofanov , 12-Фев-14 10:56 
#>>>на многих крупных почтовых системах
> У меня 12K RCPT фронтэндит

Постеснялся бы, октЭбрёнок.

> Так чта ... "ПионЭры! Идите в >|<опу!"(С)ФР


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Аноним , 12-Фев-14 20:58 
>> У меня 12K RCPT фронтэндит
> Постеснялся бы, октЭбрёнок.

А - дык ты тот самый Ондрейка который фильтрует весь мэйл траффик для gmail,mail.ru,People Republick of China,Moscow Republic of Russia ... и всё на локалхосте, снимаю шляпу, чё там. Пошел стесняться :-\

А у меня вот сколько есть - столько и есть, всякие мелкие финансы и прочий бусинес. .ca, уж извини больше пока нету ...

Но конечно мой мнение против афффтаритетного мнения одминов локалхостов фильтрующих вышеуказанное - просто овно. Всё - пошёл сливаться в дворники. :)


"Увидел свет Apache SpamAssassin 3.4.0"
Отправлено Andrey Mitrofanov , 13-Фев-14 15:14 
>> Постеснялся бы, октЭбрёнок.
> А - дык ты тот самый Ондрейка который фильтрует весь мэйл

Да, я это он. Сравнил с соседним сервером, 8К/ч это дофига.
Считаю безобразной ошибкой, вякнул фигню.