<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: spamassasin, анализ body на русском</title>
    <link>https://opennet.me/openforum/vsluhforumID1/91275.html</link>
    <description>Здравствуйте. Вообщем решил довести до ума spamassassin.. Придется поанализировать немного body. На латинице все нормально работает. Делал вида: &lt;br&gt;body PORNO /porno/&lt;br&gt;score PORNO 10&lt;br&gt;&lt;br&gt;Но основная масса спама прет на русском. В таком варианте на русском не работает. В чем может быть проблема? В кодировке? Заранее благодарен.&lt;br&gt;</description>

<item>
    <title>spamassasin, анализ body на русском (dovzz)</title>
    <link>https://opennet.me/openforum/vsluhforumID1/91275.html#5</link>
    <pubDate>Wed, 30 Mar 2011 08:05:11 GMT</pubDate>
    <description>&amp;gt;&amp;gt; Вообще байес вроде как срабатывает неплохо, но всеже иногда бывают проскоки....&lt;br&gt;&amp;gt; обучайте ) &lt;br&gt;&amp;gt;&amp;gt; Тогда вопрос на засыпку, нельзя ли как то отделить, т.е. прописать так, &lt;br&gt;&amp;gt;&amp;gt; чтобы реагировало на чистое слово &quot;порно&quot;, а не в составе какого &lt;br&gt;&amp;gt;&amp;gt; либо слова???&lt;br&gt;&amp;gt; можно )) но: &lt;br&gt;&amp;gt; поорно порноо ... задолбаешься регексы придумывать ...&lt;br&gt;&lt;br&gt;Ясно, вообщем с ума можно сойти)&lt;br&gt;Ладно я не так давно настраивал, думаю стоит сначала последить...&lt;br&gt;Спасибо за консультацию!)&lt;br&gt;</description>
</item>

<item>
    <title>spamassasin, анализ body на русском (Pahanivo)</title>
    <link>https://opennet.me/openforum/vsluhforumID1/91275.html#4</link>
    <pubDate>Wed, 30 Mar 2011 06:48:01 GMT</pubDate>
    <description>&amp;gt; Вообще байес вроде как срабатывает неплохо, но всеже иногда бывают проскоки....&lt;br&gt;&lt;br&gt;обучайте )&lt;br&gt;&amp;gt; Тогда вопрос на засыпку, нельзя ли как то отделить, т.е. прописать так, &lt;br&gt;&amp;gt; чтобы реагировало на чистое слово &quot;порно&quot;, а не в составе какого &lt;br&gt;&amp;gt; либо слова???&lt;br&gt;&lt;br&gt;можно )) но:&lt;br&gt;поорно порноо ... задолбаешься регексы придумывать ...&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>spamassasin, анализ body на русском (dovzz)</title>
    <link>https://opennet.me/openforum/vsluhforumID1/91275.html#3</link>
    <pubDate>Wed, 30 Mar 2011 06:18:45 GMT</pubDate>
    <description>&amp;gt;&amp;gt; И чем нехорошим это может грозить?&lt;br&gt;&amp;gt; 1) /porno/ врядли будет во всех кодировках работать )) &lt;br&gt;&amp;gt; 2) /порно/ .. я просто приведу примеры ложного срабатывания регекса: &lt;br&gt;&amp;gt; бесспорно, спорное, упорно, запорной, напорного, опорного, чопорность .....&lt;br&gt;&amp;gt; ап: вообще для этого есть Байес.&lt;br&gt;&lt;br&gt;Спасибо про пункт 2), не подумал)))&lt;br&gt;Про латиницу я и не спрашивал, просто приводил пример))&lt;br&gt;&lt;br&gt;Вообще байес вроде как срабатывает неплохо, но всеже иногда бывают проскоки.... &lt;br&gt;Тогда вопрос на засыпку, нельзя ли как то отделить, т.е. прописать так, чтобы реагировало на чистое слово &quot;порно&quot;, а не в составе какого либо слова??? &lt;br&gt;</description>
</item>

<item>
    <title>spamassasin, анализ body на русском (Pahanivo)</title>
    <link>https://opennet.me/openforum/vsluhforumID1/91275.html#2</link>
    <pubDate>Wed, 30 Mar 2011 06:05:47 GMT</pubDate>
    <description>&amp;gt; И чем нехорошим это может грозить?&lt;br&gt;&lt;br&gt;1) /porno/ врядли будет во всех кодировках работать ))&lt;br&gt;2) /порно/ .. я просто приведу примеры ложного срабатывания регекса:&lt;br&gt;бесспорно, спорное, упорно, запорной, напорного, опорного, чопорность .....&lt;br&gt;ап: вообще для этого есть Байес.&lt;br&gt;</description>
</item>

<item>
    <title>spamassasin, анализ body на русском (dovzz)</title>
    <link>https://opennet.me/openforum/vsluhforumID1/91275.html#1</link>
    <pubDate>Wed, 30 Mar 2011 05:48:36 GMT</pubDate>
    <description>&amp;gt; Здравствуйте. Вообщем решил довести до ума spamassassin.. Придется поанализировать немного &lt;br&gt;&amp;gt; body. На латинице все нормально работает. Делал вида: &lt;br&gt;&amp;gt; body PORNO /porno/ &lt;br&gt;&amp;gt; score PORNO 10 &lt;br&gt;&amp;gt; Но основная масса спама прет на русском. В таком варианте на русском &lt;br&gt;&amp;gt; не работает. В чем может быть проблема? В кодировке? Заранее благодарен. &lt;br&gt;&lt;br&gt;Забыл сказать что если normalize поставлю 0 то работает, но вопрос? Во всех ди кодировках будет тогда работать? И чем нехорошим это может грозить?&lt;br&gt;&lt;br&gt;&lt;br&gt;</description>
</item>

</channel>
</rss>
