<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: Выпуск утилиты GNU grep 3.4</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/119373.html</link>
    <description>Представлен выпуск утилиты для организации поиска данных в текстовых файлах - GNU Grep 3.4. В новой версии добавлена опция &quot;--no-ignore-case&quot;, отключающая действие настроек отмены учёта регистра символов (-i, --ignore-case). Исключено попадание под маску &quot;.&quot; некорректных последовательностей  UTF-8. При выполнении &quot;grep -Fw&quot; решены проблемы с ложным сопоставлением данных в многобайтовых локалях, отличных от UTF-8. Устранены провалы в производительности при обработке большого числа шаблонов без обратных ссылок, а также шаблонов вида &apos;01.2&apos;, приводящих к выполнению внутренней пересортировки токенов...&lt;br&gt;&lt;br&gt;Подробнее: https://www.opennet.ru/opennews/art.shtml?num=52128&lt;br&gt;</description>

<item>
    <title>Выпуск утилиты GNU grep 3.4 (супернуб)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/119373.html#87</link>
    <pubDate>Mon, 06 Jan 2020 06:22:17 GMT</pubDate>
    <description>не успеюют - быстрее сделают grepd&lt;br&gt;</description>
</item>

<item>
    <title>Выпуск утилиты GNU grep 3.4 (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/119373.html#86</link>
    <pubDate>Sun, 05 Jan 2020 13:28:19 GMT</pubDate>
    <description>Что есть ГНУ? Хорошую вещь ГНУ не назовут. &lt;br&gt;</description>
</item>

<item>
    <title>Выпуск утилиты GNU grep 3.4 (Anonymoustus)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/119373.html#85</link>
    <pubDate>Sun, 05 Jan 2020 08:46:03 GMT</pubDate>
    <description>&amp;gt; переодически&lt;br&gt;&lt;br&gt;Период, а не переод.&lt;br&gt;</description>
</item>

<item>
    <title>Выпуск утилиты GNU grep 3.4 (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/119373.html#84</link>
    <pubDate>Sat, 04 Jan 2020 20:23:28 GMT</pubDate>
    <description>&amp;gt; В UTF-8 в теории символ может до 6 байт весить, это сильно &lt;br&gt;&amp;gt; лучше или как?&lt;br&gt;&lt;br&gt;Очень в теории, текущий лимит 4 байта из соображений совместимости. И всяко лучше utf-16. &#091;1&#093; &#037;)&lt;br&gt;&lt;br&gt;По-моему, на практике 4 довольно редко встречалось и только в китайских текстах. Но это совершенно не важно, случайный доступ с юникодом просто не применяют.&lt;br&gt;&lt;br&gt;&#091;1&#093; https://en.wikipedia.org/wiki/Plane_(Unicode)&lt;br&gt;</description>
</item>

<item>
    <title>Выпуск утилиты GNU grep 3.4 (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/119373.html#83</link>
    <pubDate>Sat, 04 Jan 2020 20:08:36 GMT</pubDate>
    <description>В UTF-8 в теории символ может до 6 байт весить, это сильно лучше или как?&lt;br&gt;</description>
</item>

<item>
    <title>Выпуск утилиты GNU grep 3.4 (анонн.)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/119373.html#80</link>
    <pubDate>Fri, 03 Jan 2020 22:52:34 GMT</pubDate>
    <description>&amp;gt; rg (без кэшей, упал?), 1мб памяти в пике плюс 5.5 shared &lt;br&gt;&lt;br&gt;Чего-чего, но падений я еще не видел.&lt;br&gt;&lt;br&gt;&amp;gt; Вон я же дал датасет приближенный к реальным данным, почему не используете &lt;br&gt;&amp;gt; его? http://ftp.freedb.org/pub/freedb/freedb-complete-20191203.tar.bz2 &lt;br&gt;&lt;br&gt;Наверное, потому что не влезет в tmpfs, да и качаться будет минут 10?&lt;br&gt;&lt;br&gt;&amp;gt; Ну и стоит всё же использовать hdd, на ssd вы много данных не разместите.&lt;br&gt;&lt;br&gt;Это мне в ящике стола ковыряться, хард искать, подключать &amp;#8230; да и какой смысл измерять скорость чтения с диска, в который все и упрется (если оно не поместится в кэше).&lt;br&gt;&lt;br&gt;&amp;gt;&amp;gt;дебаг-билд &lt;br&gt;&amp;gt; нет &lt;br&gt;&lt;br&gt;Но билд, судя по паникам - кривоват.&lt;br&gt;&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>Выпуск утилиты GNU grep 3.4 (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/119373.html#79</link>
    <pubDate>Fri, 03 Jan 2020 22:36:11 GMT</pubDate>
    <description>&amp;gt; Удивительно правда, что у здешнего анонима _все_ оказалось антипаттерном, да еще и c разницей на порядки.&lt;br&gt;&lt;br&gt;Вот потому я и не хотел играть в эти идиотские чиселки. Всегда можно подобрать удобное окружение и подходящие данные, для которых чиселки какие надо получатся. Для такого инструмента как grep, в конечном счете все определяет только личная статистика использования на повседневных задачах. Моя такова, что на моих задачах и на моих машинах rg выигрывает.&lt;br&gt;&lt;br&gt;Но раз уж я влез в эту глупость, все-таки проверил grep и ag:&lt;br&gt;&lt;br&gt;&amp;gt; time grep -P &apos;(&#092;&#091;.*?&#092;&#093;+).*test&apos; test.log &amp;#124; wc -l&lt;br&gt;&lt;br&gt;6302&lt;br&gt;&lt;br&gt;real9m2.752s&lt;br&gt;user9m2.289s&lt;br&gt;sys0m0.080s&lt;br&gt;&lt;br&gt;&amp;gt; time ag &apos;(&#092;&#091;.*?&#092;&#093;+).*test&apos; test.log &amp;#124; wc -l&lt;br&gt;&lt;br&gt;6302&lt;br&gt;&lt;br&gt;real8m34.161s&lt;br&gt;user8m33.436s&lt;br&gt;sys0m0.100s&lt;br&gt;</description>
</item>

<item>
    <title>Выпуск утилиты GNU grep 3.4 (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/119373.html#78</link>
    <pubDate>Fri, 03 Jan 2020 22:34:49 GMT</pubDate>
    <description>1 файл это не спортивно. Лично мне нравится руст, но не нравится результат где примитивная утилита сливает в 20 раз на типичном юзкейсе.&lt;br&gt;</description>
</item>

<item>
    <title>Выпуск утилиты GNU grep 3.4 (анонн.)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/119373.html#77</link>
    <pubDate>Fri, 03 Jan 2020 22:19:17 GMT</pubDate>
    <description>&amp;gt; Я зарекался чиселки кидать, но ладно. Нашел рандомные логи http://www.almhuette-raith.at/apache-log/access.log &lt;br&gt;&amp;gt; (906M) &lt;br&gt;&lt;br&gt;(В)брошу свои чиселки:&lt;br&gt;&lt;br&gt;&amp;gt;&amp;gt; time rg &apos;(&#092;&#091;.*?&#092;&#093;+)&apos; access.log &amp;#124; wc -l &lt;br&gt;&amp;gt; 4595960 &lt;br&gt;&amp;gt; real 0m1.306s &lt;br&gt;&amp;gt; user 0m1.206s &lt;br&gt;&amp;gt; sys 0m0.577s &lt;br&gt;&amp;gt;&amp;gt; time grep -P &apos;(&#092;&#091;.*?&#092;&#093;+)&apos; access.log &amp;#124; wc -l &lt;br&gt;&amp;gt; 4595960 &lt;br&gt;&amp;gt; real 0m2.329s &lt;br&gt;&amp;gt; user 0m2.101s &lt;br&gt;&amp;gt; sys 0m0.949s &lt;br&gt;&lt;br&gt;с tmpfs, лучший результат 4 запусков&lt;br&gt;&#091;code&#093;&lt;br&gt;&#037; time rg -c &apos;(&#092;&#091;.*?&#092;&#093;+)&apos; access.log &lt;br&gt;4596036&lt;br&gt;rg -c &apos;(&#092;&#091;.*?&#092;&#093;+)&apos; access.log  1,46s user 0,17s system 99&#037; cpu 1,632 tota&lt;br&gt;&lt;br&gt;&#037; time rg -c -j1 &apos;(&#092;&#091;.*?&#092;&#093;+)&apos; access.log &lt;br&gt;4596036&lt;br&gt;rg -c -j1 &apos;(&#092;&#091;.*?&#092;&#093;+)&apos; access.log  1,46s user 0,15s system 99&#037; cpu 1,607 total&lt;br&gt;time /usr/local/bin/grep -cP &apos;(&#092;&#091;.*?&#092;&#093;+)&apos; access.log &lt;br&gt;4596036&lt;br&gt;&lt;br&gt;/usr/local/bin/grep -cP &apos;(&#092;&#091;.*?&#092;&#093;+)&apos; access.log  3,53s user 0,28s system 99&#037; cpu 3,813 total&lt;br&gt;&#091;/code&#093;&lt;br&gt;&lt;br&gt;&amp;gt; Ни для grep, ни для ag я результата дождаться не смог. Не &lt;br&gt;&amp;gt; знаю, с чем это связано (скорее всего с этим: https://mariusschulz.com/blog/why-using-the-greedy-</description>
</item>

</channel>
</rss>
