<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: OpenSolaris, странный рост нагрузки CPU</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID1/95952.html</link>
    <description>Добрый день!&lt;br&gt;&lt;br&gt;Сервер на OpenSolaris в качестве NAS с образами виртуальных машин. На сервере стоит агент системы мониторинга Munin, по данным которого сегодня замечен странный рост нагрузки на ЦП (картинка по ссылке). Load average также экспоненциально растет и составляет сейчас 0.6.&lt;br&gt;При этом с помощью prstat идентифицировать потребляющий процесс не удается, как будто все в норме:&lt;br&gt;&lt;br&gt;$ prstat &amp;#124; head&lt;br&gt;   PID USERNAME  SIZE   RSS STATE  PRI NICE      TIME  CPU PROCESS/NLWP       &lt;br&gt;   312 root      279M  260M cpu0     1    0  90:46:11 5,5&#037; java/50&lt;br&gt;   559 daemon   2952K 1764K sleep   60  -20 257:13:11 0,3&#037; nfsd/18&lt;br&gt;  6956 root     9856K 3312K sleep    0    0   0:00:00 0,0&#037; munin-node/1&lt;br&gt;  7616 james    5620K 2628K cpu7    59    0   0:00:00 0,0&#037; prstat/1&lt;br&gt;   400 root     2576K  984K sleep   59    0   0:00:00 0,0&#037; in.ndpd/1&lt;br&gt;   150 root     2188K 1152K sleep   59    0   0:00:00 0,0&#037; powerd/4&lt;br&gt;   227 root     3884K 1272K sleep   59    0   0:00:04 0,0&#037; cron/1&lt;br&gt;   171 root     5996K 2128K sleep   59    0   0:0</description>

<item>
    <title>OpenSolaris, странный рост нагрузки CPU (tikh)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID1/95952.html#9</link>
    <pubDate>Mon, 26 Jan 2015 13:21:34 GMT</pubDate>
    <description>&amp;gt; top рабочий видел много раз, но к делу оно не относится. :) &lt;br&gt;&amp;gt; Тогда проверьте, что ли, насколько показания munin соответствуют тому, что будет показывать, &lt;br&gt;&amp;gt; например, вывод vmstat 5. Это родная команда, точно должна показывать реальные &lt;br&gt;&amp;gt; цифры.&lt;br&gt;&amp;gt; А вообще - вопрос возник из-за показаний munin или вы каким-то образом &lt;br&gt;&amp;gt; ощущаете, что сервер действительно медленне стал?&lt;br&gt;&lt;br&gt;по vmstat все ок, загрузка не более 10&#037;!&lt;br&gt;Вообще насторожил исключительно munin, все работает с той же производительностью. наверное действительно какой-то косяк в математике модуля munin, который обрабатывает данные от kstat. понаблюдаю дальше..&lt;br&gt;&lt;br&gt;Большое спасибо Вам за комментарии!&lt;br&gt;</description>
</item>

<item>
    <title>OpenSolaris, странный рост нагрузки CPU (старый сантехник)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID1/95952.html#8</link>
    <pubDate>Mon, 26 Jan 2015 13:10:35 GMT</pubDate>
    <description>top рабочий видел много раз, но к делу оно не относится. :)&lt;br&gt;&lt;br&gt;Тогда проверьте, что ли, насколько показания munin соответствуют тому, что будет показывать, например, вывод vmstat 5. Это родная команда, точно должна показывать реальные цифры.&lt;br&gt;&lt;br&gt;А вообще - вопрос возник из-за показаний munin или вы каким-то образом ощущаете, что сервер действительно медленне стал?&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>OpenSolaris, странный рост нагрузки CPU (tikh)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID1/95952.html#7</link>
    <pubDate>Mon, 26 Jan 2015 12:48:01 GMT</pubDate>
    <description>&amp;gt; ну можно по очереди гипотезы двигать, начать таки с дисков &lt;br&gt;&amp;gt; В момент такой непонятной нагрузки запустите что-то типа iostat -snx 5 &lt;br&gt;&amp;gt; Вот там будет видно есть ли wait проценты на отдельных дисках.&lt;br&gt;&amp;gt; И, как ни странно, раскладку по состоянию системы - system, user, wait &lt;br&gt;&amp;gt; лучше чем prstat дает старый добрый top. Как я помню, на &lt;br&gt;&amp;gt; OpenSolaris он тоже был. Посмотрите, что он дает в моменты такой &lt;br&gt;&amp;gt; нагрузки &lt;br&gt;&lt;br&gt;так дело в том, что эта &quot;нагрузка&quot; наблюдается прямо сейчас по данным munin, 2 года была на уровне 5&#037; а за последнюю неделю выросла до 70&#037;! По iostat все впорядке:&lt;br&gt;&lt;br&gt;    r/s    w/s   kr/s   kw/s wait actv wsvc_t asvc_t  &#037;w  &#037;b device&lt;br&gt;    0.0    0.0    0.0    0.0  0.0  0.0    0.0    0.0   0   0 fd0&lt;br&gt;    0.0    0.0    0.0    0.0  0.0  0.0    0.0    0.0   0   0 c7t0d0&lt;br&gt;   77.2    1.8 9804.1  128.0  0.0  3.2    0.0   40.2   0  39 c7t1d0&lt;br&gt;    0.0    0.0    0.0    0.0  0.0  0.0    0.0    0.0   0   0 c7t2d0&lt;br&gt;&lt;br&gt;а вот top возвращает Segmentation Fault. Вообще top на opensolaris работающим видел только</description>
</item>

<item>
    <title>OpenSolaris, странный рост нагрузки CPU (старый сантехник)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID1/95952.html#6</link>
    <pubDate>Mon, 26 Jan 2015 12:00:48 GMT</pubDate>
    <description>ну можно по очереди гипотезы двигать, начать таки с дисков&lt;br&gt;&lt;br&gt;В момент такой непонятной нагрузки запустите что-то типа iostat -snx 5&lt;br&gt;&lt;br&gt;Вот там будет видно есть ли wait проценты на отдельных дисках.&lt;br&gt;&lt;br&gt;И, как ни странно, раскладку по состоянию системы - system, user, wait лучше чем prstat дает старый добрый top. Как я помню, на OpenSolaris он тоже был. Посмотрите, что он дает в моменты такой нагрузки&lt;br&gt;</description>
</item>

<item>
    <title>OpenSolaris, странный рост нагрузки CPU (tikh)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID1/95952.html#5</link>
    <pubDate>Mon, 26 Jan 2015 11:33:27 GMT</pubDate>
    <description>&amp;gt; Если вы уверены, что нет процессов, кот. занимают проц, то все-таки, наверное, &lt;br&gt;&amp;gt; надо покопать в сторону достоверности показаний munin. &lt;br&gt;&lt;br&gt;вот странно то, что 2.5 года все шло нормально, а тут вдруг поползло нечто. как раз и не знаю, чем еще можно посмотреть процессы и нагрузку, ими создаваемую&lt;br&gt; &lt;br&gt;&lt;br&gt;&amp;gt; Кстати, вот еще, как с заполненностью файловых систем? df -h, например, можете &lt;br&gt;&amp;gt; показать, не секретно? :) &lt;br&gt;&lt;br&gt;заполненность я поддерживаю вручную (удаляю накопившиеся снапшоты). на данный момент 50&#037; пулов свободно:&lt;br&gt;&lt;br&gt;$ zpool list&lt;br&gt;NAME     SIZE   USED  AVAIL    CAP  HEALTH  ALTROOT&lt;br&gt;data1   2,70T  1,54T  1,17T    56&#037;  ONLINE  -&lt;br&gt;my****  1,81T   260G  1,56T    14&#037;  ONLINE  -&lt;br&gt;rpool   9,94G  4,56G  5,37G    45&#037;  ONLINE  -&lt;br&gt;&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>OpenSolaris, странный рост нагрузки CPU (старый сантехник)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID1/95952.html#4</link>
    <pubDate>Mon, 26 Jan 2015 11:09:50 GMT</pubDate>
    <description>Если вы уверены, что нет процессов, кот. занимают проц, то все-таки, наверное, надо покопать в сторону достоверности показаний munin. Нет ли такого, что на самом деле есть некий wait, кот. интерпретируется munin как system.&lt;br&gt;&lt;br&gt;Кстати, вот еще, как с заполненностью файловых систем? df -h, например, можете показать, не секретно? :)&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>OpenSolaris, странный рост нагрузки CPU (tikh)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID1/95952.html#3</link>
    <pubDate>Mon, 26 Jan 2015 10:55:20 GMT</pubDate>
    <description> Как-то настораживает 0 для I/O &lt;br&gt;&lt;br&gt;да, есть такой момент. фактически, при повышении нагрузки на хранилище растет &apos;system&apos; на графике. на сервере raid-контроллер adaptec, ввод-вывод идет через его драйвер&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>OpenSolaris, странный рост нагрузки CPU (tikh)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID1/95952.html#2</link>
    <pubDate>Mon, 26 Jan 2015 10:44:05 GMT</pubDate>
    <description>&amp;gt; А что вы хотите найти именно командой &quot;prstat &amp;#124; head&quot;?&lt;br&gt;&amp;gt; Запустите просто prstat, полУчите живую картинку. И насколько достоверно показывает все &lt;br&gt;&amp;gt; munin? Как-то настораживает 0 для I/O при том, что машина, как &lt;br&gt;&amp;gt; я понимаю, является NFS сервером и хранилищем для вирт. машин.&lt;br&gt;&lt;br&gt;prstat я, конечно, пускал. Просто он ведь сортирует по загрузке ЦП, поэтому привел первые строки, процессы ниже - с нулевой нагрузкой.&lt;br&gt;модуль мунина берет статистику из kstat командой:&lt;br&gt;&lt;br&gt;kstat -p -c misc -m cpu_stat&lt;br&gt;&lt;br&gt;далее ее парсит. и по этим данным процент загрузки CPU взлетел за последние сутки от чего-то.&lt;br&gt;Да, сервер держит образы ВМ и раздает их по NFS. сам больше ничего не делает, остальные показатели производительности не менялись.&lt;br&gt;</description>
</item>

<item>
    <title>OpenSolaris, странный рост нагрузки CPU (старый сантехник)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID1/95952.html#1</link>
    <pubDate>Mon, 26 Jan 2015 10:35:30 GMT</pubDate>
    <description>А что вы хотите найти именно командой &quot;prstat &amp;#124; head&quot;?&lt;br&gt;&lt;br&gt;Запустите просто prstat, полУчите живую картинку. И насколько достоверно показывает все munin? Как-то настораживает 0 для I/O при том, что машина, как я понимаю, является NFS сервером и хранилищем для вирт. машин.&lt;br&gt;</description>
</item>

</channel>
</rss>
