Здравствуйте, на сервере стоит CentOS 5.5
В последнее время начинает намертво зависать. Обычно зависает где-то на минуту, но бывает такое, что помогает только физическая перезагрузка.Во время зависания к серверу достучаться через какой-либо софт\протокол невозможно(mail, ftp, www, ssh и т.п.), но во время зависания пинг проходил(проверил только в последний раз, раньше вроде не проходил, но я не уверен)
Браузеры при открытии веб сайтов(размещённых на этом сервере) не сразу дают ошибку, а сначала как будто начинают загружать страницу, но через несколько минут выдают ошибку.
SSH вообще не даёт таймаут или сообщение "Сервер недоступен" или что-то в этом роде, что обычно происходит когда на 22 порту нет ssh демона, а как будто устанавливает соединения, но приглашения ввести имя пользователя и пароль для авторизации я не получаю всёравно.Где-то в сети на каком-то форуме читал о возможной проблеме:
Процессор очень сильно загружается чем-либо и просто не успевает ответить на запросы того-же www или ssh. Тоесть отвечает с большой задержкой и, если оставить ssh клиент включённым, то через некоторое время приглашение ввести имя пользователя придёт, но авторизация опять затянется на некоторое время из-за задержки с ответом от сервера, т.к. он сильно загружен и не успевает отвечать.
Прошу помочь с решением этой проблемы, говорите какие логи нужны - выложу.
P.S. не знаю к какому разделу отнести, поставил проблемы с ядром.
Наймите нормально админа.
> Наймите нормально админа.Если Вы не способны дать дельного совета, то прошу вас не оставлять в этой ветке сообщения.
Свою некомпетентность и глупость можете продемонстрировать в любой другой ветке, хотя тоже прошу вас и там воздержаться.Спасибо
> прошу вас и там воздержаться.Ну если Вы не способны нормально описать проблемы, вывод логов, мониторинга и т.д., зачем вообще спрашивать непонятно что.
Посему, не надо сетовать, когда Вам на "непонятно что", отвечают из хотя из Вашей же формулировки.
>> прошу вас и там воздержаться.
> Ну если Вы не способны нормально описать проблемы, вывод логов, мониторинга
> и т.д., зачем вообще спрашивать непонятно что.
> Посему, не надо сетовать, когда Вам на "непонятно что", отвечают из хотя
> из Вашей же формулировки.Если бы я знал, что и где анализировать в логах, то, возможно, я бы и не обращался к аудитории этого портала.
Если вы такой гуру, то объясните какие логи дать, что и как мониторить.
Для начала хотя бы написали, что на серваке крутится. какова обычная(средняя) нагрузка сервисов.
Далее, начали бы мониторить сервисы, камень и память - графики Вам бы о многом рассказали.А кто Вам по Вашему здесь что скажет конкретно, если Вы никаких данных не привели.
Хотя б почитали посты с подобными проблемами, перед тем как постить, обратили б внимание как правильно все описать.
>[оверквотинг удален]
> и пароль для авторизации я не получаю всёравно.
> Где-то в сети на каком-то форуме читал о возможной проблеме:
> Процессор очень сильно загружается чем-либо и просто не успевает ответить на запросы
> того-же www или ssh. Тоесть отвечает с большой задержкой и, если
> оставить ssh клиент включённым, то через некоторое время приглашение ввести имя
> пользователя придёт, но авторизация опять затянется на некоторое время из-за задержки
> с ответом от сервера, т.к. он сильно загружен и не успевает
> отвечать.
> Прошу помочь с решением этой проблемы, говорите какие логи нужны - выложу.
> P.S. не знаю к какому разделу отнести, поставил проблемы с ядром.Была подобная проблема на одном объекте. Там "вылетел" один из винчестеров в массиве, причем не намертво - постоянно метался между исправным состоянием и сбойным. Из-за этого массив постоянно был в REBUILD, и система блокировалась на вводе-выводе. Выдернул винт из массива - стало все хорошо.
Залил /var/log/messages
http://zalil.ru/30960921
В логе всё с того момента, с которого началось зависание, вырезал только загрузку ОС, всё остальное там. Обращайте внимание на время.Интересуют ошибки на подобии той, которая была в 09:43:04, они часто повторяются.
Так-же начиная с 14:32:16 что-то начало происходить...
Сервер после зависания перезагрузили не сразу, думаю, что причина заключается именно в ошибках начиная с 14:32:16, но точного времени зависания нет, так что может быть и это не причина.>[оверквотинг удален]
>> оставить ssh клиент включённым, то через некоторое время приглашение ввести имя
>> пользователя придёт, но авторизация опять затянется на некоторое время из-за задержки
>> с ответом от сервера, т.к. он сильно загружен и не успевает
>> отвечать.
>> Прошу помочь с решением этой проблемы, говорите какие логи нужны - выложу.
>> P.S. не знаю к какому разделу отнести, поставил проблемы с ядром.
> Была подобная проблема на одном объекте. Там "вылетел" один из винчестеров в
> массиве, причем не намертво - постоянно метался между исправным состоянием и
> сбойным. Из-за этого массив постоянно был в REBUILD, и система блокировалась
> на вводе-выводе. Выдернул винт из массива - стало все хорошо.На сервере аппаратный RAID-1 из 2-ух полторатеррабайтовых hdd
>[оверквотинг удален]
>>> пользователя придёт, но авторизация опять затянется на некоторое время из-за задержки
>>> с ответом от сервера, т.к. он сильно загружен и не успевает
>>> отвечать.
>>> Прошу помочь с решением этой проблемы, говорите какие логи нужны - выложу.
>>> P.S. не знаю к какому разделу отнести, поставил проблемы с ядром.
>> Была подобная проблема на одном объекте. Там "вылетел" один из винчестеров в
>> массиве, причем не намертво - постоянно метался между исправным состоянием и
>> сбойным. Из-за этого массив постоянно был в REBUILD, и система блокировалась
>> на вводе-выводе. Выдернул винт из массива - стало все хорошо.
> На сервере аппаратный RAID-1 из 2-ух полторатеррабайтовых hddеще раз - не хотите нанимать админа, наймите чела, который научит Вас заливать логи в нормальные сервисы.
Готов рассказать как это делается за 200 зеленых ( ибо поциент сильно стремный)
>[оверквотинг удален]
>>>> P.S. не знаю к какому разделу отнести, поставил проблемы с ядром.
>>> Была подобная проблема на одном объекте. Там "вылетел" один из винчестеров в
>>> массиве, причем не намертво - постоянно метался между исправным состоянием и
>>> сбойным. Из-за этого массив постоянно был в REBUILD, и система блокировалась
>>> на вводе-выводе. Выдернул винт из массива - стало все хорошо.
>> На сервере аппаратный RAID-1 из 2-ух полторатеррабайтовых hdd
> еще раз - не хотите нанимать админа, наймите чела, который научит Вас
> заливать логи в нормальные сервисы.
> Готов рассказать как это делается за 200 зеленых ( ибо поциент сильно
> стремный)Да что вы все из себя умных евреев корчите? Что плохого в том, как человек залил лог? Разве дело в этом? Я вот его прочитал за пару секунд. А автору - не обращайте внимание на самоутверждающихся школьников.
Можете сказать модель рейд-контроллера? А лучше поищите на сайте производителя утилиту для проверки состояния оного. Кроме этого - обратите внимание на температурные условия, и проведите проверку памяти.
Кто тут школьник это спорный вопрос, даже очень - это раз.Что ж Вы, не школьник наш, прочтя лог, не высказали результат своих умозаключений "не школьных"
Теперь по делу: судя по логу,
May 1 15:42:16 srv kernel: httpd[12822]: segfault at 00007fffe3f10fd0 rip 00002b1dea8ed3d8 rsp 00007fffe3f10eb0 error 6
May 1 15:42:17 srv kernel: httpd[4780]: segfault at 00007fffe3f10fd0 rip 00002b1dea8ed3d8 rsp 00007fffe3f10eb0 error 6
May 1 15:42:17 srv kernel: httpd[12173]: segfault at 00007fffe3f10fd0 rip 00002b1dea8ed3d8 rsp 00007fffe3f10eb0 error 6
May 1 15:42:17 srv kernel: httpd[8538]: segfault at 00007fffe3f10fd0 rip 00002b1dea8ed3d8 rsp 00007fffe3f10eb0 error 6
May 1 15:42:18 srv kernel: httpd[10175]: segfault at 00007fffe3f10fd0 rip 00002b1dea8ed3d8 rsp 00007fffe3f10eb0 error 6
May 1 19:01:31 srv kernel: httpd[24922]: segfault at 00007fffe3f10fd0 rip 00002b1dea8ed3d8 rsp 00007fffe3f10eb0 error 6
May 1 19:01:33 srv kernel: httpd[20159]: segfault at 00007fffe3f10fd0 rip 00002b1dea8ed3d8 rsp 00007fffe3f10eb0 error 6
May 1 19:01:36 srv kernel: httpd[11226]: segfault at 00007fffe3f10fd0 rip 00002b1dea8ed3d8 rsp 00007fffe3f10eb0 error 6
May 1 19:01:50 srv kernel: httpd[9325]: segfault at 00007fffe3f10fd0 rip 00002b1dea8ed3d8 rsp 00007fffe3f10eb0 error 6
проблема с нагрузкой на httpd, вероятнее всего.
мониторьте его состояние, сколько памяти есть, сколько запросов и т.д.
>[оверквотинг удален]
> rsp 00007fffe3f10eb0 error 6
> May 1 19:01:33 srv kernel: httpd[20159]: segfault at 00007fffe3f10fd0 rip 00002b1dea8ed3d8
> rsp 00007fffe3f10eb0 error 6
> May 1 19:01:36 srv kernel: httpd[11226]: segfault at 00007fffe3f10fd0 rip 00002b1dea8ed3d8
> rsp 00007fffe3f10eb0 error 6
> May 1 19:01:50 srv kernel: httpd[9325]: segfault at 00007fffe3f10fd0 rip 00002b1dea8ed3d8
> rsp 00007fffe3f10eb0 error 6
>
А я в Вас пальцем не тыкал, так что если Вы приняли мой выпад в Вашу сторону - увы. И да, погорячился. Просто раздражают комменты вроде тех, что выше, особенно когда стоит реальная проблема, а тебе в ответ лишь "Давай за 200 долларов научу". Уж простите, если задел чьи-то чувства)
> А я в Вас пальцем не тыкал, так что если Вы приняли
> мой выпад в Вашу сторону - увы. И да, погорячился. Просто
> раздражают комменты вроде тех, что выше, особенно когда стоит реальная проблема,
> а тебе в ответ лишь "Давай за 200 долларов научу". Уж
> простите, если задел чьи-то чувства)Проехали.
Посмотрите логи апача на время указанное в логах.May 1 15:42
May 1 19:01
Что там есть.
> Посмотрите логи апача на время указанное в логах.
>May 1 15:42
> May 1 19:01
> Что там есть.15:42
[Sun May 01 15:41:56 2011] [error] [client xxx.xxx.xxx.xxx] request failed: error reading the headers, referer: http://xxxxxx/out.php/i28557_snapshotdvd2009.10.07.083137.bm... " /><br />
[Sun May 01 15:42:17 2011] [notice] child pid 4780 exit signal Segmentation fault (11)
[Sun May 01 15:42:17 2011] [notice] child pid 12822 exit signal Segmentation fault (11)
[Sun May 01 15:42:18 2011] [notice] child pid 8538 exit signal Segmentation fault (11)
[Sun May 01 15:42:18 2011] [notice] child pid 10175 exit signal Segmentation fault (11)
[Sun May 01 15:42:18 2011] [notice] child pid 12173 exit signal Segmentation fault (11)
[Sun May 01 15:42:20 2011] [error] [client xxx.xxx.xxx.xxx] request failed: error reading the headers, referer: http://xxxxxx/out.php/i28557_snapshotdvd2009.10.07.083137.bm... " /><br />
[Sun May 01 17:43:45 2011] [error] [client xxx.xxx.xxx.xxx] request failed: error reading the headers, referer: http://xxxxxx/out.php/i28557_snapshotdvd2009.10.07.083137.bm... " /><br />
[Sun May 01 18:01:12 2011] [error] [client xxx.xxx.xxx.xxx] Invalid URI in request HTTP/1.1 200 OK19:01
[Sun May 01 18:54:40 2011] [error] [client xxx.xxx.xxx.xxx] File does not exist: /var/www/vhosts/default/htdocs/counter, referer: http://love.mail.ru/my/messages.phtml
[Sun May 01 19:01:32 2011] [notice] child pid 24922 exit signal Segmentation fault (11)
[Sun May 01 19:01:34 2011] [notice] child pid 20159 exit signal Segmentation fault (11)
[Sun May 01 19:01:37 2011] [notice] child pid 11226 exit signal Segmentation fault (11)
[Sun May 01 19:01:51 2011] [notice] child pid 9325 exit signal Segmentation fault (11)
[Sun May 01 21:03:16 2011] [error] [client xxx.xxx.xxx.xxx] File does not exist: /var/www/vhosts/default/htdocs/hit, referer: http://vkontakte.ru/xxxxxxxТоесть везде одна и та же ошибка child pid exit signal Segmentation fault (11)
Это кусочки /var/log/httpd/error_log
Но еще есть на каждый домен свой error_log, всего доменов где-то 7На сервере стоит intel i7, 12gb ram, 3 айпи, один сетевой интерфейс, канал 1 гб, RAID-1 из 2-ух 1500гб hdd
Учитывая Вашу компетенцию, я все-таки настоятельно советую нанять админа.
Все и так поняли уже что это сервак от Хетзнера с плеск-панелью. :)
> На сервере стоитНе-не-не. На сервере таки не стоит. Нормального админа там не стоит. И у "одмина" тоже не стоит. Ни в голове, ни в прочих местах. Чесслово (я присоединяюсь к вышестоящему оратору) - я бы лично Вас уволил, батенька. Естественно, за профнепригодность. Мож лучше тем, в чем Вы бы потянули, а? ну там - колбасой на рынке тороговать. Не позорьте нашу проффесиию.
>> На сервере стоит
> Не-не-не. На сервере таки не стоит. Нормального админа там не стоит.
> И у "одмина" тоже не стоит. Ни в голове, ни в
> прочих местах. Чесслово (я присоединяюсь к вышестоящему оратору) - я бы
> лично Вас уволил, батенька. Естественно, за профнепригодность. Мож лучше тем, в
> чем Вы бы потянули, а? ну там - колбасой на рынке
> тороговать. Не позорьте нашу проффесиию.Дак помогите решить данную проблему, о представитель Вашей профессии, смотрите и научусь чему...
> Дак помогите решить данную проблему, о представитель Вашей профессии, смотрите и научусь
> чему...С удовольствием поможем, пишите Ваши данные.
Оплата почасовая. это не шутки.
Иначе Вам помочь нереально, ибо Вы совершенно не в теме,а начинать обучать Вас с азов, ни у кого нет ни времени, ни желания.
> Дак помогите решить данную проблему, о представитель Вашей профессии, смотрите и научусь
> чему...К моему величайшему сожалению - в Вашем КОНКРЕТНОМ случае нужна помощь генетика, а лично я, увы, далек от этой профессии. Исправление ошибок в ДНК лежит вне сферы моей профессиональной компетенции.
>> Дак помогите решить данную проблему, о представитель Вашей профессии, смотрите и научусь
>> чему...
> К моему величайшему сожалению - в Вашем КОНКРЕТНОМ случае нужна помощь
> генетика, а лично я, увы, далек от этой профессии. Исправление ошибок
> в ДНК лежит вне сферы моей профессиональной компетенции.Если уже на то пошло, то мне жалко вас, за то, что природа создала такое странное ЖИВОТНОЕ(Вас), которое, возможно, получает удовольствие от унижения человека и от того, что Вы умнее меня, считаете, что я не могу научиться и исправить ошибку с Вашей или чьей-либо помощью.
Я выразился в немного грубой форме, но она вполне соответствует вашей.
P.S. Вы правильно сказали, это ДНК, а человечество "редактировать" геном пока не научилось, поэтому мне вас жалко, примите мои собалезнования.Думаю здесь реальной помощи не дождёшься, печально, я был лучшего мнения о этом портале.
> Если уже на то пошло, то мне жалко вас, за то, что
> природа создала такое странное ЖИВОТНОЕ(Вас), которое, возможно, получает удовольствие
> от унижения человека и от того, что Вы умнее меня, считаете,
> что я не могу научиться и исправить ошибку с Вашей или
> чьей-либо помощью.
> Я выразился в немного грубой форме, но она вполне соответствует вашей.
> P.S. Вы правильно сказали, это ДНК, а человечество "редактировать" геном пока не
> научилось, поэтому мне вас жалко, примите мои собалезнования.
> Думаю здесь реальной помощи не дождёшься, печально, я был лучшего мнения о
> этом портале.Да Вы,батенька,совсем рамсы попутали.
Вас явно навели на то в чем у Вас проблема,нет чтоб спасибо сказать, и попытаться решить проблему,Вы еще выражаете своё "фи".
Или Вы думали, "помочь", это значит все сделать за Вас?
Никогда, слышите, НИКОГДА, Вам ни стать хоть каким-то админом, в первую очередь потому что не можете правильно описывать,а во вторую,потому что не хотите что-либо делать.