Проблема в следующем... есть сервак IBM x3250, стоит на нем FreeBSD 8.2, до сегодня стояла 8.1. Сервер раз в непонятный момент времени просто уходит в перезагрузку... в логах вообще ничего с ошибками нету. На сервере крутиться ДНС, почта, небольшой веб-сервер с ограниченным доступом... Подскажите куда рыть, куда копать... Железо не показывает нигде проблем при диагностике. Существует проблемка давно... грешил на 8.1 релиз... но поставив 8.2 после пересбора ядра (добавил только сетевые опции) на моменте сбора первого порта ушел в перегруз. :(
> Проблема в следующем... есть сервак IBM x3250, стоит на нем FreeBSD 8.2,
> до сегодня стояла 8.1. Сервер раз в непонятный момент времени просто
> уходит в перезагрузку... в логах вообще ничего с ошибками нету. На
> сервере крутиться ДНС, почта, небольшой веб-сервер с ограниченным доступом... Подскажите
> куда рыть, куда копать... Железо не показывает нигде проблем при диагностике.
> Существует проблемка давно... грешил на 8.1 релиз... но поставив 8.2 после
> пересбора ядра (добавил только сетевые опции) на моменте сбора первого
> порта ушел в перегруз. :(проверьте блок питания
проверьте что нет перегрева
>> Проблема в следующем... есть сервак IBM x3250, стоит на нем FreeBSD 8.2,
>> до сегодня стояла 8.1. Сервер раз в непонятный момент времени просто
>> уходит в перезагрузку... в логах вообще ничего с ошибками нету. На
>> сервере крутиться ДНС, почта, небольшой веб-сервер с ограниченным доступом... Подскажите
>> куда рыть, куда копать... Железо не показывает нигде проблем при диагностике.
>> Существует проблемка давно... грешил на 8.1 релиз... но поставив 8.2 после
>> пересбора ядра (добавил только сетевые опции) на моменте сбора первого
>> порта ушел в перегруз. :(
> проверьте блок питания
> проверьте что нет перегревапроверял уже... айбиэмовская диагностика показала что все ок... уже смотрел в эту сторону.
>[оверквотинг удален]
>>> уходит в перезагрузку... в логах вообще ничего с ошибками нету. На
>>> сервере крутиться ДНС, почта, небольшой веб-сервер с ограниченным доступом... Подскажите
>>> куда рыть, куда копать... Железо не показывает нигде проблем при диагностике.
>>> Существует проблемка давно... грешил на 8.1 релиз... но поставив 8.2 после
>>> пересбора ядра (добавил только сетевые опции) на моменте сбора первого
>>> порта ушел в перегруз. :(
>> проверьте блок питания
>> проверьте что нет перегрева
> проверял уже... айбиэмовская диагностика показала что все ок... уже смотрел в эту
> сторону.проверьте что пыли нет в корпусе, проверьте что конденсаторы не вздулись...
>[оверквотинг удален]
>>>> сервере крутиться ДНС, почта, небольшой веб-сервер с ограниченным доступом... Подскажите
>>>> куда рыть, куда копать... Железо не показывает нигде проблем при диагностике.
>>>> Существует проблемка давно... грешил на 8.1 релиз... но поставив 8.2 после
>>>> пересбора ядра (добавил только сетевые опции) на моменте сбора первого
>>>> порта ушел в перегруз. :(
>>> проверьте блок питания
>>> проверьте что нет перегрева
>> проверял уже... айбиэмовская диагностика показала что все ок... уже смотрел в эту
>> сторону.
> проверьте что пыли нет в корпусе, проверьте что конденсаторы не вздулись...По части железа все ок... чуть бы не с микроскопом уже не один раз облазили.
> Проблема в следующем... есть сервак IBM x3250, стоит на нем FreeBSD 8.2,
> до сегодня стояла 8.1. Сервер раз в непонятный момент времени просто
> уходит в перезагрузку... в логах вообще ничего с ошибками нету. На
> сервере крутиться ДНС, почта, небольшой веб-сервер с ограниченным доступом... Подскажите
> куда рыть, куда копать... Железо не показывает нигде проблем при диагностике.
> Существует проблемка давно... грешил на 8.1 релиз... но поставив 8.2 после
> пересбора ядра (добавил только сетевые опции) на моменте сбора первого
> порта ушел в перегруз. :(1)Присоединяюсь к Square. Не знаю что там ИБМ-тесты делают, но при компиляции нагрузка на проц сильно возрастает => греется больше.
2) Если в логах нет информации, значит настройте их, чтоб сыпало туда все вплоть до debug и изучайте.
> Проблема в следующем... есть сервак IBM x3250, стоит на нем FreeBSD 8.2,
> до сегодня стояла 8.1. Сервер раз в непонятный момент времени просто
> уходит в перезагрузку...О, я, я DDR 3 рулез форева-кипитильник-шайтан-ахтунг-ECC-Registerd-полный-ппц
Случаем DDR-модули не из ближайшего супермаркета Ашан?
>> Проблема в следующем... есть сервак IBM x3250, стоит на нем FreeBSD 8.2,
>> до сегодня стояла 8.1. Сервер раз в непонятный момент времени просто
>> уходит в перезагрузку...
> О, я, я DDR 3 рулез форева-кипитильник-шайтан-ахтунг-ECC-Registerd-полный-ппц
> Случаем DDR-модули не из ближайшего супермаркета Ашан?Сервер брался официально у IBM. На каждую запчасть есть договор обслуживания... Везде налеплены галограмки фирменные. С ними работаем уже 5 лет, проблем было мало... притом там железо четко всегда выявляло неисправность а нам меняли эту неисправность без проблем. Их у меня 16 штук от них разной модификации. Все из серии System X.
> Их у меня 16 штук от них разной модификации. Все из серии System X.И только этот ребутится? Или только на этом BSD? Чего с температурой?
У меня похожая фишка была на AMD Opteron, там вентилятор пылью засрался
и грелся сильно. Не знаю каким боком, но мать посылала ACPI сигнал выключения.Ну и какой-нибудь LiveCD погоняй часок другой, с тем же BOINC, memtest86+ по полной.
>> Их у меня 16 штук от них разной модификации. Все из серии System X.
> И только этот ребутится? Или только на этом BSD? Чего с температурой?
> У меня похожая фишка была на AMD Opteron, там вентилятор пылью засрался
> и грелся сильно. Не знаю каким боком, но мать посылала ACPI сигнал
> выключения.
> Ну и какой-нибудь LiveCD погоняй часок другой, с тем же BOINC, memtest86+
> по полной.Только етот и только на нем BSD. На нем стоит Xeon, сам он холодный, в серверной температура под 16С и сам он когда достал холодный был по полной. Единственная ошибка которая возникает при загрузке:
ACPI Error: [GPMN] Namespace lookup failure, AE_NOT_FOUND (20101013/psargs-464)
ACPI Error: Method parse/execution failed [\\_SB_.PCI0.LPC0.MBRD._CRS] (Node 0xf fffff0001775c40), AE_NOT_FOUND (20101013/psparse-633)Притом он может сутки проработать а может и месяц-два без проблем а потом ребутнутся.
>[оверквотинг удален]
>> и грелся сильно. Не знаю каким боком, но мать посылала ACPI сигнал
>> выключения.
>> Ну и какой-нибудь LiveCD погоняй часок другой, с тем же BOINC, memtest86+
>> по полной.
> Только етот и только на нем BSD. На нем стоит Xeon, сам
> он холодный, в серверной температура под 16С и сам он когда
> достал холодный был по полной. Единственная ошибка которая возникает при загрузке:
> ACPI Error: [GPMN] Namespace lookup failure, AE_NOT_FOUND (20101013/psargs-464)
> ACPI Error: Method parse/execution failed [\\_SB_.PCI0.LPC0.MBRD._CRS] (Node 0xf
> fffff0001775c40), AE_NOT_FOUND (20101013/psparse-633)https://bugzilla.redhat.com/show_bug.cgi?id=576246
> Притом он может сутки проработать а может и месяц-два без проблем а
> потом ребутнутся.
>[оверквотинг удален]
>>> по полной.
>> Только етот и только на нем BSD. На нем стоит Xeon, сам
>> он холодный, в серверной температура под 16С и сам он когда
>> достал холодный был по полной. Единственная ошибка которая возникает при загрузке:
>> ACPI Error: [GPMN] Namespace lookup failure, AE_NOT_FOUND (20101013/psargs-464)
>> ACPI Error: Method parse/execution failed [\\_SB_.PCI0.LPC0.MBRD._CRS] (Node 0xf
>> fffff0001775c40), AE_NOT_FOUND (20101013/psparse-633)
> https://bugzilla.redhat.com/show_bug.cgi?id=576246
>> Притом он может сутки проработать а может и месяц-два без проблем а
>> потом ребутнутся.Ну и каким боком мне ридхетовский патч на БСД поставить? :)
>[оверквотинг удален]
>>> Только етот и только на нем BSD. На нем стоит Xeon, сам
>>> он холодный, в серверной температура под 16С и сам он когда
>>> достал холодный был по полной. Единственная ошибка которая возникает при загрузке:
>>> ACPI Error: [GPMN] Namespace lookup failure, AE_NOT_FOUND (20101013/psargs-464)
>>> ACPI Error: Method parse/execution failed [\\_SB_.PCI0.LPC0.MBRD._CRS] (Node 0xf
>>> fffff0001775c40), AE_NOT_FOUND (20101013/psparse-633)
>> https://bugzilla.redhat.com/show_bug.cgi?id=576246
>>> Притом он может сутки проработать а может и месяц-два без проблем а
>>> потом ребутнутся.
> Ну и каким боком мне ридхетовский патч на БСД поставить? :)Скорее всего выяснится, что проблема в материнской плате.Блоков питания на сервере,наверное, больше одного,так что это отпадает.
Диагностика сервера может не показывать такие вещи. Если сервер на гарантии, то нужно постараться ибм-ский сервис тестировать соими средствами глубже или заменить плату.Иначе, придется дождаться, пока сервер окончательно встанет.У меня такая история была с НР. Обязательно следите за бэкапами.
>[оверквотинг удален]
>>> https://bugzilla.redhat.com/show_bug.cgi?id=576246
>>>> Притом он может сутки проработать а может и месяц-два без проблем а
>>>> потом ребутнутся.
>> Ну и каким боком мне ридхетовский патч на БСД поставить? :)
> Скорее всего выяснится, что проблема в материнской плате.Блоков питания на сервере,наверное,
> больше одного,так что это отпадает.
> Диагностика сервера может не показывать такие вещи. Если сервер на гарантии, то
> нужно постараться ибм-ский сервис тестировать соими средствами глубже или заменить плату.Иначе,
> придется дождаться, пока сервер окончательно встанет.У меня такая история была с
> НР. Обязательно следите за бэкапами.У этой серии 1 БП... кстате, еще в 7ом релизе помню на стареньком х346 IBM была подобная проблема... но потом его поменяли на другой а на том уже около года крутиться винда с небольшой базой и ничего не глючит :(
> Проблема в следующем... есть сервак IBM x3250, стоит на нем FreeBSD 8.2,
> до сегодня стояла 8.1. Сервер раз в непонятный момент времени просто
> уходит в перезагрузку... в логах вообще ничего с ошибками нету. На
> сервере крутиться ДНС, почта, небольшой веб-сервер с ограниченным доступом... Подскажите
> куда рыть, куда копать... Железо не показывает нигде проблем при диагностике.
> Существует проблемка давно... грешил на 8.1 релиз... но поставив 8.2 после
> пересбора ядра (добавил только сетевые опции) на моменте сбора первого
> порта ушел в перегруз. :(Внезапный ребут - с высокой степенью вероятности проблемы с железом.
Проблемы с софтом склонны вызвать panic, молчаливый ребут случай экстраординарный.
Опять же из опыта - смотрите в сторону оперативки.