Самопроизвольная перегрузка Solaris 8
Машина SunBlade 150 c OS Slaris 8
Она стоит в сети совершенно изолированной от внешнего мира.
Периодически самопроизвольно перегружает, при чем в логах ничего не пишет о том кто вызвал перегрузку - только - раз - и началась сама прегрузка.
Возможно ли включить дополнительную трассировку ядра или что либо в том духе, чтобы отследить кто вызывает прегрузку
может происходит сбой ядра? - как сие отследить - если сбой то странный - так аккуратно перегружается машина...
Как с этим бороться и отследить неприятности ?
Про логи - можно в syslog'е поставить *.debug в файл и все, что процессы имеют возможность и желание писать в логи, они будут туда складывать.
Хорошо бы еще проверить cron'ы (все) на предмет запуска "левых" скриптов.
А в остальном - crushdump или coredump Вас спасут (система именно перегружается, а не крэшится?)
.
>Самопроизвольная перегрузка Solaris 8
>Машина SunBlade 150 c OS Slaris 8
>Она стоит в сети совершенно изолированной от внешнего мира.
>Периодически самопроизвольно перегружает, при чем в логах ничего не пишет о том
>кто вызвал перегрузку - только - раз - и началась сама
>прегрузка.
>Возможно ли включить дополнительную трассировку ядра или что либо в том
>духе, чтобы отследить кто вызывает прегрузку
>может происходит сбой ядра? - как сие отследить - если сбой то
>странный - так аккуратно перегружается машина...
>Как с этим бороться и отследить неприятности ?если система крэшится - посмотри в каталоге /var/crash/`hostname`/ если там файлы типа unix.X vmcore.X, где X - порядковый номер крэша. Эти файлы создаются, псоле того как машина поднимается после крэша, при условии что настроил coredump командой coreadm. Проанализировать данные файлы можно adb и четко выяснить кто гасит машину.
Лучше всего, если ты конечно почитаешь курс ST-350 - очень помогает, так тебе его объяснить будет длительно.
Предлагаю следующую помощь - если машины крэшится все же, а не в кроне чего-сь стоит и т.д., то для анализа мне понадобятся файлы unix.X vmcore.X от последнего крэша, /var/adm/messages, /var/log/syslog, /var/adm/sulog, если есть /var/adm/loginlog, /var/cron/log - а лучше сделай Explorer Check всей системы. Как мне это все передать: выложи куда-нить в запакованом виде (пакуй под Солярой), второй вариант - по мылу, но это будет кусками и долго.
Третий вариант - если машина на саппорте у Сана - открывай заявку на их сайте - и вперед - им за это деньги платят :-)Успехов
была проблема когда сан перегружался якобы сам по себе. проблема похоже с L2 кешем процессора, возникала неисправимая ошибка и соляра (начиная с 7 с каким то патчем - более ранние -> краш) начинала перегружаться. долго не могли отловить изза ошибки в syslog.conf, разделитель был неправильный, логи валились на консоль. e450 машина на 2х ультраспарках. говорят для 2х это распростроненная бага с L2.
2х - читать как "вторых" :)