Всем привет!RHEL 5, внезапно прерывается удаленный доступ к серверу
локально - черный экран и ни как не реагирующая клавиатура
после перезагрузки в журнале:
............
Dec 30 07:52:13 mail clamd[2825]: SelfCheck: Database status OK.
Dec 30 08:02:13 mail clamd[2825]: SelfCheck: Database status OK.
Dec 30 08:12:13 mail clamd[2825]: SelfCheck: Database status OK.
Jan 3 15:51:38 mail syslogd 1.4.1: restart.
Jan 3 15:51:38 mail kernel: klogd 1.4.1, log source = /proc/kmsg started.
Jan 3 15:51:38 mail kernel: Linux version 2.6.18-194.el5 (mockbuild@ca-build10.us.oracle.com) (gcc version 4.1.2 20080704 (Red Hat 4.1.2-48)) #1 SMP Mon Mar 29 22:10:29 EDT 2010
Jan 3 15:51:38 mail kernel: Command line: ro root=/dev/VolGroup00/LogVol00 rhgb quiet
Jan 3 15:51:38 mail kernel: BIOS-provided physical RAM map:
Jan 3 15:51:38 mail kernel: BIOS-e820: 0000000000010000 - 000000000009f400 (usable)
Jan 3 15:51:38 mail kernel: BIOS-e820: 000000000009f400 - 00000000000a0000 (reserved)
Jan 3 15:51:38 mail kernel: BIOS-e820: 00000000000e4000 - 0000000000100000 (reserved)
Jan 3 15:51:38 mail kernel: BIOS-e820: 0000000000100000 - 00000000bdc70000 (usable)
Jan 3 15:51:38 mail kernel: BIOS-e820: 00000000bdc70000 - 00000000bdc88000 (ACPI data)
Jan 3 15:51:38 mail kernel: BIOS-e820: 00000000bdc88000 - 00000000bdcdc000 (ACPI NVS)
Jan 3 15:51:38 mail kernel: BIOS-e820: 00000000bdcdc000 - 00000000c0000000 (reserved)
Jan 3 15:51:38 mail kernel: BIOS-e820: 00000000fee00000 - 00000000fee01000 (reserved)
Jan 3 15:51:38 mail kernel: BIOS-e820: 00000000ff800000 - 0000000100000000 (reserved)
Jan 3 15:51:38 mail kernel: BIOS-e820: 0000000100000000 - 00000001fc000000 (usable)
Jan 3 15:51:38 mail kernel: BIOS-e820: 00000001fc000000 - 0000000200000000 (reserved)
Jan 3 15:51:38 mail kernel: BIOS-e820: 0000000200000000 - 0000000240000000 (usable)
Jan 3 15:51:38 mail kernel: DMI 2.6 present.
.........в чем может быть проблема?
предполагаю что в железе, но как найти?
спасибо
Очередной раз остановился!!!
пришлось перезагружать
логи:
Jan 18 20:32:26 mail clamd[2801]: SelfCheck: Database status OK.
Jan 18 20:42:26 mail clamd[2801]: SelfCheck: Database status OK.
Jan 18 20:52:26 mail clamd[2801]: SelfCheck: Database status OK.
Jan 18 21:00:54 mail shutdown[31481]: shutting down for system reboot
Jan 18 21:00:56 mail smartd[6898]: smartd received signal 15: Terminated
Jan 18 21:00:56 mail smartd[6898]: smartd is exiting (exit status 0)
Jan 18 21:01:06 mail clamd[2801]: Pid file removed.
Jan 18 21:01:06 mail clamd[2801]: --- Stopped at Tue Jan 18 21:01:06 2011
Jan 18 21:01:06 mail clamd[2801]: Socket file removed.
Jan 18 21:01:07 mail xinetd[2768]: Exiting...
Jan 18 21:01:10 mail gconfd (root-3897): GConf server is not in use, shutting down.
Jan 18 21:01:10 mail gconfd (root-3897): Exiting
Jan 18 21:01:10 mail ntpd[2780]: ntpd exiting on signal 15
Jan 18 21:01:11 mail auditd[2462]: The audit daemon is exiting.
Jan 18 21:01:11 mail kernel: audit(1295373671.167:2552): audit_pid=0 old=2462 by auid=4294967295
Jan 18 21:01:11 mail kernel: Kernel logging (proc) stopped.
Jan 18 21:01:11 mail kernel: Kernel log daemon terminating.
Jan 18 21:01:12 mail exiting on signal 15
Jan 20 14:53:35 mail syslogd 1.4.1: restart.
Jan 20 14:53:35 mail kernel: klogd 1.4.1, log source = /proc/kmsg started.
Jan 20 14:53:35 mail kernel: Linux version 2.6.18-194.el5 (mockbuild@ca-build10.us.oracle.com) (gcc version 4.1.2 20080704 (Red Hat 4.1.2-48)) #1 SMP Mon Mar 29 22:10:29 EDT 2010
Jan 20 14:53:35 mail kernel: Command line: ro root=/dev/VolGroup00/LogVol00 rhgb quiet
Jan 20 14:53:35 mail kernel: BIOS-provided physical RAM map:
Jan 20 14:53:35 mail kernel: BIOS-e820: 0000000000010000 - 000000000009f400 (usable)
Jan 20 14:53:35 mail kernel: BIOS-e820: 000000000009f400 - 00000000000a0000 (reserved)
Jan 20 14:53:35 mail kernel: BIOS-e820: 00000000000e4000 - 0000000000100000 (reserved)
Jan 20 14:53:35 mail kernel: BIOS-e820: 0000000000100000 - 00000000bdc70000 (usable)
Jan 20 14:53:35 mail kernel: BIOS-e820: 00000000bdc70000 - 00000000bdc88000 (ACPI data)
Jan 20 14:53:35 mail kernel: BIOS-e820: 00000000bdc88000 - 00000000bdcdc000 (ACPI NVS)
Jan 20 14:53:35 mail kernel: BIOS-e820: 00000000bdcdc000 - 00000000c0000000 (reserved)
Jan 20 14:53:35 mail kernel: BIOS-e820: 00000000fee00000 - 00000000fee01000 (reserved)
Jan 20 14:53:35 mail kernel: BIOS-e820: 00000000ff800000 - 0000000100000000 (reserved)
Jan 20 14:53:35 mail kernel: BIOS-e820: 0000000100000000 - 00000001fc000000 (usable)
Jan 20 14:53:35 mail kernel: BIOS-e820: 00000001fc000000 - 0000000200000000 (reserved)
Jan 20 14:53:35 mail kernel: BIOS-e820: 0000000200000000 - 0000000240000000 (usable)
Jan 20 14:53:35 mail kernel: DMI 2.6 present.
в чем может быть проблема?спасибо
Очередной раз, при удаленной перезагрузке
не загрузился, пришлось ехать и тыкать кнопку!!!
Jan 21 21:35:33 mail smartd[6962]: Device: /dev/sda, opened
Jan 21 21:35:33 mail smartd[6962]: Device: /dev/sda, not found in smartd database.
Jan 21 21:35:34 mail smartd[6962]: Device: /dev/sda, is SMART capable. Adding to "monitor" list.
Jan 21 21:35:34 mail smartd[6962]: Device: /dev/sdb, opened
Jan 21 21:35:34 mail smartd[6962]: Device /dev/sdb: using '-d sat' for ATA disk behind SAT layer.
Jan 21 21:35:34 mail smartd[6962]: Device: /dev/sdb, opened
Jan 21 21:35:34 mail smartd[6962]: Device: /dev/sdb, not found in smartd database.
Jan 21 21:35:34 mail smartd[6962]: Device: /dev/sdb, is SMART capable. Adding to "monitor" list.
Jan 21 21:35:34 mail smartd[6962]: Monitoring 0 ATA and 2 SCSI devices
Jan 21 21:35:35 mail smartd[6972]: smartd has fork()ed into background mode. New PID=6972.
Jan 21 21:35:36 mail kernel: [drm] Initialized drm 1.0.1 20051102
Jan 21 21:35:36 mail kernel: ACPI: PCI Interrupt 0000:00:02.0[A] -> GSI 16 (level, low) -> IRQ 177
Jan 23 14:34:59 mail syslogd 1.4.1: restart.
Jan 23 14:34:59 mail kernel: klogd 1.4.1, log source = /proc/kmsg started.
Jan 23 14:34:59 mail kernel: Linux version 2.6.18-194.el5 (mockbuild@ca-build10.us.oracle.com) (gcc version 4.1.2 20080704 (Red Hat 4.1.2-48)) #1 SMP Mon Mar 29 22:10:29 EDT 2010
Jan 23 14:34:59 mail kernel: Command line: ro root=/dev/VolGroup00/LogVol00 rhgb quiet
Jan 23 14:34:59 mail kernel: BIOS-provided physical RAM map:
Jan 23 14:34:59 mail kernel: BIOS-e820: 0000000000010000 - 000000000009f400 (usable)
Jan 23 14:34:59 mail kernel: BIOS-e820: 000000000009f400 - 00000000000a0000 (reserved)
Jan 23 14:34:59 mail kernel: BIOS-e820: 00000000000e4000 - 0000000000100000 (reserved)
Jan 23 14:34:59 mail kernel: BIOS-e820: 0000000000100000 - 00000000bdc70000 (usable)
Jan 23 14:34:59 mail kernel: BIOS-e820: 00000000bdc70000 - 00000000bdc88000 (ACPI data)
Jan 23 14:34:59 mail kernel: BIOS-e820: 00000000bdc88000 - 00000000bdcdc000 (ACPI NVS)
Jan 23 14:34:59 mail kernel: BIOS-e820: 00000000bdcdc000 - 00000000c0000000 (reserved)
Jan 23 14:34:59 mail kernel: BIOS-e820: 00000000fee00000 - 00000000fee01000 (reserved)
Jan 23 14:34:59 mail kernel: BIOS-e820: 00000000ff800000 - 0000000100000000 (reserved)
Jan 23 14:34:59 mail kernel: BIOS-e820: 0000000100000000 - 00000001fc000000 (usable)
Jan 23 14:34:59 mail kernel: BIOS-e820: 00000001fc000000 - 0000000200000000 (reserved)
Jan 23 14:34:59 mail kernel: BIOS-e820: 0000000200000000 - 0000000240000000 (usable)
Jan 23 14:34:59 mail kernel: DMI 2.6 present.
может журнал перевести в более болтливый режим?
или дело в ACPI?
спасибо
из всего приведенного не видно почему так происходит
> из всего приведенного не видно почему так происходитда это видно,
вот какие службы запущены:
acpid
anacron
atd
auditd
autofs
clamd
clamsmtpd
cpuspeed
crond
dovecot
firstboot
gpm
haldeamon
httpd
iptables
irqbalance
jexec
lvm2-monitor
mcstrans
mdmonitor
messagebus
microcode_ctl
mysqld
named
netfs
network
ntpd
portmap
postfix
rawdevices
readahead_early
readahead_later
restorecond
rhnsd
setroubleshoot
smartd
spamassassin
sshd
syslog
sysstat
tomcat5
vboxdrv
vboxweb-service
vncserver
vsftpd
xinetd
yum-updatesd
может какие то службы друг другу мешают?
или ваабще не нужны?
> Jan 18 21:00:54 mail shutdown[31481]: shutting down for system reboot...
> в чем может быть проблема?
> спасибосистема не валится, а явным образом перезагружается
в кроне лишнего ничего не стоит?
>> Jan 18 21:00:54 mail shutdown[31481]: shutting down for system reboot
> ...
>> в чем может быть проблема?
>> спасибо
> система не валится, а явным образом перезагружаетсяили просто останавливается ядро..........
Dec 30 08:02:13 mail clamd[2825]: SelfCheck: Database status OK.
Dec 30 08:12:13 mail clamd[2825]: SelfCheck: Database status OK.
Jan 3 15:51:38 mail syslogd 1.4.1: restart.
Jan 3 15:51:38 mail kernel: klogd 1.4.1, log source = /proc/kmsg started.
> в кроне лишнего ничего не стоит?девственно чистый:
SHELL=/bin/bash
PATH=/sbin:/bin:/usr/sbin:/usr/bin
MAILTO=root
HOME=/# run-parts
01 * * * * root run-parts /etc/cron.hourly
02 4 * * * root run-parts /etc/cron.daily
22 4 * * 0 root run-parts /etc/cron.weekly
42 4 1 * * root run-parts /etc/cron.monthly
и в остальных/etc/cron.*все по умолчанию
А что имеется в /var/spool/cron/* ?>[оверквотинг удален]
> PATH=/sbin:/bin:/usr/sbin:/usr/bin
> MAILTO=root
> HOME=/
> # run-parts
> 01 * * * * root run-parts /etc/cron.hourly
> 02 4 * * * root run-parts /etc/cron.daily
> 22 4 * * 0 root run-parts /etc/cron.weekly
> 42 4 1 * * root run-parts /etc/cron.monthly
>
/etc/cron.*все по умолчанию
> в чем может быть проблема?посмотри /var/log/acpid
>> в чем может быть проблема?
> посмотри /var/log/acpidсмотрю начиная с первых дней проблемы:
[Thu Dec 23 16:02:24 2010] 1 client rule loaded
[Mon Jan 3 15:51:39 2011] starting up
[Mon Jan 3 15:51:39 2011] 1 rule loaded
[Mon Jan 3 15:51:39 2011] client connected from 2699[68:68]
[Mon Jan 3 15:51:39 2011] 1 client rule loaded
[Mon Jan 3 15:54:06 2011] client connected from 7111[0:0]
[Mon Jan 3 15:54:06 2011] 1 client rule loaded
[Mon Jan 17 15:55:29 2011] exiting
[Mon Jan 17 15:57:05 2011] starting up
[Mon Jan 17 15:57:05 2011] 1 rule loaded
[Mon Jan 17 15:57:06 2011] client connected from 2676[68:68]
[Mon Jan 17 15:57:06 2011] 1 client rule loaded
[Mon Jan 17 15:59:43 2011] client connected from 7030[0:0]
[Mon Jan 17 15:55:29 2011] exiting
[Mon Jan 17 15:57:05 2011] starting up
[Mon Jan 17 15:57:05 2011] 1 rule loaded
[Mon Jan 17 15:57:06 2011] client connected from 2676[68:68]
[Mon Jan 17 15:57:06 2011] 1 client rule loaded
[Mon Jan 17 15:59:43 2011] client connected from 7030[0:0]
[Mon Jan 17 15:59:43 2011] 1 client rule loaded
[Tue Jan 18 21:01:10 2011] exiting
[Thu Jan 20 14:53:36 2011] starting up
[Thu Jan 20 14:53:36 2011] 1 rule loaded
[Thu Jan 20 14:53:37 2011] client connected from 2673[68:68]
[Thu Jan 20 14:53:37 2011] 1 client rule loaded
[Thu Jan 20 14:56:13 2011] client connected from 7093[0:0]
[Thu Jan 20 14:56:13 2011] 1 client rule loaded
[Fri Jan 21 21:31:33 2011] exiting
[Fri Jan 21 21:33:08 2011] starting up
[Fri Jan 21 21:33:08 2011] 1 rule loaded
[Fri Jan 21 21:33:08 2011] client connected from 2676[68:68]
[Fri Jan 21 21:33:08 2011] 1 client rule loaded
[Fri Jan 21 21:35:35 2011] client connected from 7083[0:0]
[Fri Jan 21 21:35:35 2011] 1 client rule loaded
[Sun Jan 23 14:35:00 2011] starting up
[Sun Jan 23 14:35:00 2011] 1 rule loaded
[Sun Jan 23 14:35:00 2011] client connected from 2700[68:68]
[Sun Jan 23 14:35:00 2011] 1 client rule loaded
[Sun Jan 23 14:37:34 2011] client connected from 7360[0:0]
[Sun Jan 23 14:37:34 2011] 1 client rule loadedи что должен увидеть?
> смотрю начиная с первых дней проблемы:
> и что должен увидеть?Тут ничего особенного не вижу...
Возможно стоит посмотреть логи в биосе сервера, если они там есть.