Уже второй раз за неделю падает FreeBSD 5.4 сервер. Ошибок в логе не вижу, совсем, перебоев с электропитанием нет, он просто виснет и все. В чем может быть проблема?#cat /var/log/messages
Nov 27 10:49:18 sniper 68337: Nov 27 10:55:38.453: %CRYPTO-4-RECVD_PKT_INV_SPI: decaps: rec'd IPSEC packet has invalid spi for destaddr=195.14.51.166, prot=50, spi=0x94040000(2483290112), srcaddr=85.140.239.49
Nov 27 10:56:30 sniper 68357: Nov 27 11:02:50.420: %CRYPTO-4-RECVD_PKT_INV_SPI: decaps: rec'd IPSEC packet has invalid spi for destaddr=195.14.51.166, prot=50, spi=0x94040000(2483290112), srcaddr=85.140.239.49
Nov 27 13:51:25 sniper 68839: Nov 27 13:57:47.086: %CRYPTO-4-RECVD_PKT_INV_SPI: decaps: rec'd IPSEC packet has invalid spi for destaddr=195.14.51.166, prot=50, spi=0x94040000(2483290112), srcaddr=85.140.239.49
Nov 27 14:51:19 195.58.13.173 310: Nov 27 16:57:41.249: %LINEPROTO-5-UPDOWN: Line protocol on Interface FastEthernet0, changed state to up
Nov 27 15:11:18 core sendmail[61648]: kARBqd9D061429: SYSERR(root): timeout writing message to post.trecom.tomsk.ru.: Operation timed out with post.trecom.tomsk.ru.
Nov 27 16:27:48 core sendmail[69191]: kARDFhsO069152: SYSERR(root): timeout writing message to post.trecom.tomsk.ru.: Operation timed out with post.trecom.tomsk.ru.
Nov 28 10:15:15 core syslogd: kernel boot file is /boot/kernel/kernel
Nov 28 10:15:15 core kernel: Copyright (c) 1992-2005 The FreeBSD Project.
Nov 28 10:15:15 core kernel: Copyright (c) 1979, 1980, 1983, 1986, 1988, 1989, 1991, 1992, 1993, 1994
Nov 28 10:15:15 core kernel: The Regents of the University of California. All rights reserved.
Nov 28 10:15:15 core kernel: FreeBSD 5.4-RELEASE-p14 #1: Fri May 12 12:57:41 UTC 2006
Nov 28 10:15:15 core kernel: sergey@newcore.pac.ru:/usr/src/sys/i386/compile/NEWCORE
Nov 28 10:15:15 core kernel: Timecounter "i8254" frequency 1193182 Hz quality 0
Nov 28 10:15:15 core kernel: CPU: Intel(R) Pentium(R) III CPU family 1266MHz (1262.68-MHz 686-class CPU)
Nov 28 10:15:15 core kernel: Origin = "GenuineIntel" Id = 0x6b1 Stepping = 1
Nov 28 10:15:15 core kernel: Features=0x383fbff<FPU,VME,DE,PSE,TSC,MSR,PAE,MCE,CX8,APIC,SEP,MTRR,PGE,MCA,CMOV,PAT,PSE36,MMX,FXSR,SSE>
Nov 28 10:15:15 core kernel: real memory = 1073741824 (1024 MB)
Nov 28 10:15:15 core kernel: avail memory = 1045405696 (996 MB)
Nov 28 10:15:15 core kernel: MPTable: <AMI CNB30LE >
Nov 28 10:15:15 core kernel: FreeBSD/SMP: Multiprocessor System Detected: 2 CPUs
Nov 28 10:15:15 core kernel: cpu0 (BSP): APIC ID: 0
Nov 28 10:15:15 core kernel: cpu1 (AP): APIC ID: 1
Nov 28 10:15:15 core kernel: ioapic0: Assuming intbase of 0
Nov 28 10:15:15 core kernel: ioapic1: Assuming intbase of 16
Nov 28 10:15:15 core kernel: ioapic0 <Version 1.1> irqs 0-15 on motherboard
Nov 28 10:15:15 core kernel: ioapic1 <Version 1.1> irqs 16-31 on motherboard
Nov 28 10:15:15 core kernel: npx0: <math processor> on motherboard
Nov 28 10:15:15 core kernel: npx0: INT 16 interface
Nov 28 10:15:15 core kernel: cpu0 on motherboard
Nov 28 10:15:15 core kernel: cpu1 on motherboard
Nov 28 10:15:15 core kernel: pcib0: <MPTable Host-PCI bridge> pcibus 0 on motherboard
Nov 28 10:15:15 core kernel: pci0: <PCI bus> on pcib0
Nov 28 10:15:15 core kernel: pci0: <display, VGA> at device 1.0 (no driver attached)
Nov 28 10:15:15 core kernel: fxp0: <Intel 82559 Pro/100 Ethernet> port 0xd400-0xd43f mem 0xfe900000-0xfe9fffff,0xfeafe000-0xfeafefff irq 20 at device 4.0 on pci0
Nov 28 10:15:15 core kernel: miibus0: <MII bus> on fxp0
Nov 28 10:15:15 core kernel: inphy0: <i82555 10/100 media interface> on miibus0
Nov 28 10:15:15 core kernel: inphy0: 10baseT, 10baseT-FDX, 100baseTX, 100baseTX-FDX, auto
Nov 28 10:15:15 core kernel: fxp0: Ethernet address: 00:e0:81:21:54:1e
Nov 28 10:15:15 core kernel: fxp1: <Intel 82559 Pro/100 Ethernet> port 0xd000-0xd03f mem 0xfe700000-0xfe7fffff,0xfeafd000-0xfeafdfff irq 21 at device 5.0 on pci0
Nov 28 10:15:15 core kernel: miibus1: <MII bus> on fxp1
Nov 28 10:15:15 core kernel: inphy1: <i82555 10/100 media interface> on miibus1
Nov 28 10:15:15 core kernel: inphy1: 10baseT, 10baseT-FDX, 100baseTX, 100baseTX-FDX, auto
Nov 28 10:15:15 core kernel: fxp1: Ethernet address: 00:e0:81:21:54:1f
Nov 28 10:15:15 core kernel: isab0: <PCI-ISA bridge> port 0x580-0x58f at device 15.0 on pci0
Nov 28 10:15:15 core kernel: isa0: <ISA bus> on isab0
Nov 28 10:15:15 core kernel: atapci0: <ServerWorks ROSB4 UDMA33 controller> port 0xffa0-0xffaf,0x376,0x170-0x177,0x3f6,0x1f0-0x1f7 at device 15.1 on pci0
Nov 28 10:15:15 core kernel: ata0: channel #0 on atapci0
Nov 28 10:15:15 core kernel: ata1: channel #1 on atapci0
Nov 28 10:15:15 core kernel: pcib1: <MPTable Host-PCI bridge> pcibus 1 on motherboard
Nov 28 10:15:15 core kernel: pci1: <PCI bus> on pcib1
Nov 28 10:15:15 core kernel: puc0: <Cronyx Omega2-PCI> mem 0xfebf7000-0xfebf7fff irq 27 at device 2.0 on pci1
Nov 28 10:15:15 core kernel: uart0: <16750 or compatible> on puc0
Nov 28 10:15:15 core kernel: uart1: <16750 or compatible> on puc0
Nov 28 10:15:15 core kernel: uart2: <16750 or compatible> on puc0
Nov 28 10:15:15 core kernel: uart3: <16750 or compatible> on puc0
Nov 28 10:15:15 core kernel: uart4: <16750 or compatible> on puc0
Nov 28 10:15:15 core kernel: uart5: <16750 or compatible> on puc0
Nov 28 10:15:15 core kernel: uart6: <16750 or compatible> on puc0
Nov 28 10:15:15 core kernel: uart7: <16750 or compatible> on puc0
Nov 28 10:15:15 core kernel: amr0: <LSILogic MegaRAID 1.51> mem 0xfc1f0000-0xfc1fffff irq 23 at device 3.0 on pci1
Nov 28 10:15:15 core kernel: amr0: <LSILogic Series 475 40 Logical Drive Firmware> Firmware A159, BIOS 3.11, 64MB RAM
Nov 28 10:15:15 core kernel: orm0: <ISA Option ROMs> at iomem 0xca800-0xcb7ff,0xc9800-0xca7ff,0xc0000-0xc7fff on isa0
Nov 28 10:15:15 core kernel: pmtimer0 on isa0
Nov 28 10:15:15 core kernel: atkbdc0: <Keyboard controller (i8042)> at port 0x64,0x60 on isa0
Nov 28 10:15:15 core kernel: atkbd0: <AT Keyboard> irq 1 on atkbdc0
Nov 28 10:15:15 core kernel: kbd0 at atkbd0
Nov 28 10:15:15 core kernel: fdc0: <Enhanced floppy controller> at port 0x3f0-0x3f5 irq 6 drq 2 on isa0
Nov 28 10:15:15 core kernel: fd0: <1440-KB 3.5" drive> on fdc0 drive 0
Nov 28 10:15:15 core kernel: sc0: <System console> at flags 0x100 on isa0
Nov 28 10:15:15 core kernel: sc0: VGA <16 virtual consoles, flags=0x300>
Nov 28 10:15:15 core kernel: sio0 at port 0x3f8-0x3ff irq 4 flags 0x10 on isa0
Nov 28 10:15:15 core kernel: sio0: type 16550A
Nov 28 10:15:15 core kernel: vga0: <Generic ISA VGA> at port 0x3c0-0x3df iomem 0xa0000-0xbffff on isa0
Nov 28 10:15:15 core kernel: unknown: <PNP0303> can't assign resources (port)
Nov 28 10:15:15 core kernel: speaker0: <PC speaker> at port 0x61 on isa0
Nov 28 10:15:15 core kernel: unknown: <PNP0c02> can't assign resources (port)
Nov 28 10:15:15 core kernel: unknown: <PNP0501> can't assign resources (port)
Nov 28 10:15:15 core kernel: sio1: <16550A-compatible COM port> at port 0x2f8-0x2ff irq 3 on isa0
Nov 28 10:15:15 core kernel: sio1: type 16550A
Nov 28 10:15:15 core kernel: unknown: <PNP0700> can't assign resources (port)
Nov 28 10:15:15 core kernel: Timecounters tick every 10.000 msec
Nov 28 10:15:15 core kernel: acd0: CDROM <CD-540E/1.0A> at ata0-master PIO4
Nov 28 10:15:15 core kernel: amrd0: <LSILogic MegaRAID logical drive> on amr0
Nov 28 10:15:15 core kernel: amrd0: 35043MB (71768064 sectors) RAID 1 (optimal)
Nov 28 10:15:15 core kernel: SMP: AP CPU #1 Launched!
Nov 28 10:15:15 core kernel: Mounting root from ufs:/dev/amrd0s1a
Nov 28 10:15:15 core kernel: WARNING: / was not properly dismounted
Nov 28 10:15:15 core kernel: WARNING: /tmp was not properly dismounted
Nov 28 10:15:15 core kernel: WARNING: /usr was not properly dismounted
Nov 28 10:15:15 core kernel: WARNING: /var was not properly dismounted
Nov 28 10:15:30 core login: ROOT LOGIN (root) ON ttyv0
Nov 28 10:16:24 core fsck: /dev/amrd0s1d: 76 files, 8 used, 1013007 free (63 frags, 126618 blocks, 0.0% fragmentation)
Nov 28 10:16:47 core su: psa to root on /dev/ttyp0
Nov 28 10:19:43 core fsck: /dev/amrd0s1f: 227729 files, 2154083 used, 4047873 free (23865 frags, 503001 blocks, 0.4% fragmentation)
Nov 28 10:20:11 core fsck: /dev/amrd0s1e: UNREF FILE I=1295362 OWNER=mysql MODE=100600
Nov 28 10:20:11 core fsck: /dev/amrd0s1e: SIZE=0 MTIME=Nov 22 16:44 2006 (CLEARED)
Nov 28 10:20:11 core fsck: /dev/amrd0s1e: UNREF FILE I=1295363 OWNER=mysql MODE=100600
Nov 28 10:20:11 core fsck: /dev/amrd0s1e: SIZE=0 MTIME=Nov 22 16:44 2006 (CLEARED)
Nov 28 10:20:11 core fsck: /dev/amrd0s1e: UNREF FILE I=1295364 OWNER=mysql MODE=100600
Nov 28 10:20:11 core fsck: /dev/amrd0s1e: SIZE=0 MTIME=Nov 22 16:44 2006 (CLEARED)
Nov 28 10:20:11 core fsck: /dev/amrd0s1e: UNREF FILE I=1295365 OWNER=mysql MODE=100600
Nov 28 10:20:11 core fsck: /dev/amrd0s1e: SIZE=0 MTIME=Nov 22 16:44 2006 (CLEARED)
Nov 28 10:20:11 core fsck: /dev/amrd0s1e: Reclaimed: 0 directories, 5 files, -13 fragments
Nov 28 10:20:11 core fsck: /dev/amrd0s1e: 10132 files, 1034810 used, 6580842 free (4346 frags, 822062 blocks, 0.1% fragmentation)
скорее всего падает она из-за какого-то демона. попробуйте обновить порты, если есть возможность, методом исключения вычислите в чём дело. также может быть проблема с железом. вариантов миллион
>скорее всего падает она из-за какого-то демона. попробуйте обновить порты, если есть
>возможность, методом исключения вычислите в чём дело. также может быть проблема
>с железом. вариантов миллионЯ конечно обновлю порты, но такая проблема возникла неделю назад, до этого все было нормально. То есть дело не в портах и с железом траблов быть не должно.
>>скорее всего падает она из-за какого-то демона. попробуйте обновить порты, если есть
>>возможность, методом исключения вычислите в чём дело. также может быть проблема
>>с железом. вариантов миллион
>
>Я конечно обновлю порты, но такая проблема возникла неделю назад, до этого
>все было нормально. То есть дело не в портах и с
>железом траблов быть не должно.
а может его DOSит кто?
>а может его DOSит кто?Это нереально, он снаружи циской закрыт. То есть там ошибок вообще никаких в логах нет, он просто виснет.
а почему уверен что не железо?
>а почему уверен что не железо?
Часом места на диске не закончилось?
>Часом места на диске не закончилось?Filesystem 1K-blocks Used Avail Capacity Mounted on
/dev/amrd0s1a 2026030 50156 1813792 3% /
devfs 1 1 0 100% /dev
/dev/amrd0s1d 2026030 16 1863932 0% /tmp
/dev/amrd0s1f 12403912 4414130 6997470 39% /usr
/dev/amrd0s1e 15231278 2052934 11959842 15% /var
>а почему уверен что не железо?Внезапность. железо либо должно глючить сразу, либо ломаться впоследствии.Ни того, ни другого не происходит.
> либо ломаться впоследствии
Вот это "впоследствии" скорее всего и наступило. Почему такая уверенность, что проблема не в железе?
>> либо ломаться впоследствии
>Вот это "впоследствии" скорее всего и наступило. Почему такая уверенность, что проблема
>не в железе?Проще всего списать все на железо. Но доказательств, что это именно оно, нету.
Но и доказательств обратного нету. Первое, что приходит в голову при таком поведении сервера и пустых логах - железо. Лично я бы в первую очередь 1. потестил бы память, 2. проверил бы блок(и) питания.
Есть ещё и такой фактор как температура в серверной.
>Но и доказательств обратного нету. Первое, что приходит в голову при таком
>поведении сервера и пустых логах - железо. Лично я бы в
>первую очередь 1. потестил бы память, 2. проверил бы блок(и) питания.
>
>Есть ещё и такой фактор как температура в серверной.Тулзы для теста памяти под BSD есть? Блок питания вроде меняли на более мощный, а температура в серверной ~5-10градусов, то есть холодно.
/usr/ports/sysutils/memtest
Loop 1:
Stuck Address : ok
Random Value : ok
Compare XOR : ok
Compare SUB : ok
Compare MUL : ok
Compare DIV : ok
Compare OR : ok
Compare AND : ok
Sequential Increment: ok
Solid Bits : ok
Block Sequential : ok
Checkerboard : ok
Bit Spread : ok
Bit Flip : ok
Walking Ones : ok
Walking Zeroes : okLoop 2:
Stuck Address : ok
Random Value : ok
Compare XOR : ok
Compare SUB : ok
Compare MUL : ok
Compare DIV : ok
Compare OR : ok
Compare AND : ok
Sequential Increment: ok
Solid Bits : ok
Block Sequential : ok
Checkerboard : ok
Bit Spread : ok
Bit Flip : ok
Walking Ones : ok
Walking Zeroes : ok
>> либо ломаться впоследствии
>Вот это "впоследствии" скорее всего и наступило. Почему такая уверенность, что проблема
>не в железе?это легко проверяется, вытаскивается винт, ставится на другую машину, корректируется минимум конфигов(все что связано с изменением железа) и поехали...
если виснет, то проблема в софте
если нет, железку менять пора...к сожалению легче обвинить железо, чем как шахтер добывать правду в других местах...
Тем более что BSD не виснет если нет проблем в железе, ибо это не винды где одна программка может повесить всю ось! (исключая заДОСеность BSD-ы)
Ладно, я понимаю. Другой вопрос: "Как проверить железо, если он падает не каждый день?" Сервер сборный, но другого корпуса для него нет.
>Ладно, я понимаю. Другой вопрос: "Как проверить железо, если он падает не
>каждый день?" Сервер сборный, но другого корпуса для него нет.
А нет ли на МБ "вспухших" конденсаторов?
>А нет ли на МБ "вспухших" конденсаторов?Я думаю, что, если бы дело было в матери, то комп рубанулся бы, а не завис.
Сервер пингуется когда зависает или вообще никак не откликается?
Была похожая ситуация - проблема оказалась с винтом. Причем также самопроизвольно вис без корреляции по времени.
>>А нет ли на МБ "вспухших" конденсаторов?
>
>Я думаю, что, если бы дело было в матери, то комп рубанулся
>бы, а не завис.
не правильный вывод, из-за МБ может загружаться, работать, потом виснет...
у меня был похожий случай, но серв был на гарантии, заменили блок питания и память - заработал
По питанию 12 вольт примерно через пол часа уходило в 7 вольт... посмотреть можно прям из биоса
>>>А нет ли на МБ "вспухших" конденсаторов?
>>
>>Я думаю, что, если бы дело было в матери, то комп рубанулся
>>бы, а не завис.
>
>
>не правильный вывод, из-за МБ может загружаться, работать, потом виснет...
>у меня был похожий случай, но серв был на гарантии, заменили блок
>питания и память - заработал
>По питанию 12 вольт примерно через пол часа уходило в 7 вольт...
>посмотреть можно прям из биосаЭто как во время работы посмотреть прям из биоса?
>>>>А нет ли на МБ "вспухших" конденсаторов?
>>>
>>>Я думаю, что, если бы дело было в матери, то комп рубанулся
>>>бы, а не завис.
>>
>>
>>не правильный вывод, из-за МБ может загружаться, работать, потом виснет...
>>у меня был похожий случай, но серв был на гарантии, заменили блок
>>питания и память - заработал
>>По питанию 12 вольт примерно через пол часа уходило в 7 вольт...
>>посмотреть можно прям из биоса
>
>Это как во время работы посмотреть прям из биоса?во время работы не из биоса, а только через /usr/ports/sysutils/xmbmon
запускай с ключами: mbmon -c 1 -r -I
Холодно в серверной, это не значит что хорошо, при температуре 5-10 градусов можно от вашего самосбора ожидать чего угодно, и еще следует не отрицать проблему железа, а прислушаться к советам людей и все таки посмотреть не вспухли ли кандеры на матери, пара таких кандеров может конкретно испортить вам жизнь, проверенно
>Холодно в серверной, это не значит что хорошо, при температуре 5-10 градусов
>можно от вашего самосбора ожидать чего угодно, и еще следует не
>отрицать проблему железа, а прислушаться к советам людей и все таки
>посмотреть не вспухли ли кандеры на матери, пара таких кандеров может
>конкретно испортить вам жизнь, проверенноименно из-за температуры(балкон, темпиратура от -5 до +14) и сборного железа винт начал сыпаться
все остальное, тьфу-тьфу, работает
>во время работы не из биоса, а только через /usr/ports/sysutils/xmbmon
>запускай с ключами: mbmon -c 1 -r -IУ меня эта дрянь без X собираться не хочет.
>>во время работы не из биоса, а только через /usr/ports/sysutils/xmbmon
>>запускай с ключами: mbmon -c 1 -r -I
>
>У меня эта дрянь без X собираться не хочет.
# makeDefinable build options
-----------------------
WITHOUT_X11 - Self explanatory
># make
>
>Definable build options
>-----------------------
>WITHOUT_X11 - Self explanatoryА полностью как будет?
make WITHOUT_X11
не работает. Вообще, в Makefile нет такой опции, а просто сделать ./configure --without-x сделать не получается, ругается.
>># make
>>
>>Definable build options
>>-----------------------
>>WITHOUT_X11 - Self explanatory
>
>А полностью как будет?
>make WITHOUT_X11
>не работает. Вообще, в Makefile нет такой опции, а просто сделать ./configure
>--without-x сделать не получается, ругается.make -D WITHOUT_X11
core# make -D WITHOUT_X11
===> Vulnerability check disabled, database not found
===> Found saved configuration for xmbmon-205_7
===> Extracting for xmbmon-205_7
=> MD5 Checksum OK for xmbmon205.tar.gz.
===> Patching for xmbmon-205_7
===> Applying extra patch /usr/ports/sysutils/xmbmon/files/patch-xmbmon.c
===> Applying extra patch /usr/ports/sysutils/xmbmon/files/patch-xmbmon.resources
===> Applying FreeBSD patches for xmbmon-205_7
===> xmbmon-205_7 depends on shared library: X11.6 - not found
===> Verifying install for X11.6 in /usr/ports/x11/xorg-libraries
===> Vulnerability check disabled, database not found
=> X11R6.9.0-src3.tar.gz doesn't seem to exist in /usr/ports/distfiles/xorg.
=> Attempting to fetch from ftp://ftp.gwdg.de/pub/x11/x.org/pub/X11R6.9.0/src/.
X11R6.9.0-src3.tar.gz 5% of 10 MB 45 kBps 03m45s^C
>core# make -D WITHOUT_X11
>===> Vulnerability check disabled, database not found
>===> Found saved configuration for xmbmon-205_7
>===> Extracting for xmbmon-205_7
>=> MD5 Checksum OK for xmbmon205.tar.gz.
>===> Patching for xmbmon-205_7
>===> Applying extra patch /usr/ports/sysutils/xmbmon/files/patch-xmbmon.c
>===> Applying extra patch /usr/ports/sysutils/xmbmon/files/patch-xmbmon.resources
>===> Applying FreeBSD patches for xmbmon-205_7
>===> xmbmon-205_7 depends on shared library: X11.6 - not found
>===> Verifying install for X11.6 in /usr/ports/x11/xorg-libraries
>===> Vulnerability check disabled, database not found
>=> X11R6.9.0-src3.tar.gz doesn't seem to exist in /usr/ports/distfiles/xorg.
>=> Attempting to fetch from ftp://ftp.gwdg.de/pub/x11/x.org/pub/X11R6.9.0/src/.
>X11R6.9.0-src3.tar.gz
>
> 5% of 10 MB
> 45 kBps 03m45s^Cда пусть скачает..
>да пусть скачает..А зачем? Он же потом к X11 потянет всякие либы левые.
>>да пусть скачает..
>
>А зачем? Он же потом к X11 потянет всякие либы левые.
я так думаю что не понятет, у меня на серве не знаю после чего х11 появился, хотя теоретически не используется
>Я думаю, что, если бы дело было в матери, то комп рубанулся
>бы, а не завис.
Не правда Вша!
Как раз "вспухшие" электролиты вызывают необяснимые и ничем необоснованые резеты, рестарты, зависы, старты с 3-его раза и.т.д.
Порты обновлены, будем ждать до следующего падения.