Может быть эта тема переростёт в железячную, может нет, я готов уже поверить во многое.
Итак.
Машина:
MB Abit ZM6 +
Celeron 433 Mhz +
128MB + 64MB +
IBM 60GB +
2 lan Rl +
Trident(isa) vga +
350W Microlab.ОС:
FreeBSD 5.4release.
Apache
PHP
MySQL
samba
NAT
ipfw
bind
mgettyсоответсвующие функции она и выполняет.
Проблема: Машина постоянно уходит в ребут при выполнении задач: samba, apache->php->mysql.
В логах ничего нет. Кроме как инфы о том, что в прошлый раз разделы не были корректно размонтированны. и сейчас будем делать fsck. В результате, что-нибудь типа:
Nov 8 22:53:16 bagroff fsck: /dev/ad0s1e: UNREF FILE I=1271810 OWNER=mysql MODE=100600
Nov 8 22:53:16 bagroff fsck: /dev/ad0s1e: SIZE=0 MTIME=Nov 8 12:35 2005 (CLEARED)
Nov 8 22:53:16 bagroff fsck: /dev/ad0s1e: UNREF FILE I=1271811 OWNER=mysql MODE=100600
Nov 8 22:53:16 bagroff fsck: /dev/ad0s1e: SIZE=0 MTIME=Nov 8 12:35 2005 (CLEARED)
Nov 8 22:53:16 bagroff fsck: /dev/ad0s1e: UNREF FILE I=1271854 OWNER=mysql MODE=100600
Nov 8 22:53:16 bagroff fsck: /dev/ad0s1e: SIZE=0 MTIME=Nov 8 12:35 2005 (CLEARED)
Nov 8 22:53:16 bagroff fsck: /dev/ad0s1e: UNREF FILE I=2096147 OWNER=root MODE=140666
Nov 8 22:53:16 bagroff fsck: /dev/ad0s1e: SIZE=0 MTIME=Nov 8 12:35 2005 (CLEARED)Соотвественно с потерей данных.
Почему только при таких задачах? При tar cvzf portsN.tgz /usr/ports/* одновренно запущенных раз 5 или 6, никаких ребутов не происходит.
Сначала думал, что просто при загрузке машины её ребутит. Нашёл два подозрительных кондера на матери - перепаяли, не помогло. Поменял БП с 250 на 350 - не помогло.
В чем может быть трабла? куда дальше пинать? у кого-какие соображения?
Я так думаю надо отключать по одной службе и смотреть. как себя будет вести машина.
Проблема может быть вчем угодно и капать можно долго. Будет полегче если удастся выявить какую нить передичность перезагрузок. потом посмотреть чего в это время могло работать. пошустрить внимательно логи.
Совсем недавно у одного товарища была проблемма с перезагрузками, так всему веной как бы это странно не казалось оказался bind. в конфигурации которого сделали (как считах хозяин) незначительный изменения.
Плюс совсем забыл. А вы проводили какиенибуть мероприятия по проверке качества работы памяти, процессора ...
>Может быть эта тема переростёт в железячную, может нет, я готов уже
>поверить во многое.
>Итак.
>Машина:
>MB Abit ZM6 +
>Celeron 433 Mhz +
>128MB + 64MB +
>IBM 60GB +
>2 lan Rl +
>Trident(isa) vga +
>350W Microlab.
>
>ОС:
>FreeBSD 5.4release.
>Apache
>PHP
>MySQL
>samba
>NAT
>ipfw
>bind
>mgetty
>
>соответсвующие функции она и выполняет.
>
>Проблема: Машина постоянно уходит в ребут при выполнении задач: samba, apache->php->mysql.
>
>В логах ничего нет. Кроме как инфы о том, что в прошлый
>раз разделы не были корректно размонтированны. и сейчас будем делать fsck.
>В результате, что-нибудь типа:
>
>Nov 8 22:53:16 bagroff fsck: /dev/ad0s1e: UNREF FILE I=1271810 OWNER=mysql
>MODE=100600
>Nov 8 22:53:16 bagroff fsck: /dev/ad0s1e: SIZE=0 MTIME=Nov 8 12:35
>2005 (CLEARED)
>Nov 8 22:53:16 bagroff fsck: /dev/ad0s1e: UNREF FILE I=1271811 OWNER=mysql
>MODE=100600
>Nov 8 22:53:16 bagroff fsck: /dev/ad0s1e: SIZE=0 MTIME=Nov 8 12:35
>2005 (CLEARED)
>Nov 8 22:53:16 bagroff fsck: /dev/ad0s1e: UNREF FILE I=1271854 OWNER=mysql
>MODE=100600
>Nov 8 22:53:16 bagroff fsck: /dev/ad0s1e: SIZE=0 MTIME=Nov 8 12:35
>2005 (CLEARED)
>Nov 8 22:53:16 bagroff fsck: /dev/ad0s1e: UNREF FILE I=2096147 OWNER=root
>MODE=140666
>Nov 8 22:53:16 bagroff fsck: /dev/ad0s1e: SIZE=0 MTIME=Nov 8 12:35
>2005 (CLEARED)
>
>Соотвественно с потерей данных.
>
>Почему только при таких задачах? При tar cvzf portsN.tgz /usr/ports/* одновренно запущенных
>раз 5 или 6, никаких ребутов не происходит.
>
>Сначала думал, что просто при загрузке машины её ребутит. Нашёл два подозрительных
>кондера на матери - перепаяли, не помогло. Поменял БП с 250
>на 350 - не помогло.
>
>В чем может быть трабла? куда дальше пинать? у кого-какие соображения?
Проблема вероятно в IDE контроллере и дисках (DMA mode), большинство
Abit'ов этим страдает из-за HPT контроллера.
Удалось подключить монитор к сис. блок с freebsd и сообщение перед ребутом след.
panic: ffs_alloccg. Сannont dump. No dump device defined.
Почти аналогичные грабли...
Имеем
Copyright (c) 1992-2005 The FreeBSD Project.
Copyright (c) 1979, 1980, 1983, 1986, 1988, 1989, 1991, 1992, 1993, 1994
The Regents of the University of California. All rights reserved.
FreeBSD 5.4-RELEASE-p8 #3: Thu Oct 13 18:52:49 EEST 2005
ACPI APIC Table: <INTEL D845GLVA>
Timecounter "i8254" frequency 1193182 Hz quality 0
CPU: Intel(R) Celeron(R) CPU 1.70GHz (1699.81-MHz 686-class CPU)
Origin = "GenuineIntel" Id = 0xf13 Stepping = 3
Features=0x3febfbff<FPU,VME,DE,PSE,TSC,MSR,PAE,MCE,CX8,APIC,SEP,MTRR,PGE,MCA,CMOV,PAT,PSE36,CLFLUSH,DTS,ACPI,MMX,FXSR,SSE,SSE2,SS,HTT,TM>
real memory = 266600448 (254 MB)
avail memory = 255201280 (243 MB)
ioapic0 <Version 2.0> irqs 0-23 on motherboard
npx0: <math processor> on motherboard
npx0: INT 16 interface
acpi0: <INTEL D845GLVA> on motherboard
acpi0: Power Button (fixed)
Timecounter "ACPI-fast" frequency 3579545 Hz quality 1000
acpi_timer0: <24-bit timer at 3.579545MHz> port 0x408-0x40b on acpi0
cpu0: <ACPI CPU> on acpi0
acpi_throttle0: <ACPI CPU Throttling> on cpu0
pcib0: <ACPI Host-PCI bridge> port 0xcf8-0xcff on acpi0
pci0: <ACPI PCI bus> on pcib0
agp0: <Intel 82845G (845G GMCH) SVGA controller> mem 0xffa80000-0xffafffff,0xf0000000-0xf7ffffff irq 16 at device 2.0 on pci0
agp0: detected 892k stolen memory
agp0: aperture size is 128M
uhci0: <Intel 82801DB (ICH4) USB controller USB-A> port 0xe800-0xe81f irq 16 at device 29.0 on pci0
usb0: <Intel 82801DB (ICH4) USB controller USB-A> on uhci0
usb0: USB revision 1.0
uhub0: Intel UHCI root hub, class 9/0, rev 1.00/1.00, addr 1
uhub0: 2 ports with 2 removable, self powered
uhci1: <Intel 82801DB (ICH4) USB controller USB-B> port 0xe880-0xe89f irq 19 at device 29.1 on pci0
usb1: <Intel 82801DB (ICH4) USB controller USB-B> on uhci1
usb1: USB revision 1.0
uhub1: Intel UHCI root hub, class 9/0, rev 1.00/1.00, addr 1
uhub1: 2 ports with 2 removable, self powered
uhci2: <Intel 82801DB (ICH4) USB controller USB-C> port 0xec00-0xec1f irq 18 at device 29.2 on pci0
usb2: <Intel 82801DB (ICH4) USB controller USB-C> on uhci2
usb2: USB revision 1.0
uhub2: Intel UHCI root hub, class 9/0, rev 1.00/1.00, addr 1
uhub2: 2 ports with 2 removable, self powered
pci0: <serial bus, USB> at device 29.7 (no driver attached)
pcib1: <ACPI PCI-PCI bridge> at device 30.0 on pci0
pci1: <ACPI PCI bus> on pcib1
fxp0: <Intel 82559 Pro/100 Ethernet> port 0xd400-0xd43f mem 0xff700000-0xff7fffff,0xff8df000-0xff8dffff irq 21 at device 0.0 on pci1
miibus0: <MII bus> on fxp0
inphy0: <i82555 10/100 media interface> on miibus0
inphy0: 10baseT, 10baseT-FDX, 100baseTX, 100baseTX-FDX, auto
fxp0: Ethernet address: 00:d0:b7:6a:e1:2d
atapci0: <HighPoint HPT372 UDMA133 controller> port 0xd000-0xd0ff,0xd480-0xd483,0xd800-0xd807,0xd880-0xd883,0xdc00-0xdc07 irq 18 at device 2.0 on pci1
ata2: channel #0 on atapci0
ata3: channel #1 on atapci0
fxp1: <Intel 82801DB (ICH4) Pro/100 VE Ethernet> port 0xdf00-0xdf3f mem 0xff8de000-0xff8defff irq 20 at device 8.0 on pci1
miibus1: <MII bus> on fxp1
inphy1: <i82562ET 10/100 media interface> on miibus1
inphy1: 10baseT, 10baseT-FDX, 100baseTX, 100baseTX-FDX, auto
fxp1: Ethernet address: 00:07:e9:80:59:c5
isab0: <PCI-ISA bridge> at device 31.0 on pci0
isa0: <ISA bus> on isab0
atapci1: <Intel ICH4 UDMA100 controller> port 0xffa0-0xffaf,0x376,0x170-0x177,0x3f6,0x1f0-0x1f7 at device 31.1 on pci0
ata0: channel #0 on atapci1
ata1: channel #1 on atapci1
pci0: <serial bus, SMBus> at device 31.3 (no driver attached)
acpi_button0: <Sleep Button> on acpi0
fdc0: <floppy drive controller> port 0x3f7,0x3f4-0x3f5,0x3f2-0x3f3,0x3f0-0x3f1 irq 6 drq 2 on acpi0
fd0: <1440-KB 3.5" drive> on fdc0 drive 0
sio0: configured irq 4 not in bitmap of probed irqs 0
sio0: port may not be enabled
sio0: <16550A-compatible COM port> port 0x3f8-0x3ff irq 4 flags 0x10 on acpi0
sio0: type 16550A
atkbdc0: <Keyboard controller (i8042)> port 0x64,0x60 irq 1 on acpi0
atkbd0: <AT Keyboard> irq 1 on atkbdc0
kbd0 at atkbd0
orm0: <ISA Option ROMs> at iomem 0xd0800-0xd17ff,0xcf800-0xd07ff on isa0
pmtimer0 on isa0
ppc0: parallel port not found.
sc0: <System console> at flags 0x100 on isa0
sc0: VGA <16 virtual consoles, flags=0x300>
sio1: configured irq 3 not in bitmap of probed irqs 0
sio1: port may not be enabled
vga0: <Generic ISA VGA> at port 0x3c0-0x3df iomem 0xa0000-0xbffff on isa0
Timecounter "TSC" frequency 1699812872 Hz quality 800
Timecounters tick every 10.000 msec
ipfw2 initialized, divert enabled, rule-based forwarding enabled, default to deny, logging limited to 100 packets/entry by default
ad0: 38204MB <SAMSUNG SV4002H/QP100-09> [77622/16/63] at ata0-master UDMA100
ad4: 152627MB <ST3160023A/8.01> [310101/16/63] at ata2-master UDMA100
ad6: 152627MB <ST3160023A/8.01> [310101/16/63] at ata3-master UDMA100
ar0: 152627MB <ATA RAID1 array> [19457/255/63] status: READY subdisks:
disk0 READY on ad4 at ata2-master
disk1 READY on ad6 at ata3-master
Mounting root from ufs:/dev/ar0s1a
WARNING: / was not properly dismounted
WARNING: /home was not properly dismounted
/home: mount pending error: blocks 24660 files 82
WARNING: /tmp was not properly dismounted
WARNING: /usr was not properly dismounted
WARNING: /var was not properly dismounted
/var: mount pending error: blocks 140 files 7
WARNING: /mnt/backup was not properly dismountedМашина технологический почтальон, Sendmail, DrWeb, фтп сервер, Apache+Mailgraph.
внезапный ребут несколько раз был замечен при сливании по фтп больших файлов ~700Mb
Вчера обновлял DrWeb
drweb-4.33 < needs updating (port has 4.33_1)
drweb-sendmail-4.32.1 < needs updating (port has 4.33)Обновился он как-то криво, стал ругаться
Nov 10 12:29:02 robot sm-mta[760]: jAAAS2KG000760: Milter (drweb-filter): error connecting to filter: Interrupted system callЯ его (drweb и drweb-sendmail) снёс, забекапив конфиг.
Ставлю снова:
# cd /usr/ports/security/drweb-sendmail/
# make
# make installпри строках о регистрации инсталяции уходит в ребут
на консоли
panic: ffc_clusteralloc: map mismatch
Uptime: 13m 26s
Cannon dump. No dump device defined.
Automatic reboot in 15 seconds - press a key on the console to abortВот такие вот грабли...
гугление пока результатов не принесло...