стали не редки проблемы зависания сервера (при этом пингуется, на ssh не отвечает (коннект висит, логин ввести не дает), сайты не открываются - думаю... почта аналогично).что может быть? такое ощущение, что его что-то забивает, но не ясно что
где искать?top - 10:47:29 up 51 min, 1 user, load average: 97.05, 33.10, 18.26
Tasks: 413 total, 1 running, 412 sleeping, 0 stopped, 0 zombie
Cpu(s): 0.0%us, 0.5%sy, 0.0%ni, 0.0%id, 99.3%wa, 0.2%hi, 0.0%si, 0.0%st
Mem: 1032544k total, 1018724k used, 13820k free, 116056k buffers
Swap: 2104504k total, 0k used, 2104504k free, 387580k cachedPID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
28673 root 15 0 2516 1220 764 R 1 0.1 0:00.53 top
6 root 10 -5 0 0 0 S 0 0.0 0:00.41 events/0
1 root 15 0 744 288 240 S 0 0.0 0:01.57 init
2 root RT 0 0 0 0 S 0 0.0 0:00.10 migration/0
3 root 34 19 0 0 0 S 0 0.0 0:00.00 ksoftirqd/0
4 root RT 0 0 0 0 S 0 0.0 0:00.03 migration/1
5 root 39 19 0 0 0 S 0 0.0 0:00.00 ksoftirqd/1
7 root 10 -5 0 0 0 S 0 0.0 0:00.00 events/1
8 root 10 -5 0 0 0 S 0 0.0 0:00.00 khelper
9 root 12 -5 0 0 0 S 0 0.0 0:00.00 kthread
13 root 10 -5 0 0 0 S 0 0.0 0:00.20 kblockd/0
14 root 10 -5 0 0 0 S 0 0.0 0:00.00 kblockd/1
15 root 14 -5 0 0 0 S 0 0.0 0:00.00 kacpid
109 root 14 -5 0 0 0 S 0 0.0 0:00.00 cqueue/0
110 root 14 -5 0 0 0 S 0 0.0 0:00.00 cqueue/1
111 root 13 -5 0 0 0 S 0 0.0 0:00.00 kseriod
155 root 19 0 0 0 0 S 0 0.0 0:00.00 pdflush
156 root 15 0 0 0 0 D 0 0.0 0:00.86 pdflush
157 root 16 -5 0 0 0 S 0 0.0 0:00.12 kswapd0
158 root 14 -5 0 0 0 S 0 0.0 0:00.00 aio/0
159 root 14 -5 0 0 0 S 0 0.0 0:00.00 aio/1
411 root 15 -5 0 0 0 S 0 0.0 0:00.00 kpsmoused
798 root 12 -5 0 0 0 S 0 0.0 0:00.00 ata/0
799 root 13 -5 0 0 0 S 0 0.0 0:00.00 ata/1
800 root 14 -5 0 0 0 D 0 0.0 0:00.00 ata_aux
808 root 10 -5 0 0 0 D 0 0.0 0:00.01 scsi_eh_0
809 root 11 -5 0 0 0 S 0 0.0 0:00.01 scsi_eh_1
810 root 10 -5 0 0 0 S 0 0.0 0:00.00 scsi_eh_2
811 root 10 -5 0 0 0 S 0 0.0 0:00.00 scsi_eh_3
901 root 10 -5 0 0 0 D 0 0.0 0:03.09 kmirrord
931 root 13 -5 0 0 0 S 0 0.0 0:00.00 kcopyd
1021 root 10 -5 0 0 0 D 0 0.0 0:00.10 kjournald
1069 root 21 -4 1840 584 332 S 0 0.1 0:00.54 udevd
1805 root 10 -5 0 0 0 S 0 0.0 0:00.00 khubd
2209 root 10 -5 0 0 0 S 0 0.0 0:00.00 kjournald
2211 root 10 -5 0 0 0 D 0 0.0 0:05.00 kjournald
2213 root 10 -5 0 0 0 D 0 0.0 0:00.20 kjournald
2215 root 10 -5 0 0 0 D 0 0.0 0:00.08 kjournald
2217 root 10 -5 0 0 0 D 0 0.0 0:00.15 kjournald
2597 nobody 15 0 12200 1588 1028 S 0 0.2 0:00.00 in.imapproxyd
2624 messageb 15 0 3552 948 712 S 0 0.1 0:00.25 dbus-daemon
2638 root 21 0 1580 424 356 S 0 0.0 0:00.00 startpar
2683 root 23 0 1584 424 356 S 0 0.0 0:04.79 startpar
2692 root 18 0 1580 408 336 S 0 0.0 0:00.02 courierlogger
2709 root 16 0 1588 520 432 S 0 0.1 0:00.00 acpid
2710 root 18 0 2764 868 652 S 0 0.1 0:00.00 authdaemond
2739 root 18 0 1828 676 548 S 0 0.1 0:00.00 resmgrd
2745 root 23 0 2608 704 552 S 0 0.1 0:00.04 pop3d
>load average: 97.05, 33.10, 18.26Твоему серверу некогда размениваться на всякие ssh подключения с таким уровнем загрузки, кривой вывод top`a не видно кто сколько процессорного времени потребляет, но кажется все в пределах нормы. Top странный како-то на BSD`шный не похож, >99.3%wa< может в этом проблема, uname -a, dmesg, sockstat, и прочее показал бы.
>>load average: 97.05, 33.10, 18.26
>
>Твоему серверу некогда размениваться на всякие ssh подключения с таким уровнем загрузки, кривой вывод top`a не видно кто сколько процессорного времени потребляет, но кажется все в пределах нормы. Top странный како-то на BSD`шный не похож, >99.3%wa< может в этом проблема, uname -a, dmesg, sockstat, и прочее показал бы.он linux'овый open suse
но как в итоге выясняется проблема с жесткими дисками.
>>>load average: 97.05, 33.10, 18.26
>>
>>Твоему серверу некогда размениваться на всякие ssh подключения с таким уровнем загрузки, кривой вывод top`a не видно кто сколько процессорного времени потребляет, но кажется все в пределах нормы. Top странный како-то на BSD`шный не похож, >99.3%wa< может в этом проблема, uname -a, dmesg, sockstat, и прочее показал бы.
> он linux'овый open suse
> но как в итоге выясняется проблема с жесткими дисками.То же самое, debian squeeze, очередь из запросов на запись -> сервер виснет. Расскажи, как вычислил проблему и в чем решение!!!
Может что-то с железом ????
> Может что-то с железом ????проблема не решена, на самом деле, но как-то само собой спАла. С железом все нормально. стоят три виртуалки на vserver.
если начать, например, копирование какого-нибудь большого файла, или другим образом дать большую нагрузку - диски падают в busy (atop), load average: ~30 (top), и веб-морда перестает отдавать страницы.
в один прекрасный день мне пришло письмо от mdadm (как еще догадался поставить свой е-маил при настройке mdadm!), что рейд у вас упал (типа повреждение массива, точную формулировку не вспомню). думали, сгорел винт. при выяснении с саппортом оказалось, что сдохла шина. поменяли платформу. после этого стало лучше, но все равно не решилась проблема.