URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID1
Нить номер: 87484
[ Назад ]

Исходное сообщение
"Зависания NFS-сервера"

Отправлено John Lepikhin , 01-Дек-09 18:49 
Периодически (раз в 15..60 часов) виснет NFS-сервер с такими симптомами:

------------[ cut here ]------------
kernel BUG at fs/locks.c:173!
invalid opcode: 0000 [#1] SMP
Modules linked in: inet_diag ip_set_iphash iptable_filter ip_tables x_tables
quota_v2 raid456 async_xor async_memcpy async_tx xor reiserfs nfsd exportfs nfs
lockd nfs_acl md_mod ib_iser rdma_cm ib_cm iw_cm ib_sa ib_mad ib_core ib_addr
ipv6 iscsi_tcp libiscsi scsi_transport_iscsi iscsi_trgt crc32c libcrc32c ip_set
rpcsec_gss_krb5 auth_rpcgss sunrpc fuse loop evdev i2c_i801 rng_core i2c_core
pcspkr container button i3000_edac edac_core shpchp pci_hotplug ext3 jbd
mbcache dm_mirror dm_log dm_snapshot dm_mod ses enclosure sd_mod ide_cd_mod
cdrom ata_generic libata dock ide_pci_generic piix ehci_hcd ide_core aacraid
uhci_hcd scsi_mod e1000e usbcore thermal processor fan thermal_sys [last
unloaded: scsi_wait_scan]

Pid: 2912, comm: nfsd Not tainted (2.6.26-2-686-bigmem #1)
EIP: 0060:[<c018a865>] EFLAGS: 00010283 CPU: 0
EIP is at locks_free_lock+0x17/0x3b
EAX: f6862ce0 EBX: f6862cd4 ECX: c036e340 EDX: f7484800
ESI: 00000001 EDI: f0453300 EBP: f5d2fd80 ESP: f5d2fd10
DS: 007b ES: 007b FS: 00d8 GS: 0000 SS: 0068
Process nfsd (pid: 2912, ti=f5d2e000 task=f79d2200 task.ti=f5d2e000)
Stack: dbc370a0 c018b6d9 f5d2fe18 f0453300 f6862cd4 dbc27954 fffffff5 00000004
       f8cc6bb9 f0453300 00000000 f5d2fe18 00000001 c018b717 f501806c ea590980
       f50180d4 f5018064 f8cd837d f631f1f0 e974d600 f5c24000 f119eb8c eb527f00
Call Trace:
[<c018b6d9>] generic_setlease+0x1d0/0x1dc
[<f8cc6bb9>] nfsd_open+0x135/0x164 [nfsd]
[<c018b717>] vfs_setlease+0x32/0x40
[<f8cd837d>] nfsd4_process_open2+0x723/0x89e [nfsd]
[<f8ba0120>] ib_unregister_mad_agent+0x2f5/0x387 [ib_mad]
[<c018c65e>] dput+0x15/0xbb
[<f8cd036b>] nfsd4_open+0x3b1/0x406 [nfsd]
[<f8ccffba>] nfsd4_open+0x0/0x406 [nfsd]
[<f8ccfdfc>] nfsd4_proc_compound+0x16d/0x255 [nfsd]
[<f8cc3205>] nfsd_dispatch+0xca/0x192 [nfsd]
[<f8b53fad>] svc_process+0x3a1/0x620 [sunrpc]
[<f8cc3731>] nfsd+0x171/0x268 [nfsd]
[<f8cc35c0>] nfsd+0x0/0x268 [nfsd]
[<c01094f3>] kernel_thread_helper+0x7/0x10
=======================
Code: 77 07 88 43 31 31 c0 eb 05 b8 ea ff ff ff 59 5b 5e 5f 5d c3 53 89 c3 8d
40 24 39 43 24 74 04 0f 0b eb fe 8d 43 0c 39 43 0c 74 04 <0f> 0b eb fe 8d 43 04
39 43 04 74 04 0f 0b eb fe 89 d8 e8 90 f6
EIP: [<c018a865>] locks_free_lock+0x17/0x3b SS:ESP 0068:f5d2fd10
---[ end trace 73cad64c80e3d3db ]---

Это я один такой несчастный, или в мире перевелись люди, имеющие на один NFS-сервер больше одного активного клиента? Вообще, кто имеет опыт промышленной эксплуатации NFS (трафик до сервера >100MBit, ежесекундно производится не менее 500 операций с файлами), оно бывает стабильным? Не страшно на большом NAS использовать?


Содержание

Сообщения в этом обсуждении
"Зависания NFS-сервера"
Отправлено сабакка , 01-Дек-09 19:33 
как на счёт установки 2.6.26.хх?

"Зависания NFS-сервера"
Отправлено John Lepikhin , 01-Дек-09 20:34 
>как на счёт установки 2.6.26.хх?

Такое и есть.

# uname -a
Linux debian.lenny 2.6.26-2-686-bigmem #1 SMP Wed Nov 4 21:12:12 UTC 2009 i686 GNU/Linux


"Зависания NFS-сервера"
Отправлено сабакка , 01-Дек-09 22:14 
думаете после 2.6.26.2, 2.6.26.3, .4, .5 не было?



"Зависания NFS-сервера"
Отправлено Solo_Wolf , 01-Дек-09 23:08 
>[оверквотинг удален]
>Code: 77 07 88 43 31 31 c0 eb 05 b8 ea
>ff ff ff 59 5b 5e 5f 5d c3 53 89
>c3 8d
>40 24 39 43 24 74 04 0f 0b eb fe 8d 43 0c 39 43 0c 74 04 <0f> 0b eb fe 8d 43 04
>39 43 04 74 04 0f 0b eb fe 89 d8 e8
>90 f6
>EIP: [<c018a865>] locks_free_lock+0x17/0x3b SS:ESP 0068:f5d2fd10
>---[ end trace 73cad64c80e3d3db ]---
>
>Это я один такой несчастный, или в мире перевелись люди, имеющие на один NFS-сервер больше одного активного клиента? Вообще, кто имеет опыт промышленной эксплуатации NFS (трафик до сервера >100MBit, ежесекундно производится не менее 500 операций с файлами), оно бывает стабильным? Не страшно на большом NAS использовать?

Похоже проблема с освобождением блокировок файлов. В вашем случае эта ошибка есть в ядре. И идет правильное сообщение. Может поиграться /proc/sys/kernel/max_lock_depth и /proc/sys/fs/file-max?

У меня вообще 2 интерфейса по 1Гб. И ничего...