URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID1
Нить номер: 84562
[ Назад ]

Исходное сообщение
"Виснет FreeBSD 7.0 намертво. При копировании на самбу"

Отправлено Vzhik , 19-Мрт-09 12:01 
FreeBSD 7.0 релиз.
Машина П4 1800, 512рам, мать интел, на рейде 3ware8006 в зеркале два сата винта сигейт 750гиг. На них система и стоит.
При копировании на сервак по самбе (на тоже зеркало) больших объемов информации, через пол часа заливания система виснет намертво. Ни с консоли ничего нельзя сделать (нет реакции на клавиатуру, намлок не переключается), ни из сети нет пингов.
Ядро штатное. Пробовал две разные севухи - 3сом905 и интел10/100, одно и тоже. Пробовал Отключать сетевые сервисы (firewall, dhcp) нет изменений.
Вот вышла 7.1, буду пробовать обновить.
Но может есть у кого-нибудь мысли как сбойный модуль или кусок ядра вычислить?

Содержание

Сообщения в этом обсуждении
"Виснет FreeBSD 7.0 намертво. При копировании на самбу"
Отправлено Pahanivo , 19-Мрт-09 12:06 
>[оверквотинг удален]
>сата винта сигейт 750гиг. На них система и стоит.
>При копировании на сервак по самбе (на тоже зеркало) больших объемов информации,
>через пол часа заливания система виснет намертво. Ни с консоли ничего
>нельзя сделать (нет реакции на клавиатуру, намлок не переключается), ни из
>сети нет пингов.
>Ядро штатное. Пробовал две разные севухи - 3сом905 и интел10/100, одно и
>тоже. Пробовал Отключать сетевые сервисы (firewall, dhcp) нет изменений.
>Вот вышла 7.1, буду пробовать обновить.
>Но может есть у кого-нибудь мысли как сбойный модуль или кусок ядра
>вычислить?

для начала избався от "штатного" ядра, собери свое оптимальное


"Пересобрать попробую, но что отключать?"
Отправлено Vzhik , 19-Мрт-09 12:30 
>
>для начала избався от "штатного" ядра, собери свое оптимальное

Как вычислить из-за чего проблема? В логах пусто.


"Пересобрать попробую, но что отключать?"
Отправлено Pahanivo , 19-Мрт-09 15:55 
>>
>>для начала избався от "штатного" ядра, собери свое оптимальное
>
>Как вычислить из-за чего проблема? В логах пусто.

железо проверь, память мемтестом подруч
фря оч не любит глюкавое железо


"Железо первым делом проверял"
Отправлено Vzhik , 20-Мрт-09 14:49 
>железо проверь, память мемтестом подруч
>фря оч не любит глюкавое железо

мемтест на ночь запускал - небыло ошибок.  Надо было конечно сразу об этом написать...


"Железо первым делом проверял"
Отправлено Snake , 31-Мрт-09 00:23 
Аналогичная ситуация. 7.1 с оптимизированным ядром. 2 Гига RAM, Xeon 2,2, Adaptec 5805, два рейда 10 - один на 40 Гб под систему, другой на 3,5 ТБ - файловое хранилище. Рейды живые, не degraded и не rebuilding. Имеем три сервера с абслоютно одинаковыми конфигами ядра, на всех серверах крутится исключительно glftpd. Мясяц работали без проблем, держали нагрузку под 500Мб/с каждый. Неделю назад два умерли с симптомами, описываемыми коллегогой, создавшим тему. В логах - ноль, железо проверено уже раз по пять, биосы обновлены и на мамке, и на контроллере. С памятью все в порядке тоже. Без нагрузки сервера живут. Стоит в glftpd дать нагрузку хотя бы 100Мб/с - умирают в течение часа-двух. Переустанавливал систему (7.1), пробовал ставить штатный ftpd вместо glftpd - тот же результат. Комрады, оч прошу помочь, если кому удалося данную траблу победить. Ситуация тупиковая.

"Железо первым делом проверял"
Отправлено Snake , 31-Мрт-09 00:52 
В догонку к предыдущему посту:

[root@ftp2 /usr/home/ftp2]# cat /usr/src/sys/amd64/conf/FTP2 | grep -v ^# | grep -v ^$
cpu             HAMMER
ident           FTP2
makeoptions     DEBUG=-g                # Build kernel with gdb(1) debug symbols
options         SCHED_ULE               # ULE scheduler
options         ENABLE_ALART            # Control alarm on Intel intpm driver
options         PREEMPTION              # Enable kernel thread preemption
options         IPI_PREEMPTION          # Enable kernel thread preemption
options         INET                    # InterNETworking
options         SCTP                    # Stream Control Transmission Protocol
options         FFS                     # Berkeley Fast Filesystem
options         SOFTUPDATES             # Enable FFS soft updates support
options         UFS_ACL                 # Support for access control lists
options         UFS_DIRHASH             # Improve performance on big directories
options         UFS_GJOURNAL            # Enable gjournal-based UFS journaling
options         MD_ROOT                 # MD is a potential root device
options         CD9660                  # ISO 9660 Filesystem
options         PROCFS                  # Process filesystem (requires PSEUDOFS)
options         PSEUDOFS                # Pseudo-filesystem framework
options         GEOM_PART_GPT           # GUID Partition Tables.
options         GEOM_LABEL              # Provides labelization
options         COMPAT_43TTY            # BSD 4.3 TTY compat [KEEP THIS!]
options         COMPAT_IA32             # Compatible with i386 binaries
options         COMPAT_FREEBSD4         # Compatible with FreeBSD4
options         COMPAT_FREEBSD5         # Compatible with FreeBSD5
options         COMPAT_FREEBSD6         # Compatible with FreeBSD6
options         SCSI_DELAY=5000         # Delay (in ms) before probing SCSI
options         KTRACE                  # ktrace(1) support
options         STACK                   # stack(9) support
options         SYSVSHM                 # SYSV-style shared memory
options         SYSVMSG                 # SYSV-style message queues
options         SYSVSEM                 # SYSV-style semaphores
options         _KPOSIX_PRIORITY_SCHEDULING # POSIX P1003_1B real-time extensions
options         KBD_INSTALL_CDEV        # install a CDEV entry in /dev
options         ADAPTIVE_GIANT          # Giant mutex is adaptive.
options         AUDIT                   # Security event auditing
options         DEVICE_POLLING
options         HZ=2000
options         VM_KMEM_SIZE=1073741824
options         VM_KMEM_SIZE_MAX=1073741824
options         SMP                     # Symmetric MultiProcessor Kernel
device          cpufreq
device          acpi
device          pci
device          ata
device          atadisk         # ATA disk drives
device          ataraid         # ATA RAID drives
device          atapicd         # ATAPI CDROM drives
device          atapifd         # ATAPI floppy drives
device          atapist         # ATAPI tape drives
options         ATA_STATIC_ID   # Static device numbering
device          ahc             # AHA2940 and onboard AIC7xxx devices
options         AHC_REG_PRETTY_PRINT    # Print register bitfields in debug
                                        # output.  Adds ~128k to driver.
device          ahd             # AHA39320/29320 and onboard AIC79xx devices
options         AHD_REG_PRETTY_PRINT    # Print register bitfields in debug
                                        # output.  Adds ~215k to driver.
device          scbus           # SCSI bus (required for SCSI)
device          ch              # SCSI media changers
device          da              # Direct Access (disks)
device          sa              # Sequential Access (tape etc)
device          cd              # CD
device          pass            # Passthrough device (direct SCSI access)
device          ses             # SCSI Environmental Services (and SAF-TE)
device          aac             # Adaptec FSA RAID
device          aacp            # SCSI passthrough for aac (requires CAM)
device          atkbdc          # AT keyboard controller
device          atkbd           # AT keyboard
device          psm             # PS/2 mouse
device          kbdmux          # keyboard multiplexer
device          vga             # VGA video card driver
device          splash          # Splash screen and screen saver support
device          sc
device          agp             # support several AGP chipsets
device          cbb             # cardbus (yenta) bridge
device          pccard          # PC Card (16-bit) bus
device          cardbus         # CardBus (32-bit) bus
device          sio             # 8250, 16[45]50 based serial ports
device          uart            # Generic UART driver
device          ppc
device          ppbus           # Parallel port bus (required)
device          lpt             # Printer
device          plip            # TCP/IP over parallel
device          ppi             # Parallel port interface device
device          em              # Intel PRO/1000 Gigabit Ethernet Family
device          loop            # Network loopback
device          random          # Entropy device
device          ether           # Ethernet support
device          sl              # Kernel SLIP
device          ppp             # Kernel PPP
device          tun             # Packet tunnel.
device          pty             # Pseudo-ttys (telnet etc)
device          md              # Memory "disks"
device          gif             # IPv6 and IPv4 tunneling
device          faith           # IPv6-to-IPv4 relaying (translation)
device          firmware        # firmware assist module
device          uhci            # UHCI PCI->USB interface
device          ohci            # OHCI PCI->USB interface
device          ehci            # EHCI PCI->USB interface (USB 2.0)
device          usb             # USB Bus (required)
device          ugen            # Generic
device          uhid            # "Human Interface Devices"
device          ukbd            # Keyboard
device          umass           # Disks/Mass storage - Requires scbus and da
device          ums             # Mouse


"Железо первым делом проверял"
Отправлено Pahanivo , 31-Мрт-09 07:33 
>[оверквотинг удален]
>и не rebuilding. Имеем три сервера с абслоютно одинаковыми конфигами ядра,
>на всех серверах крутится исключительно glftpd. Мясяц работали без проблем, держали
>нагрузку под 500Мб/с каждый. Неделю назад два умерли с симптомами, описываемыми
>коллегогой, создавшим тему. В логах - ноль, железо проверено уже раз
>по пять, биосы обновлены и на мамке, и на контроллере. С
>памятью все в порядке тоже. Без нагрузки сервера живут. Стоит в
>glftpd дать нагрузку хотя бы 100Мб/с - умирают в течение часа-двух.
>Переустанавливал систему (7.1), пробовал ставить штатный ftpd вместо glftpd - тот
>же результат. Комрады, оч прошу помочь, если кому удалося данную траблу
>победить. Ситуация тупиковая.

1) чето я не увидил сильной оптимизации в вашем ядре - куча ненужного оставлена
2) с generic как дела обстоят?
3) изначально автор говорит про САМБУ, а не фтп.
4) по NTFS траблу не пробовали воспроизвести? попробуйте - может это глюук фри а не фтп или самбы.


"Adaptec 5805"
Отправлено weec , 01-Апр-09 18:34 
>[оверквотинг удален]
>и не rebuilding. Имеем три сервера с абслоютно одинаковыми конфигами ядра,
>на всех серверах крутится исключительно glftpd. Мясяц работали без проблем, держали
>нагрузку под 500Мб/с каждый. Неделю назад два умерли с симптомами, описываемыми
>коллегогой, создавшим тему. В логах - ноль, железо проверено уже раз
>по пять, биосы обновлены и на мамке, и на контроллере. С
>памятью все в порядке тоже. Без нагрузки сервера живут. Стоит в
>glftpd дать нагрузку хотя бы 100Мб/с - умирают в течение часа-двух.
>Переустанавливал систему (7.1), пробовал ставить штатный ftpd вместо glftpd - тот
>же результат. Комрады, оч прошу помочь, если кому удалося данную траблу
>победить. Ситуация тупиковая.

Adaptec 5805 [firmware build: 16501]
сейчас столкнулся как раз с подобной траблой
данный контроллер у меня работает под FreeBSD 7.1 amd64, система грузится как раз с логического диска под RAID-10
проблема даёт о себе знать при чтении определенного файла с этого диска
этот файл нашел экспериментальным путем с помошью tar
в итоге виснет контроллер, в /var/log/messages сыплются сообщения ядра о том, что контроллер не отвечает на команды ядра

после ряда экспериментов выяснилось, что:
- на FreeBSD для i386 и Linux для i386 - такой проблемы нет
- при использовании штатного aac-драйвера система не в состоянии вернуть в работу контроллер после зависания (FreeBSD 7.1 amd64), чего не скажешь о драйвере (aacu) с сайта производителя

отзывы о работе данного контроллера под Linux amd64 по этой ссылке http://communities.vmware.com/message/975407

писал об этом в freebsd-рассылки: scsi@, hackers@


"Adaptec 5805"
Отправлено Pahanivo , 01-Апр-09 19:29 
>[оверквотинг удален]
> - на FreeBSD для i386 и Linux для i386 - такой
>проблемы нет
> - при использовании штатного aac-драйвера система не в состоянии вернуть в
>работу контроллер после зависания (FreeBSD 7.1 amd64), чего не скажешь о
>драйвере (aacu) с сайта производителя
>
>отзывы о работе данного контроллера под Linux amd64 по этой ссылке http://communities.vmware.com/message/975407
>
>
>писал об этом в freebsd-рассылки: scsi@, hackers@

ны дак у вендора дрова всегда свежее - если есть )


"Железо первым делом проверял"
Отправлено Ziggy Stardust , 02-Апр-09 07:22 
>Аналогичная ситуация. 7.1 с оптимизированным ядром. 2 Гига RAM, Xeon 2,2, Adaptec
>5805, два рейда 10 - один на 40 Гб под систему,
>другой на 3,5 ТБ - файловое хранилище. Рейды живые, не degraded
>и не rebuilding.

...
>Комрады, оч прошу помочь, если кому удалося данную траблу
>победить. Ситуация тупиковая.

Винты какие используете? Случаем не 1 Тб сигейты?

В прошлом году имел сильно похожие проблемы с 5805 контроллером и сигейтами. Перепроверял под всеми доступными ОС - фря, фря64, солярка, винда в разных вариантах. Везде со временем было плохо - контроллер начинал зависать, файловые системы рушиться и т.д.

Совместно с саппортом нашего поставщика наконец то выяснили, что имеется несовместимость между адаптековскими контроллерами 5-ой серии и этой серией сигейтовских терабайтников (точно серию не помню, на адаптека надо поискать). В итоге заменили сигейты на хиттачи - с тех пор полет нормальный (сервер стоит под нагрузкой в качестве узла для резервного хранения данных).


"Железо первым делом проверял"
Отправлено weec , 02-Апр-09 12:27 
>[оверквотинг удален]
>В прошлом году имел сильно похожие проблемы с 5805 контроллером и сигейтами.
>Перепроверял под всеми доступными ОС - фря, фря64, солярка, винда в
>разных вариантах. Везде со временем было плохо - контроллер начинал зависать,
>файловые системы рушиться и т.д.
>
>Совместно с саппортом нашего поставщика наконец то выяснили, что имеется несовместимость между
>адаптековскими контроллерами 5-ой серии и этой серией сигейтовских терабайтников (точно серию
>не помню, на адаптека надо поискать). В итоге заменили сигейты на
>хиттачи - с тех пор полет нормальный (сервер стоит под нагрузкой
>в качестве узла для резервного хранения данных).

на сайте adaptec лежит документ с таблицами совместимости брендовых серверных шасси, жестких дисков, серверных материнских плат с их контроллерами

использую FUJITSU MAX3147RC
по совету коммиттеров aac проверял контроллер на системе установленной со снапшота 7.1-STABLE-200902-amd64 - проблем с зависанием не заметил


"Железо первым делом проверял"
Отправлено weec , 02-Апр-09 12:58 

>на сайте adaptec лежит документ с таблицами совместимости брендовых серверных шасси, жестких
>дисков, серверных материнских плат с их контроллерами

http://www.adaptec.com/en-us/_common/compatibility



"Железо первым делом проверял"
Отправлено weec , 04-Апр-09 16:39 

>использую FUJITSU MAX3147RC
>по совету коммиттеров aac проверял контроллер на системе установленной со снапшота 7.1-STABLE-200902-amd64
>- проблем с зависанием не заметил

тогда не заметил
сейчас проблема опять вылезла
похоже, сам контроллер кривой (Adaptec 5805)


"Виснет FreeBSD 7.0 намертво. При копировании на самбу"
Отправлено Hammer , 01-Апр-09 19:33 
>[оверквотинг удален]
>сата винта сигейт 750гиг. На них система и стоит.
>При копировании на сервак по самбе (на тоже зеркало) больших объемов информации,
>через пол часа заливания система виснет намертво. Ни с консоли ничего
>нельзя сделать (нет реакции на клавиатуру, намлок не переключается), ни из
>сети нет пингов.
>Ядро штатное. Пробовал две разные севухи - 3сом905 и интел10/100, одно и
>тоже. Пробовал Отключать сетевые сервисы (firewall, dhcp) нет изменений.
>Вот вышла 7.1, буду пробовать обновить.
>Но может есть у кого-нибудь мысли как сбойный модуль или кусок ядра
>вычислить?

У меня возникает настойчивое подозрение что хард сыпется.


"Виснет FreeBSD 7.0 намертво. При копировании на самбу"
Отправлено Анон , 09-Сен-09 11:36 
gjournal юзаешь?
У меня была похожая ситуация. Не мог вычислить причины зависаний. Вырубил журнал - аптайм уже 300 суток.