FreeBSD 7.0 релиз.
Машина П4 1800, 512рам, мать интел, на рейде 3ware8006 в зеркале два сата винта сигейт 750гиг. На них система и стоит.
При копировании на сервак по самбе (на тоже зеркало) больших объемов информации, через пол часа заливания система виснет намертво. Ни с консоли ничего нельзя сделать (нет реакции на клавиатуру, намлок не переключается), ни из сети нет пингов.
Ядро штатное. Пробовал две разные севухи - 3сом905 и интел10/100, одно и тоже. Пробовал Отключать сетевые сервисы (firewall, dhcp) нет изменений.
Вот вышла 7.1, буду пробовать обновить.
Но может есть у кого-нибудь мысли как сбойный модуль или кусок ядра вычислить?
>[оверквотинг удален]
>сата винта сигейт 750гиг. На них система и стоит.
>При копировании на сервак по самбе (на тоже зеркало) больших объемов информации,
>через пол часа заливания система виснет намертво. Ни с консоли ничего
>нельзя сделать (нет реакции на клавиатуру, намлок не переключается), ни из
>сети нет пингов.
>Ядро штатное. Пробовал две разные севухи - 3сом905 и интел10/100, одно и
>тоже. Пробовал Отключать сетевые сервисы (firewall, dhcp) нет изменений.
>Вот вышла 7.1, буду пробовать обновить.
>Но может есть у кого-нибудь мысли как сбойный модуль или кусок ядра
>вычислить?для начала избався от "штатного" ядра, собери свое оптимальное
>
>для начала избався от "штатного" ядра, собери свое оптимальноеКак вычислить из-за чего проблема? В логах пусто.
>>
>>для начала избався от "штатного" ядра, собери свое оптимальное
>
>Как вычислить из-за чего проблема? В логах пусто.железо проверь, память мемтестом подруч
фря оч не любит глюкавое железо
>железо проверь, память мемтестом подруч
>фря оч не любит глюкавое железомемтест на ночь запускал - небыло ошибок. Надо было конечно сразу об этом написать...
Аналогичная ситуация. 7.1 с оптимизированным ядром. 2 Гига RAM, Xeon 2,2, Adaptec 5805, два рейда 10 - один на 40 Гб под систему, другой на 3,5 ТБ - файловое хранилище. Рейды живые, не degraded и не rebuilding. Имеем три сервера с абслоютно одинаковыми конфигами ядра, на всех серверах крутится исключительно glftpd. Мясяц работали без проблем, держали нагрузку под 500Мб/с каждый. Неделю назад два умерли с симптомами, описываемыми коллегогой, создавшим тему. В логах - ноль, железо проверено уже раз по пять, биосы обновлены и на мамке, и на контроллере. С памятью все в порядке тоже. Без нагрузки сервера живут. Стоит в glftpd дать нагрузку хотя бы 100Мб/с - умирают в течение часа-двух. Переустанавливал систему (7.1), пробовал ставить штатный ftpd вместо glftpd - тот же результат. Комрады, оч прошу помочь, если кому удалося данную траблу победить. Ситуация тупиковая.
В догонку к предыдущему посту:[root@ftp2 /usr/home/ftp2]# cat /usr/src/sys/amd64/conf/FTP2 | grep -v ^# | grep -v ^$
cpu HAMMER
ident FTP2
makeoptions DEBUG=-g # Build kernel with gdb(1) debug symbols
options SCHED_ULE # ULE scheduler
options ENABLE_ALART # Control alarm on Intel intpm driver
options PREEMPTION # Enable kernel thread preemption
options IPI_PREEMPTION # Enable kernel thread preemption
options INET # InterNETworking
options SCTP # Stream Control Transmission Protocol
options FFS # Berkeley Fast Filesystem
options SOFTUPDATES # Enable FFS soft updates support
options UFS_ACL # Support for access control lists
options UFS_DIRHASH # Improve performance on big directories
options UFS_GJOURNAL # Enable gjournal-based UFS journaling
options MD_ROOT # MD is a potential root device
options CD9660 # ISO 9660 Filesystem
options PROCFS # Process filesystem (requires PSEUDOFS)
options PSEUDOFS # Pseudo-filesystem framework
options GEOM_PART_GPT # GUID Partition Tables.
options GEOM_LABEL # Provides labelization
options COMPAT_43TTY # BSD 4.3 TTY compat [KEEP THIS!]
options COMPAT_IA32 # Compatible with i386 binaries
options COMPAT_FREEBSD4 # Compatible with FreeBSD4
options COMPAT_FREEBSD5 # Compatible with FreeBSD5
options COMPAT_FREEBSD6 # Compatible with FreeBSD6
options SCSI_DELAY=5000 # Delay (in ms) before probing SCSI
options KTRACE # ktrace(1) support
options STACK # stack(9) support
options SYSVSHM # SYSV-style shared memory
options SYSVMSG # SYSV-style message queues
options SYSVSEM # SYSV-style semaphores
options _KPOSIX_PRIORITY_SCHEDULING # POSIX P1003_1B real-time extensions
options KBD_INSTALL_CDEV # install a CDEV entry in /dev
options ADAPTIVE_GIANT # Giant mutex is adaptive.
options AUDIT # Security event auditing
options DEVICE_POLLING
options HZ=2000
options VM_KMEM_SIZE=1073741824
options VM_KMEM_SIZE_MAX=1073741824
options SMP # Symmetric MultiProcessor Kernel
device cpufreq
device acpi
device pci
device ata
device atadisk # ATA disk drives
device ataraid # ATA RAID drives
device atapicd # ATAPI CDROM drives
device atapifd # ATAPI floppy drives
device atapist # ATAPI tape drives
options ATA_STATIC_ID # Static device numbering
device ahc # AHA2940 and onboard AIC7xxx devices
options AHC_REG_PRETTY_PRINT # Print register bitfields in debug
# output. Adds ~128k to driver.
device ahd # AHA39320/29320 and onboard AIC79xx devices
options AHD_REG_PRETTY_PRINT # Print register bitfields in debug
# output. Adds ~215k to driver.
device scbus # SCSI bus (required for SCSI)
device ch # SCSI media changers
device da # Direct Access (disks)
device sa # Sequential Access (tape etc)
device cd # CD
device pass # Passthrough device (direct SCSI access)
device ses # SCSI Environmental Services (and SAF-TE)
device aac # Adaptec FSA RAID
device aacp # SCSI passthrough for aac (requires CAM)
device atkbdc # AT keyboard controller
device atkbd # AT keyboard
device psm # PS/2 mouse
device kbdmux # keyboard multiplexer
device vga # VGA video card driver
device splash # Splash screen and screen saver support
device sc
device agp # support several AGP chipsets
device cbb # cardbus (yenta) bridge
device pccard # PC Card (16-bit) bus
device cardbus # CardBus (32-bit) bus
device sio # 8250, 16[45]50 based serial ports
device uart # Generic UART driver
device ppc
device ppbus # Parallel port bus (required)
device lpt # Printer
device plip # TCP/IP over parallel
device ppi # Parallel port interface device
device em # Intel PRO/1000 Gigabit Ethernet Family
device loop # Network loopback
device random # Entropy device
device ether # Ethernet support
device sl # Kernel SLIP
device ppp # Kernel PPP
device tun # Packet tunnel.
device pty # Pseudo-ttys (telnet etc)
device md # Memory "disks"
device gif # IPv6 and IPv4 tunneling
device faith # IPv6-to-IPv4 relaying (translation)
device firmware # firmware assist module
device uhci # UHCI PCI->USB interface
device ohci # OHCI PCI->USB interface
device ehci # EHCI PCI->USB interface (USB 2.0)
device usb # USB Bus (required)
device ugen # Generic
device uhid # "Human Interface Devices"
device ukbd # Keyboard
device umass # Disks/Mass storage - Requires scbus and da
device ums # Mouse
>[оверквотинг удален]
>и не rebuilding. Имеем три сервера с абслоютно одинаковыми конфигами ядра,
>на всех серверах крутится исключительно glftpd. Мясяц работали без проблем, держали
>нагрузку под 500Мб/с каждый. Неделю назад два умерли с симптомами, описываемыми
>коллегогой, создавшим тему. В логах - ноль, железо проверено уже раз
>по пять, биосы обновлены и на мамке, и на контроллере. С
>памятью все в порядке тоже. Без нагрузки сервера живут. Стоит в
>glftpd дать нагрузку хотя бы 100Мб/с - умирают в течение часа-двух.
>Переустанавливал систему (7.1), пробовал ставить штатный ftpd вместо glftpd - тот
>же результат. Комрады, оч прошу помочь, если кому удалося данную траблу
>победить. Ситуация тупиковая.1) чето я не увидил сильной оптимизации в вашем ядре - куча ненужного оставлена
2) с generic как дела обстоят?
3) изначально автор говорит про САМБУ, а не фтп.
4) по NTFS траблу не пробовали воспроизвести? попробуйте - может это глюук фри а не фтп или самбы.
>[оверквотинг удален]
>и не rebuilding. Имеем три сервера с абслоютно одинаковыми конфигами ядра,
>на всех серверах крутится исключительно glftpd. Мясяц работали без проблем, держали
>нагрузку под 500Мб/с каждый. Неделю назад два умерли с симптомами, описываемыми
>коллегогой, создавшим тему. В логах - ноль, железо проверено уже раз
>по пять, биосы обновлены и на мамке, и на контроллере. С
>памятью все в порядке тоже. Без нагрузки сервера живут. Стоит в
>glftpd дать нагрузку хотя бы 100Мб/с - умирают в течение часа-двух.
>Переустанавливал систему (7.1), пробовал ставить штатный ftpd вместо glftpd - тот
>же результат. Комрады, оч прошу помочь, если кому удалося данную траблу
>победить. Ситуация тупиковая.Adaptec 5805 [firmware build: 16501]
сейчас столкнулся как раз с подобной траблой
данный контроллер у меня работает под FreeBSD 7.1 amd64, система грузится как раз с логического диска под RAID-10
проблема даёт о себе знать при чтении определенного файла с этого диска
этот файл нашел экспериментальным путем с помошью tar
в итоге виснет контроллер, в /var/log/messages сыплются сообщения ядра о том, что контроллер не отвечает на команды ядрапосле ряда экспериментов выяснилось, что:
- на FreeBSD для i386 и Linux для i386 - такой проблемы нет
- при использовании штатного aac-драйвера система не в состоянии вернуть в работу контроллер после зависания (FreeBSD 7.1 amd64), чего не скажешь о драйвере (aacu) с сайта производителяотзывы о работе данного контроллера под Linux amd64 по этой ссылке http://communities.vmware.com/message/975407
писал об этом в freebsd-рассылки: scsi@, hackers@
>[оверквотинг удален]
> - на FreeBSD для i386 и Linux для i386 - такой
>проблемы нет
> - при использовании штатного aac-драйвера система не в состоянии вернуть в
>работу контроллер после зависания (FreeBSD 7.1 amd64), чего не скажешь о
>драйвере (aacu) с сайта производителя
>
>отзывы о работе данного контроллера под Linux amd64 по этой ссылке http://communities.vmware.com/message/975407
>
>
>писал об этом в freebsd-рассылки: scsi@, hackers@ны дак у вендора дрова всегда свежее - если есть )
>Аналогичная ситуация. 7.1 с оптимизированным ядром. 2 Гига RAM, Xeon 2,2, Adaptec
>5805, два рейда 10 - один на 40 Гб под систему,
>другой на 3,5 ТБ - файловое хранилище. Рейды живые, не degraded
>и не rebuilding....
>Комрады, оч прошу помочь, если кому удалося данную траблу
>победить. Ситуация тупиковая.Винты какие используете? Случаем не 1 Тб сигейты?
В прошлом году имел сильно похожие проблемы с 5805 контроллером и сигейтами. Перепроверял под всеми доступными ОС - фря, фря64, солярка, винда в разных вариантах. Везде со временем было плохо - контроллер начинал зависать, файловые системы рушиться и т.д.
Совместно с саппортом нашего поставщика наконец то выяснили, что имеется несовместимость между адаптековскими контроллерами 5-ой серии и этой серией сигейтовских терабайтников (точно серию не помню, на адаптека надо поискать). В итоге заменили сигейты на хиттачи - с тех пор полет нормальный (сервер стоит под нагрузкой в качестве узла для резервного хранения данных).
>[оверквотинг удален]
>В прошлом году имел сильно похожие проблемы с 5805 контроллером и сигейтами.
>Перепроверял под всеми доступными ОС - фря, фря64, солярка, винда в
>разных вариантах. Везде со временем было плохо - контроллер начинал зависать,
>файловые системы рушиться и т.д.
>
>Совместно с саппортом нашего поставщика наконец то выяснили, что имеется несовместимость между
>адаптековскими контроллерами 5-ой серии и этой серией сигейтовских терабайтников (точно серию
>не помню, на адаптека надо поискать). В итоге заменили сигейты на
>хиттачи - с тех пор полет нормальный (сервер стоит под нагрузкой
>в качестве узла для резервного хранения данных).на сайте adaptec лежит документ с таблицами совместимости брендовых серверных шасси, жестких дисков, серверных материнских плат с их контроллерами
использую FUJITSU MAX3147RC
по совету коммиттеров aac проверял контроллер на системе установленной со снапшота 7.1-STABLE-200902-amd64 - проблем с зависанием не заметил
>на сайте adaptec лежит документ с таблицами совместимости брендовых серверных шасси, жестких
>дисков, серверных материнских плат с их контроллерамиhttp://www.adaptec.com/en-us/_common/compatibility
>использую FUJITSU MAX3147RC
>по совету коммиттеров aac проверял контроллер на системе установленной со снапшота 7.1-STABLE-200902-amd64
>- проблем с зависанием не заметилтогда не заметил
сейчас проблема опять вылезла
похоже, сам контроллер кривой (Adaptec 5805)
>[оверквотинг удален]
>сата винта сигейт 750гиг. На них система и стоит.
>При копировании на сервак по самбе (на тоже зеркало) больших объемов информации,
>через пол часа заливания система виснет намертво. Ни с консоли ничего
>нельзя сделать (нет реакции на клавиатуру, намлок не переключается), ни из
>сети нет пингов.
>Ядро штатное. Пробовал две разные севухи - 3сом905 и интел10/100, одно и
>тоже. Пробовал Отключать сетевые сервисы (firewall, dhcp) нет изменений.
>Вот вышла 7.1, буду пробовать обновить.
>Но может есть у кого-нибудь мысли как сбойный модуль или кусок ядра
>вычислить?У меня возникает настойчивое подозрение что хард сыпется.
gjournal юзаешь?
У меня была похожая ситуация. Не мог вычислить причины зависаний. Вырубил журнал - аптайм уже 300 суток.