ищу способ как упросить mdadm быть более детальным в причинах падений: время от времени массивы RAID5[6] sync'd (иногда раз в месяц, иногда несколько раз в день, независимо от нагрузки), и я не вижу почему. Проверял/менял PSU/MB/memory/cables; ничего подозрительного в smartctl/dmesg/messages; просто mdadm вдруг решил sync:md: using maximum available idle IO bandwidth (but not more than 200000 KB/sec) for reconstruction.
md: using 128k window, over a total of 341806848 blocks.
RAID5 conf printout:
--- rd:4 wd:4 fd:0
disk 0, o:1, dev:sda5
disk 1, o:1, dev:sdb5
disk 2, o:1, dev:sdc5
disk 3, o:1, dev:sdd5система:
CentOS release 5.5 (Final) Linux 2.6.18-164.11.1.el5 #1 SMP Wed Jan 20 07:32:21 EST 2010 x86_64 x86_64 x86_64 GNU/LinuxСпасибо!
/etc/cron.weekly/99-raid-check
Тоже самое было у нас
Многое чего делали, решилось после замены одного из дисков
видать в какие-то моменты вылетали ошибки на винте, но смарт ничего не видел
>>видать в какие-то моменты вылетали ошибки на винте, но смарт ничего не виделМне хотелось бы заставить mdadm рассказать почему он sync (например, некоторые программы могут быть запущены с -v или ещё лучшее -vvv; при этом в случае проблем меня не просто грубо посылают, но рассказивают почему и куда). Например, может-ли mdadm сказать что некий диск /dev/sdp поимел "Medium Error" или "auto reallocate failed" и это вынудило mdadm пойти в sync; при этом мне не надо гадать какой из bay/cable/disk/controller пораждает сии проблемы?
>>>видать в какие-то моменты вылетали ошибки на винте, но смарт ничего не видел
> Мне хотелось бы заставить mdadm рассказать почему он sync (например, некоторые программы
> могут быть запущены с -v или ещё лучшее -vvv; при этом
> в случае проблем меня не просто грубо посылают, но рассказивают почему
> и куда). Например, может-ли mdadm сказать что некий диск /dev/sdp поимел
> "Medium Error" или "auto reallocate failed" и это вынудило
> mdadm пойти в sync; при этом мне не надо гадать какой
> из bay/cable/disk/controller пораждает сии проблемы?ИМХО "mdadm" никогда сам не возвращает откинутый диск. Все сообщения пишутся в лог, и там должны бы и находиться.