Приветствую!
Система на софтверном RAID1.
Есть сбойный винт sdb - он полностью отключен (--fail & --remove).
В биосе стоит загрузка с sda-винта, но при вынимании sdb из кармана система не грузится вообще - постоянно ребутается когда доходит до загрузки. Если возвращаю сбойный винт обратно - грузится и работает с первого нормально.Добавил новый винт (который принес на замену сбойному) на место sdb, сбойный поставил третим sdc - ситуация такая же: два нормальных самостоятельно не грузится; вместе с третим (сбойным) - грузится.
Загружаюсь с тремя винтами. С sdb (новым) делаю все монипуляции по замене (sfdisk & --add) - начинает синхронизироваться... Попутно делаю grub-install --recheck /dev/sdb Ругается на лишний винт (superfluous RAID member), но ставится нормально.
Винт не досинхонизировался (долгое дело), хочу забрать сбойный sdc - перегружаюсь - grub ругается на лишний рейд-винт и выпадает в rescue mode (тут загрузиться че-то не получилось). Пришлось отключить новый, вернуть сбойный и загрузиться.
Подскажите где залип сбойный винт?
Видимо нужно че-то обновить чтобы груб про него забыл или mdadm как-то не правльно винт выкинул и md0 продолжает к нему обращаться. Что делать уже не понимаю.
Голова кипит, а сервер боевой долго валяться не может пока я буду его ребутать для проверки.---
Делалось:
grub-mkdevicemap - /boot/grub/device.map обновляется нормально
update-grub2 - на всякий случай обновить конфиг
grub-install --recheck /dev/sda - чтобы переставить загрузчик на винт с котого гружусь---
root@host> cat /proc/mdstat
Personalities : [raid1]
md1 : active (auto-read-only) raid1 sda5[2]
7925748 blocks super 1.2 [2/1] [_U]
md0 : active raid1 sda1[2]
952672120 blocks super 1.2 [2/1] [_U]
unused devices: <none>md1 - это своп.
root@host> mdadm --detail /dev/md0
/dev/md0:
Version : 1.2
Creation Time : Mon Jul 22 19:45:59 2013
Raid Level : raid1
Array Size : 952672120 (908.54 GiB 975.54 GB)
Used Dev Size : 952672120 (908.54 GiB 975.54 GB)
Raid Devices : 2
Total Devices : 1
Persistence : Superblock is persistentUpdate Time : Sat Nov 23 14:18:19 2013
State : clean, degraded
Active Devices : 1
Working Devices : 1
Failed Devices : 0
Spare Devices : 0Name : host11:0
UUID : 823575b0:17598515:79d6e0ea:9da2db7b
Events : 6892286Number Major Minor RaidDevice State
0 0 0 0 removed
2 8 1 1 active sync /dev/sda1Grub грузит это:
linux /boot/vmlinuz-2.6.32-5-amd64 root=UUID=db7867fc-4468-44c2-8e04-a660c35e449f ro quietroot@host> blkid | grep a660c35e449f
/dev/md0: UUID="db7867fc-4468-44c2-8e04-a660c35e449f" TYPE="ext4"root@host> cat /etc/fstab | grep a660c35e449f
UUID=db7867fc-4468-44c2-8e04-a660c35e449f / ext4 errors=remount-ro,usrquota,grpquota,noatime,nodiratime,data=writeback 0 1В /boot/grub/* и /etc/mdadm/* нигде упоминания сбойного винта не нашел.
При отключенном sdb:root@host> cat /proc/mdstat
Personalities : [raid1]
md1 : active raid1 sda5[2]
7925748 blocks super 1.2 [2/1] [_U]
md0 : active raid1 sda1[2]
952672120 blocks super 1.2 [2/1] [_U]
unused devices: <none>
root@host> mdadm -Q --examine /dev/sdb1
/dev/sdb1:
Magic : a92b4efc
Version : 1.2
Feature Map : 0x0
Array UUID : 823575b0:17598515:79d6e0ea:9da2db7b
Name : host11:0
Creation Time : Mon Jul 22 19:45:59 2013
Raid Level : raid1
Raid Devices : 2Avail Dev Size : 1905344512 (908.54 GiB 975.54 GB)
Array Size : 1905344240 (908.54 GiB 975.54 GB)
Used Dev Size : 1905344240 (908.54 GiB 975.54 GB)
Data Offset : 2048 sectors
Super Offset : 8 sectors
State : active
Device UUID : 76a2fdcd:9880cbf8:84fc5fea:775fd073Update Time : Wed Nov 20 20:59:49 2013
Checksum : 26c5daf1 - correct
Events : 6386799
Device Role : Active device 0
Array State : AA ('A' == active, '.' == missing)Смущает то, что у всех остальных разделов "State : clean", а у отключенного "active".
На другой машине (полностью в порядке) у всех разделов "clean"...Это нормально???
Читал, что значит, но ответа на свой вопрос не понял:
active
fully active: IO and resync can be happening.
When written to inactive array, starts with resync