Понедельник, блин... Почтовый резервный сервер (хорошо, что резервный) утром взял и завис, только на клавиатуре мигали раз в секунду Caps и Scroll Lock. Ребутнул. И приехали.failed to read image.
Booting CentOS (2.6.32-573.3.1.el6.x86_64) in 0 seconds...
Error 17: Cannot mount selected partitionБыл настроен soft raid, зеркало.
Вхожу в консоль
grub> find (hd0, жму таб
partition num 0 ... Filesystem type ext2fs, partition type 0xfd
partition num 1 ... Filesystem type unknown, partition type 0xfdА дальше я что-то не соображу, что делать. Помогите советом, плиз. Не хочу брать и сносить все. Хочется понять, что там произошло.
Да, cat (hd0,0)/grub/grub.conf выполняет, выводит на экран. Так что может еше не все потеряно...
grub> kernel /vmli [tab]
grub> initrd /init [tab]
grub> bootdracut: FATAL: No or empty root= argument
dracut: Refusing to continuedracut Warning: Signal caught!
...
> dracut: FATAL: No or empty root= argument
> dracut: Refusing to continueПомочь с переводом или сам справишься?
>> dracut: FATAL: No or empty root= argument
>> dracut: Refusing to continue
> Помочь с переводом или сам справишься?Несмотря на вашу обычную грубость, немного с другой стороны взглянул на проблему и удалось запустить систему.
> на вашу обычную грубость, немного с другой стороны взглянулВот так и дальше смотри на вещи, с немного другой стороны.
> Вот так и дальше смотри на вещи, с немного другой стороны.Для этого я и задаю вопросы здесь, если честно.
загрузится с live cd и посмотреть состояние дисков. определяются ли диски.
> #cat /proc/mdstatPersonalities : [raid1]
md0 : active raid1 sdc1[1] sda1[0]
511936 blocks super 1.0 [2/2] [UU]md2 : active raid1 sdb1[0] sdd1[1]
976629568 blocks super 1.1 [2/2] [UU]
bitmap: 0/8 pages [0KB], 65536KB chunkmd1 : active raid1 sda2[0] sdc2[1]
487742272 blocks super 1.1 [2/2] [UU]
bitmap: 2/4 pages [8KB], 65536KB chunkunused devices: <none>
*******
Такс, все, разобрался. Т.е. не до конца пока, но загрузил сервер.
В grub стояло
root (hd1,0)
kernel /vmlinuz...
initrd /initramfs-...Заменил 'root (hd1,0)' на 'root (hd0,0)' и загрузилось все.
Вопрос: о чем это говорит? О неисправности диска или о чем-то другом?
> Вопрос: о чем это говорит? О неисправности диска или о чем-то другом?О чем-то другом. Разбирайтесь дальше с пониманием процесса загрузки, как он происходит.
>> Вопрос: о чем это говорит? О неисправности диска или о чем-то другом?
> О чем-то другом. Разбирайтесь дальше с пониманием процесса загрузки, как он происходит.cat /boot/grub2/device.map
>>> Вопрос: о чем это говорит? О неисправности диска или о чем-то другом?
>> О чем-то другом. Разбирайтесь дальше с пониманием процесса загрузки, как он происходит.
> cat /boot/grub2/device.mapВ моем случае /boot/grub/device.map:
(hd1) /dev/sda
(hd0) /dev/sdc
>>>> Вопрос: о чем это говорит? О неисправности диска или о чем-то другом?
>>> О чем-то другом. Разбирайтесь дальше с пониманием процесса загрузки, как он происходит.
>> cat /boot/grub2/device.map
> В моем случае /boot/grub/device.map:
> (hd1) /dev/sda
> (hd0) /dev/sdcВ процессе загрузки загрузчик руководствуется значениями hdX, которые вшиты в его конфигурацию. Используя это значение, он загружает остальные свои модули и ядро+инитрд.
>Заменил 'root (hd1,0)' на 'root (hd0,0)' и загрузилось все.
В частности, в вашей системе это нулевой раздел нулевого диска (считаем с нуля).
>Personalities : [raid1]
>md0 : active raid1 sdc1[1] sda1[0]
> 511936 blocks super 1.0 [2/2] [UU]Зеркало ФС, на которой находятся файлы (та фс, где лежит /boot) у вас находится на дисках sda и sdc.
При загрузке биос /вероятнее всего/ отдаст эти диски как диски hd0 и hd2.
PS> device.map лежит там же, где и ядро и модули, и на этом этапе еще не доступен, т.к. чтобы его найти, надо знать где его искать, а если знать где искать - то он не нужен. Информация из device.map в этом случае используется только при построении grub.cfg.
Также при загрузке используется признак "загрузочности" раздела (fdisk, команда a), ну и не только, если это например не DOS-таблица разметки, а GPT.
Ого!/к вопросу о bios/ Вообще, за несколько дней до этого события был сбой питания, ups тянул, но не отработал корректное завершение работы. После этого было что-то вроде press f1 to setup, f2 to default bios setup или как-то так. Стандартная штука для десктопных компов. После этого система загрузилась без шаманств. Все было ок. Проверил, в сети видна, по ssh зашел. Ошибок не заметил. И оставил на выходные.
Ок. Сейчас мне нечего добавить или спросить. Осилю ваш комментарий, возможно еще будет повод спросить. Спасибо.
> Ок. Сейчас мне нечего добавить или спросить. Осилю ваш комментарий, возможно еще
> будет повод спросить. Спасибо.Есть. Дефект. Диска. На /dev/sdc. Почти вначале диска. По-крайней мере ясно, откуда ветер дует. А жаль. Резервный же комп все же, нагрузки мало, нет почти ее. И диски вроде неплохие, WD5003ABYX.
> Есть. Дефект. Диска. На /dev/sdc. Почти вначале диска. По-крайней мере ясно, откуда
> ветер дует. А жаль. Резервный же комп все же, нагрузки мало,
> нет почти ее. И диски вроде неплохие, WD5003ABYX.ну а пока система загрузилась и работает, то есть смысл по быстрее позаботится о замене дефектного диска
>> Ок. Сейчас мне нечего добавить или спросить. Осилю ваш комментарий, возможно еще
>> будет повод спросить. Спасибо.
> Есть. Дефект. Диска. На /dev/sdc. Почти вначале диска. По-крайней мере ясно, откуда
> ветер дует. А жаль. Резервный же комп все же, нагрузки мало,
> нет почти ее. И диски вроде неплохие, WD5003ABYX.Smartctl смотрите регулярно.
> Smartctl смотрите регулярно.И smartd до кучи в качестве службы.
>> Smartctl смотрите регулярно.
> И smartd до кучи в качестве службы.Спасибо. Буду, конечно. Но диск менять надо, в любом случае. Т.к. такого же найти не могу, то можно ли заменить один диск на аналогичный по емкости, но другой, возможно, другого производителя? Или это должно привести к проблемам?
> Спасибо. Буду, конечно. Но диск менять надо, в любом случае. Т.к. такого
> же найти не могу, то можно ли заменить один диск на
> аналогичный по емкости, но другой, возможно, другого производителя? Или это должно
> привести к проблемам?Вряд ли возникнут какие-то проблемы. Если равный (или бОльший) по емкости. Лишь бы не меньший.
Я тут подумал, что не заменить ли (раз уж один все равно на замену) диски на ssd... Почтовая база около 150 Гб плюс система. Например, взять два диска по 300 Гб в raid1. Не додумался только я проверить сегодня на рабочем сервере нагрузку на диск во время работы в офисном темпе (когда все в почте по ушки). Надо бы завтра проверить.Идея: в рабочее время на почтовом сервере надо проверить, насколько сильно нагружены диски массива, где храниться почта (не архив, а основная рабочая почта).
Такой вариант даст представление о загрузке:
iostat -x /dev/sda /dev/sdcНапример, сейчас никого почти нет на работе. Если быстро в почтовой программе открывать новые большие письма, то вот что выходит:
avg-cpu: %user %nice %system %iowait %steal %idle
14.05 0.00 3.44 0.61 0.00 81.90Device: rrqm/s wrqm/s r/s w/s rMB/s wMB/s avgrq-sz avgqu-sz await svctm %util
sda 0.40 0.00 62.40 0.20 7.65 0.00 250.44 0.10 1.60 1.45 9.08
sdb 0.00 0.00 0.60 0.20 0.07 0.00 168.75 0.01 13.50 13.50 1.08
Это я один создаю. 7.65 Мбайт/сек на чтение это же не много.Что вы используете когда надо понять, нужна ли более производительная дисковая подсистема? Какие критерии - много/мало/перебор/срочно заменять/постоит 100 лет ?
По этому вопросу (производит. дисков) отбой. Нашел где почитать.
> Вряд ли возникнут какие-то проблемы. Если равный (или бОльший) по емкости.
> Лишь бы не меньший.Наконец пришли диски SSD 512 Гб (текущие 500 Гб SATA). Буду заменять не только сбойный, но и первый, который норм. Есть ли тонкости с заменой SATA на SSD в массиве?
>> Вряд ли возникнут какие-то проблемы. Если равный (или бОльший) по емкости.
>> Лишь бы не меньший.
> Наконец пришли диски SSD 512 Гб (текущие 500 Гб SATA). Буду заменять
> не только сбойный, но и первый, который норм. Есть ли тонкости
> с заменой SATA на SSD в массиве?SSD SLC? MLC? Trim? есть ньюансы...
Замена прошла полностью, фуф. С MBR/GPT были проблемы, сейчас все ок. Тьфу-тьфу... Загружает и с одного и со второго диска, и с двумя, само собой.> SSD SLC? MLC? Trim? есть ньюансы...
Диски в raid1 сейчас 2х Samsung 850 Pro 512 Gb.
Как-то можно в dmesg или еще где определить, что что-то не то в плане замены дисков?
> Замена прошла полностью, фуф. С MBR/GPT были проблемы, сейчас все ок. Тьфу-тьфу...
> Загружает и с одного и со второго диска, и с двумя,
> само собой.
>> SSD SLC? MLC? Trim? есть ньюансы...
> Диски в raid1 сейчас 2х Samsung 850 Pro 512 Gb.
> Как-то можно в dmesg или еще где определить, что что-то не то
> в плане замены дисков?если работает, то все в порядке, вот только намек был на другое:
- MLC
- MLC в рейд
- Trim в рейде
- align
> - MLC
> - MLC в рейд
> - Trim в рейде
> - alignСпасибо, читаю http://habrahabr.ru/post/242199/. Там как раз у чела мои диски :)
> - MLC
> - MLC в рейд
> - Trim в рейде
> - alignmdadm в CentOS TRIM поддерживает (https://access.redhat.com/documentation/en-US/Red_Hat_Enterp.../).
Вообще, спасибо большое за наводку.
> Понедельник, блин... Почтовый резервный сервер (хорошо, что резервный) утром взял и завис,
> только на клавиатуре мигали раз в секунду Caps и Scroll Lock.
> Ребутнул. И приехали.Просто при создании софт-рейда загрузчик grub нужно ставить на оба диска и если диск из рейда заменяется, то нужно на новый снова grub-install делать.
А ну и ещё в 6 и 7 версии центухи разные версии grub