Есть сервер с raid1 (или уже был? :( ) на ubuntu 10.04 (вообще не мой, настраивался не мной, а разгребать мне)
Там крутится контроллер домена на samba, ну и параллельно используется, как файловая помойка. До последнего выключения все вроде работало нормально. Сервер был выключен, перевезен в другое место. После включения теперь наблюдается такая картина:http://s019.radikal.ru/i626/1604/55/0278fc15fae3.jpg
http://s017.radikal.ru/i428/1604/48/0cfff88991e6.jpg
http://s019.radikal.ru/i604/1604/f2/762b33983b52.jpg
http://s020.radikal.ru/i705/1604/17/a60f5314617c.jpg
http://s019.radikal.ru/i644/1604/6f/36e11ef678fd.jpgСам по себе компьютер пингуется, по ssh доступа нет, сетевые ресурсы не доступы.
Что вообще происходит и что с этим делать?
> Есть сервер с raid1 (или уже был? :( ) на ubuntu 10.04
> (вообще не мой, настраивался не мной, а разгребать мне)
> Там крутится контроллер домена на samba, ну и параллельно используется, как файловая
> помойка. До последнего выключения все вроде работало нормально. Сервер был выключен,
> перевезен в другое место. После включения теперь наблюдается такая картина:перевозили в люльке мотоцикла?
> http://s019.radikal.ru/i626/1604/55/0278fc15fae3.jpg
> http://s017.radikal.ru/i428/1604/48/0cfff88991e6.jpg
> http://s019.radikal.ru/i604/1604/f2/762b33983b52.jpg
> http://s020.radikal.ru/i705/1604/17/a60f5314617c.jpg
> http://s019.radikal.ru/i644/1604/6f/36e11ef678fd.jpg
> Сам по себе компьютер пингуется, по ssh доступа нет, сетевые ресурсы не
> доступы.
> Что вообще происходит и что с этим делать?все ж в логах - сплошные дисковые ошибки, ошибки I/O
ps. при перевозке, диски явно не вытаскивали... его, сервер, случаем не
бросали как мешки с картошкой при выгрузке?
> ps. при перевозке, диски явно не вытаскивали... его, сервер, случаем не
> бросали как мешки с картошкой при выгрузке?Понятия не имею, говорят, что якобы аккуратно. Диски да, не вытаскивали (сервер десктопного вида, не рэковый). Перевозили в рамках одного большого здания, чуть ли не в самой стойке на колесиках....
> все ж в логах - сплошные дисковые ошибки, ошибки I/O
да я в основном сетевик, циски всякие и т.п., этим линуксом занимаюсь по стольку, посколько просто больше некому, и чего делать с этими дисковыми ошибками не особо представляю. :( Банально кабели sata я перетыкал, думал может чего отошло где. Еще этот raid усложняет ситуацию вместе с легшим pdc, рассшаренные сетевые ресурсы даже на других компах этого домена не доступны....
Чего делать то? Вынимать по диску и проверять отдельно софтиной какой-нибудь, типа mhdd?
> Чего делать то?Достать диск и отправить в утиль. Купить в магазине новый. А еще - затребовать сумму убытков с того, кто перевозил сервер. Вариации на тему восстановления данных с разбитых hdd зависят от важности данных и давности бэкапа.
> Чего делать то? Вынимать по диску и проверять отдельно софтиной какой-нибудь, типа
> mhdd?Жалуется только на sda (пока?), так что может и обойдётся.
Если данные важные, то возьми другой компьютер (или загрузись с LiveCD вроде Slax)
1. вытащи оба sda и sdb из сервера
2. возьми новую пару таких же (или побольше) дисков
3. сделай побайтовую копию (dd if=/dev/sda of=/dev/sdh conv=noerror,sync) обоих
4. оригиналы отложи и не трогай. Если не справишься сам, отдашь их спецу
5. подключи копииЕсли не взлетит сразу, то ищи спеца или кури маны от mdraid до просветления.
>[оверквотинг удален]
> Если данные важные, то возьми другой компьютер (или загрузись с LiveCD вроде
> Slax)
> 1. вытащи оба sda и sdb из сервера
> 2. возьми новую пару таких же (или побольше) дисков
> 3. сделай побайтовую копию (dd if=/dev/sda of=/dev/sdh conv=noerror,sync) обоих
> 4. оригиналы отложи и не трогай. Если не справишься сам,
> отдашь их спецу
> 5. подключи копии
> Если не взлетит сразу, то ищи спеца или кури маны от mdraid
> до просветления.С 1-м новым диском, вместо sda, эту операцию, я так понимаю, выполнять не стоит?
Если на sdb пока ошибок нет, то лучше сделать одну копию с него, загрузиться с копии, средствами мдадм добавить новый диск в рейд и отребилдить.
В общем, попал мне этот сервак непосредственно в руки.
Там 3 диска. Один диск просто прицеплен к материнке (S3000AH), а два других в зеркале через аппаратный контроллер Intel SRCS16. Рэйдовые диски не трогал, а вот первый диск вытащил, судя по содержимому (директории /etc, /usr и т.п.), диск системный (хотя в биосе в качестве загрузочного стоит почему-то рэйд). Диск на другому компе проверил с флэшки через victoria в баттерфляй-режиме и c раcширенным remap'ом. Софтинка нашла только один проблемный сектор и успешно отремапила его, т.е. диск, сам по себе, вроде как живой. Воткнул этот диск вместо sata1 в sata0 на материнки, вместо ругани на ata2 (2-ое фото), стало ругаться на ata1, т.е. ругается именно на него.
Может после того выключения блок-питания тупо накрылся и не дает нормально запиться этому диску?? Могут быть такие ошибки от этого?
а да, в рэйдовской консольной утилите эти 2 диска online, а сам рэйд1 в режиме optimal
То, что сбойный сектор успешно отремапился, не значит, что информация оттуда перезаписалась.
Просто диск теперь при обращении к этому адресу будет позиционировать головку на другой сектор.
>[оверквотинг удален]
> трогал, а вот первый диск вытащил, судя по содержимому (директории /etc,
> /usr и т.п.), диск системный (хотя в биосе в качестве загрузочного
> стоит почему-то рэйд). Диск на другому компе проверил с флэшки через
> victoria в баттерфляй-режиме и c раcширенным remap'ом. Софтинка нашла только один
> проблемный сектор и успешно отремапила его, т.е. диск, сам по себе,
> вроде как живой. Воткнул этот диск вместо sata1 в sata0 на
> материнки, вместо ругани на ata2 (2-ое фото), стало ругаться на ata1,
> т.е. ругается именно на него.
> Может после того выключения блок-питания тупо накрылся и не дает нормально запиться
> этому диску?? Могут быть такие ошибки от этого?поплывший диск в сервере - это уже нонсенс.
victoria - только для того чтобы была уверенная возможность скопировать диск
на новый для замены.блоки питания на серверах обычно качественные, проверить просто, поставьте
вместо сбойного новый и запустите dd на read с блоком 1M, если все Ok,
дело не в БП.# dd if=/dev/sdX of=/dev/null bs=1M
только ставьте заведомо хороший диск без сбоев, можно загрузиться с livecd/usb,
установить smartmontools, посмотреть SMART на всех трех дискам, затем два
теста: smartctl short и long
> только ставьте заведомо хороший диск без сбоев, можно загрузиться с livecd/usb,
> установить smartmontools, посмотреть SMART на всех трех дискам, затем два
> теста: smartctl short и longДыщащие на ладан диски после очередного теста могут умереть окончательно.
Диск надо менять, а не насиловать почти труп.
>> только ставьте заведомо хороший диск без сбоев, можно загрузиться с livecd/usb,
>> установить smartmontools, посмотреть SMART на всех трех дискам, затем два
>> теста: smartctl short и long
> Дыщащие на ладан диски после очередного теста могут умереть окончательно.
> Диск надо менять, а не насиловать почти труп.спасибо, учту
DF>> Диск надо менять, а не насиловать почти труп.
Lavr> спасибо, учтуLavr - снимаю шляпу!
Я бы не выдержал и послал куда нить на ЮХ _явно_ :)