The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

форумы  помощь  поиск  регистрация  майллист  вход/выход  слежка  RSS
"ext3 -- сплошное разочарование"
Вариант для распечатки  
Пред. тема | След. тема 
Форумы OpenNET: Виртуальная конференция (Public)
Изначальное сообщение [ Отслеживать ]

"ext3 -- сплошное разочарование"  
Сообщение от utandr email(ok) on 27-Июн-08, 07:48 
Здравствуйте!


Стояла себе, работала машинка.

/usr -- одна партиция, /usr/local -- другая партиция (на одном винте).

Заканчивается электропитание в здании, потом в ИБП. Машинка отключается.
После загрузки жалуется на проблемы с ФС /usr/ (/dev/sda3) и не может восстановиться.

Монтируется только в режиме read only.

Не то, чтобы я хотел вызвать спор между ntfs и ext3, но вспомнить, чтобы хотя бы один раз на какой-нибудь машине под Windows + NTFS было что-то подобное не могу. Читаю всякие маны, и вот узнаю, что "не плохо бы регулярно копировать образ партиций по расписанию..", типа на всякий случай.. (?!).

Дело в том, что /usr -- это же не какой-нибудь /var или /home, туда вообще ничего не пишется. А тут при монтировании какие-то проблемы.

Может, это я идиот? Может, есть какие-нибудь волшебные ключики fsck.ext3, которые бы восстановили самостоятельно весь раздел?
Или, может быть, есть что-нибудь еще замечательно, что восстановило бы все без "восстановлений inode путем debugfs при таких-то условиях"?

Высказать мнение | Ответить | Правка | Cообщить модератору

 Оглавление

Сообщения по теме [Сортировка по времени | RSS]


1. "ext3 -- сплошное разочарование"  
Сообщение от angra (ok) on 27-Июн-08, 08:07 
>Может, это я идиот?

Заметьте, не я это сказал :)

Вот у меня ни разу не было неисправимых проблем с ext3, даже при сбоях питания. После сбоя fsck иногда находил несколько orphaned inode, оставшихся от временных или удаленных файлов, и прекрасно сам их фиксил.
Зато несколько раз видел смерть(причем полную, никакие chkdisk не спасали) ntfs без всяких сбоев питания, более того, после корректного завершения работы.
И что это доказывает? Ровным счетом ничего, у каждого личный опыт с fs и к объективности отношения он не имеет. А бэкап всегда нужен, причем на другой носитель, ведь в один "прекрасный" день может умереть винчестер или даже raid и не будет никакой разницы что за fs там стояла.

Насчет ключиков, попробуйте -y или -p. Однако при серьезном сбое их действительно может не хватить.

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

2. "ext3 -- сплошное разочарование"  
Сообщение от utandr email(ok) on 27-Июн-08, 08:26 
>Может, это я идиот?
>Заметьте, не я это сказал :)

Ангра, Вы удержаться не смогли.. Понятное дело :)

>Насчет ключиков, попробуйте -y или -p. Однако при серьезном сбое их действительно
>может не хватить.

Их, конечно, и не хватает.

Вот 350 компьютеров под разными компьютерами с NTFS -- и ни одного сбоя. А тут -- бац, и есть сбои после отключения электропитания (хотя не виртуальных серверов под Linux всего 2 -- один, действительно, живет уже вот лет 5 без какого-либо мониторинга).


Странное дело: я подключаю упавший раздел в ro, копирую с него файлы на другую партицию другого жесткого диска, и получаю ошибки fsck уже на нем. Это, вообще, как такое может быть?

В качестве копирования использовал cp -r /usr/* /home/_backup/usr

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

10. "ext3 -- сплошное разочарование"  
Сообщение от Gennadi (??) on 27-Июн-08, 15:31 
>
>В качестве копирования использовал cp -r /usr/* /home/_backup/usr

Ну, что ж вы такое делаете? Вы же таким копированием все права на файлы изменяете!!!

Лучше так:

cp -a /usr /home/_backup

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

3. "НЕПОДКЛЮЧЕННЫЙ SWAP??"  
Сообщение от utandr email(ok) on 27-Июн-08, 09:27 
Узнал, что в fsck "segmentation fault" возникает при неподключенном swap'е (?!)
http://www.monkey.org/openbsd/archive/misc/0107/msg00056.html

Кажется, раньше в /etc/fstab было что-то вроде uuid=.... для какого-то раздела (может, как раз свопа). Я его удалил ранее (в смысле, запись об uuid, но "обычную" запись о свопе оставил, и её вижу).


Никто не может объяснить, как быть? :)

Ведь swap подключается самым последним из разделов.

Сейчас в repair filesystem делаю:
swapon /dev/sda8 (у меня тут swap)
fsck.ext3 /dev/sdb3 (странная партиция, которая не подключается)

Но, все-равно, segmentation fault..

Учитывая, что упала резервная партиция (т.е. упал, по сути, бэкап),
я легко отделался, и заново пересоздал партицию mkfs.ext3 /dev/sdb3, но уже записав, где хранятся суперблоки.

И все-таки, это просто полная мудосрань за момент отключения электричества в _журналируемой системе_ без _физических проблем_ жесткого диска лечь партиции до такого уровня, что нужно было все переделывать.


Вопросы:
1. Как избежать проблем с винтом при отключении электропитания (может быть всякое, и ИБП не спасут. В конце-концов, при отключении света файловая система не должна терять целостности, могут не записываться изменения в файлах, но _целостность_ из-за электричества??). Кстати, упала партиция, на которую 100% ничего не писалось в тот момент времени.
2. Как загружаться, даже если возникают ошибки на каком-нибудь из разделов (например, плевать я хотел на проблемы в резервных винтах: все основное выжило, и слава Богу, загрузись и дай ssh доступ к машине)?
3. Как создавать на лету образ жесткого диска целиком, вместе с партициями на нем, на другой жесткий диск (т.е. как "на лету" копировать винт целиком)?

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

4. "НЕПОДКЛЮЧЕННЫЙ SWAP??"  
Сообщение от angra (ok) on 27-Июн-08, 10:24 
>Узнал, что в fsck "segmentation fault" возникает при неподключенном swap'е (?!)
>http://www.monkey.org/openbsd/archive/misc/0107/msg00056.html

В том топике скорее от недостатка виртуальной памяти. У меня есть машина вообще без swap и никаких сегфолтов

>И все-таки, это просто полная мудосрань за момент отключения электричества в _журналируемой
>системе_ без _физических проблем_ жесткого диска лечь партиции до такого уровня,
>что нужно было все переделывать.

Согласен. Но опять таки я видел смерть ntfs после корректного завершения работы, согласитесь это куда большая "мудосрань".
На всякий случай проверьте на бэды и прогоните тест смарта.


>1. Как избежать проблем с винтом при отключении электропитания (может быть всякое,
>и ИБП не спасут. В конце-концов, при отключении света файловая система
>не должна терять целостности, могут не записываться изменения в файлах, но
>_целостность_ из-за электричества??). Кстати, упала партиция, на которую 100% ничего не
>писалось в тот момент времени.

Можно держать раздел в read-only, если это бэкап. Вот только в первом посте вы говорили про /usr, хотя и его при желании можно перевести в ro
>2. Как загружаться, даже если возникают ошибки на каком-нибудь из разделов (например,
>плевать я хотел на проблемы в резервных винтах: все основное выжило,
>и слава Богу, загрузись и дай ssh доступ к машине)?

Скопировать все необходимое на рутовый раздел. Например для ssh надо временно отмонтировать /usr предварительно скопировав все необходимые для работы ssh бинари и либы. Затем переместить их в каталог /usr, сохранив структуру. В результате в случае сбоя будут использоваться файлы с /, а если сбоя не произойдет то монтирование перекроет /usr. Список необходимых файлов можно узнать у пакетного менеджера и написать небольшой скрипт для их копирования.
>3. Как создавать на лету образ жесткого диска целиком, вместе с партициями
>на нем, на другой жесткий диск (т.е. как "на лету" копировать
>винт целиком)?

На лету(смонтированные в rw разделы) наверное не стоит, может фигня получится. А так вообще dd или partimage в зависимости от цели. Для бекапа/переноса лучше последнее.


Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

5. "НЕПОДКЛЮЧЕННЫЙ SWAP??"  
Сообщение от aistpsk (??) on 27-Июн-08, 13:28 
может озу просто глючит ?
Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

6. "НЕПОДКЛЮЧЕННЫЙ SWAP??"  
Сообщение от Utandr email(ok) on 27-Июн-08, 13:35 
>может озу просто глючит ?

Очень интересная версия, о таком не думал.
Только не понятно, как связано с отключением электропитания.

Я выяснил, у меня по итогам упал /usr (он был резервным). И, я думал, хрен с ним, что так.
Скопировал с настоящего /usr, но система перестала загружаться. проверка логов показала, что файла на основном /usr тоже битые (fsck -f показывает, что файловая система в прекрасном состоянии). Везде ext3...:(

Оснований валить на винт у меня нет (хотя еще детально посмотрю).
Кстати, как читать s.m.a.r.t. HDD из-под Linux kernel 2.6.x?
Как лучше тестить hdd? Можно ли это делать "на лету" (работает система год, потом стали появляться ошибки, чтобы о них узнавать еще до падения)?

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

11. "НЕПОДКЛЮЧЕННЫЙ SWAP??"  
Сообщение от Gennadi (??) on 27-Июн-08, 15:41 
>[оверквотинг удален]
>
>Очень интересная версия, о таком не думал.
>Только не понятно, как связано с отключением электропитания.
>
>Я выяснил, у меня по итогам упал /usr (он был резервным). И,
>я думал, хрен с ним, что так.
>Скопировал с настоящего /usr, но система перестала загружаться. проверка логов показала, что
>файла на основном /usr тоже битые (fsck -f показывает, что файловая
>система в прекрасном состоянии). Везде ext3...:(
>

Вот-вот "Скопировал".... и все права на файлы поменялись на root:root! Это же не винда...

man cp

-a, --archive
     same as -dpR

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

12. "НЕПОДКЛЮЧЕННЫЙ SWAP??"  
Сообщение от Utandr email(ok) on 27-Июн-08, 16:09 
Здравствуйте!

А, не, чукча умный, чукча харашо капиравал.

Только файлы битые оказались, однако -- в теле файлов были всякие посторонные символы, однако..

>[оверквотинг удален]
>>система в прекрасном состоянии). Везде ext3...:(
>>
>
>Вот-вот "Скопировал".... и все права на файлы поменялись на root:root! Это же
>не винда...
>
>man cp
>
> -a, --archive
>     same as -dpR

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

7. "reboot error --- umount /dev/sda3: device busy"  
Сообщение от Utandr email(ok) on 27-Июн-08, 13:41 
Уважаемый Олл и Ангра в частности!

Во время перезагрузки встречаю такое: umount /dev/sda3: device busy

О чем бы это могло говорить?..

В однопользовательском режиме отмонтировать партицию тоже не получается (монтируется нормально, но не демонтируется).

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

8. "reboot error --- umount /dev/sda3: device busy"  
Сообщение от zlogr (ok) on 27-Июн-08, 13:55 
>Уважаемый Олл и Ангра в частности!
>
>Во время перезагрузки встречаю такое: umount /dev/sda3: device busy
>
>О чем бы это могло говорить?..
>
>В однопользовательском режиме отмонтировать партицию тоже не получается (монтируется нормально, но не
>демонтируется).

man fuser
fuser -amv /dev/sda3

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

9. "reboot error --- umount /dev/sda3: device busy"  
Сообщение от aistpsk (??) on 27-Июн-08, 14:17 
smartctl --all -d ata /dev/sda
smartctl --all /dev/hda
ошибки работы с диском смотри в /var/log/messages или /var/log/debug

варианты :
cat /var/log/messages |grep "attempt to access beyond end of device"
cat /var/log/messages |grep  "unable to read inode block"
cat /var/log/messages |grep  "error (device ide"
cat /var/log/messages |grep "megaraid: invalid"
cat /var/log/messages.* |grep "attempt to access beyond end of device"
cat /var/log/messages.* |grep  "unable to read inode block"
cat /var/log/messages.* |grep  "error (device ide"
cat /var/log/messages.* |grep "megaraid: invalid"


Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

13. "Может, дело в драйверах контроллера?"  
Сообщение от Utandr email(ok) on 27-Июн-08, 16:14 
У меня скромное предположение: может, какие-то процедуры плохо работают именно для этого контроллера (i915G /SATAII )?

Ведь драйверов же я никаких не ставил -- все само должно было найтись, и нашлось.

У меня другой сервер уже лет 5 работает, и что только с ним не случалось: и "падал" БП, и работал в +40 со сломанным кондиционером в закрытом помещении, пережил три смены места, потеря питания случалась многократно (более 20 раз), но работает стабильно до сих пор..

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Индекс форумов | Темы | Пред. тема | След. тема
Оцените тред (1=ужас, 5=супер)? [ 1 | 2 | 3 | 4 | 5 ] [Рекомендовать для помещения в FAQ]




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру