После дополнительного разбора полетов нашумевшей ошибки в файловой системе Ext4 удалось найти настоящую причину возникновения данной проблемы и исправить именно её. Ошибка проявлялся только при монтировании файловой системы с нестандартными опциями (должны быть включены опции journal_async_commit и/или journal_checksum) в ситуации когда файловая система не была корректно размонтирована.
Тем не менее, настоящая причина возникновения данной ошибки была связана с тем, что журналирование битовых карт инодов не работало корректно. В обычной ситуации это могло как максимум привести лишь к небольшому повреждению файловой системы, видимым проявлением которой является в основном то что fsck на 5-м проходе выдает сообщение, касающееся "inode allocation bitmap" после некорректного выключения системы под тяжелой нагрузкой. Однако при активации опций "journal_checksum" и/или "jouaral_async_commit" проблема усугублялась и приводила к заметному для пользователя разрушению файловой системы.
Патч с исправлением причины данной проблемы уже принят (http://git.kernel.org/?p=linux/kernel/git/torvalds/linux-2.6...) в git-репозиторий Торвальдса.URL: http://www.phoronix.com/scan.php?page=news_item&px=MTIxODY
Новость: http://www.opennet.me/opennews/art.shtml?num=35224
Сидел на новых ядрах и все нормально и без патча было, но ведь какое-то мелкое нарушение это такая паника у пользователей! Думаю, теперь понятно почему линукс настолько хорош :)
Дотошно докапываются до всего. В пределах считанных дней. В целом для отрасли это фееричное и фантастическое зрелище: у остальных такое годами может жить и пока оно не начнет массово гасить каждого третьего - никто и не почешется.
паники не было вроде. просто тролли всполошились.
Ну разумеется, только тролли работают в жестких условиях, когда даже за несколько минут простоя при накатывании бэкапа могут вые*ать.
А у админов локалхостов, действительно, причин для паники никаких.
Спасибо, посмешил. Судя по высказыванию, ты не имеешь ни малейшего понятия ни о том что такое датацентры(ну или нормальная серверная), ни о взаимоотношениях с начальством, ни даже о времени уходящем на восстановление из бекапа. А не админ ли локалхоста ты часом? Тогда для тебя печальная новость, именно таким стоило беспокоится больше всего, так как именно у них чаще всего нет ни упса, ни стабильного электричества, ни бекапов, но есть желание экспериментировать с опциями ФС.
Не стоит публично проецировать свои морально-этические принципы на других. Ведь этим ты лишь показываешь всем собственную гнилую натуру и ничего больше.
> Я как раз из числа начальников, которые платят за "работу" админобыдлу вроде
> тебя. Any questions?Я бы на такого ушибленного начальника и его результаты жизнедеятельности полагаться не стал. Поэтому огласите плиз начальником какой именно шараги вы являетесь. Ну, чтобы не вляпаться случайно.
> Поэтому огласите плиз начальником какой именно шараги вы являетесь. Ну,
> чтобы не вляпаться случайно.Зассыт! Я на таких начальников насмотрелся.
> Я как раз из числа начальников, которые платят за "работу" админобыдлу вроде
> тебя. Any questions?Сначала быдланасяльника выберет систему и фс которые нахер ненужны в проекте но зато реклама с телками а потом админы разгребают. Не лезли бы вы туда где ничего не понимаете. И не нада на нехватку времени сетовать.
а если бы у него была бсд и зфс, всё бы сложилось по-другому…
> а если бы у него была бсд и зфс, всё бы сложилось
> по-другому…Без головы ? Наврятли :)))
> Ну разумеется, только тролли работают в жестких условиях, когда даже за несколько
> минут простоя при накатывании бэкапа могут вые*ать.Хотелось бы посмотреть на админа в жестких условиях который ставит такие опции ФС при том что они не так давно сделаны. Хотя если ж...а просии приключений и хочется тестануть фичу на крутейшем энтерпрайзе - это вариант!
> Хотелось бы посмотреть на админа в жестких условиях который ставит такие опции
> ФС при том что они не так давно сделаны. Хотя если
> ж...а просии приключений и хочется тестануть фичу на крутейшем энтерпрайзе -
> это вариант!Ну да, ну да. Настоящие админы энтерпайзных локалхостов юзают только ext2, потому что ext3 и ext4 "не так давно сделаны".
> Ну да, ну да. Настоящие админы энтерпайзных локалхостов юзают только ext2, потому
> что ext3 и ext4 "не так давно сделаны".Не, можно и генту юзать, ввинтив все экспериментальные ключи компилера при сборке. Но любой человек у которого башня на месте понимает, что:
1) Любой сложный софт может содержать баги.
2) Поэтому любой сложный софт будет содержать баги.
3) Поэтому логично подождать и дать другим их вытоптать.
4) Но верить на слово им все-равно нельзя и надо сначала закатить тесты в своей инсталляции.
5) Чем более редкие опции вы вкатили - тем менее протестировано остальными и тем больше вы будете заниматься пунктом 2) самолично. Просто потому что тех кто юзал опции окажется недостаточно для того чтобы 3) был сделан за их счет.Example: опытный виндовый админ переходит на новую систему не раньше SP2. Угадаете почему? :)
> Example: опытный виндовый админ переходит на новую систему не раньше SP2. Угадаете
> почему? :)потому остальное время, прошедшее с выхода «новой системы» он убеждает начальство, что без «вот этих инноваций мы никак жить не можем, давайте 100500 денег на модернизацию! нет, у нас ничего не работает, даже если вам кажется, что работает! но будет всё намного лучше!»
>> Example: опытный виндовый админ переходит на новую систему не раньше SP2. Угадаете
>> почему? :)
> потому остальное время, прошедшее с выхода «новой системы» он убеждает начальство,
> что без «вот этих инноваций мы никак жить не можем, давайте
> 100500 денег на модернизацию! нет, у нас ничего не работает, даже
> если вам кажется, что работает! но будет всё намного лучше!»В это время опытный админ ubuntu крестится сначала левой рукеой потом правой, потом ставит крестиком пальцы на всех 4-х конечностях :)) и запускает apt-get upgrade :)) В надежде что обновлений на kernel и grub нету и после ребута все поднимется :)))
В это время опытный bsd админ смотрит новости и если нет ниодной
> В это время опытный bsd админ смотрит новости и если нет ниоднойДочитывая это письмо, всерьёз забеспокоился на оборвавшейся строчке.
>> В это время опытный bsd админ смотрит новости и если нет ниодной
> Дочитывая это письмо, всерьёз забеспокоился на оборвавшейся строчке.Напрасно ... это случается не более двух раз в год ... :)))
> В это время опытный админ ubuntu…втихую перезагружается в любимую винду.
> В это время опытный bsd админ смотрит новости и если нет ниодной
shhh… carrier lost.
>> В это время опытный админ ubuntu
> …втихую перезагружается в любимую винду.И запускает counter strike единственную программу которую он смог сам настроить :))
> И запускает counter strike единственную программу которую он смог сам настроить :))не смог, пять раз драйвера переставлял, и всё равно подглюкивает.
>> Example: опытный виндовый админ переходит на новую систему не раньше SP2. Угадаете
>> почему? :)
> потому остальное время, прошедшее с выхода «новой системы» он убеждает начальство,
> что без «вот этих инноваций мы никак жить не можем, давайте
> 100500 денег на модернизацию! нет, у нас ничего не работает, даже
> если вам кажется, что работает! но будет всё намного лучше!»В это время опытный админ ubuntu крестится сначала левой рукеой потом правой, потом ставит крестиком пальцы на всех 4-х конечностях :)) и запускает apt-get upgrade :)) В надежде что обновлений на kernel и grub нету и после ребута все поднимется :)))
В это время опытный bsd админ смотрит новости и если нет обновлений безопасности идет пить пиво :))
> В это время опытный bsd админ смотрит новости и если нет обновлений
> безопасности идет пить пиво :))…с другими опытными админами бсд. и они жалуются друг другу, какие люди ограниченые, и как приходится зарабатывать на пиво, администрируя проклятые форточки.
>> Хотелось бы посмотреть на админа в жестких условиях который ставит такие опции
>> ФС при том что они не так давно сделаны. Хотя если
>> ж...а просии приключений и хочется тестануть фичу на крутейшем энтерпрайзе -
>> это вариант!
> Ну да, ну да. Настоящие админы энтерпайзных локалхостов юзают только ext2, потому
> что ext3 и ext4 "не так давно сделаны".UFS2 наше фсё :))
это суровые админы чуть что - сразу кидаются экспериментировать с опциями на серверах? или это распростараненно среди админов-теоретиков? хотя, да
>Ну разумеется, только тролли работают в жестких условиях
> это суровые админы чуть что - сразу кидаются экспериментировать с опциями на
> серверах?Какбэ эти опции не вчера появились. Было время погонять их в тестовом режиме.
Но вот вероятность серьезного разрушения ФС - далеко не 100%, и не всегда можно отличить неполное разрушение от обычного гемора при грязном размонтировании.
о, да. тут о мегакрутости ntfs еще рассказывали.
перечитайте новость. это про опции, про условия. ну и крутые админы всегда используют опцию "lazy unmount". это ж как в штормовую погоду с парашютом прыгать. адреналин!
ну и вдовес. по секрету скажу, что большинство админов не перешло до сих пор на ext4 в наиболее критичных к сбою накопителях.
> о, да. тут о мегакрутости ntfs еще рассказывали.Да, файловые системы при падении в бсод с винчом более 2 Тб убивались качественно :). Хотя вроде и было время протестировать, и баг вполне себе легко воспроизводится. :)
>> о, да. тут о мегакрутости ntfs еще рассказывали.
> Да, файловые системы при падении в бсод с винчом более 2 Тб
> убивались качественно :). Хотя вроде и было время протестировать, и баг
> вполне себе легко воспроизводится. :)Да от бсода ни упс ни батарейка не спасут :))
> Да, файловые системы при падении в бсод с винчом более 2 Тб
> убивались качественно :)да ладно, я уже писал: права гостя, возможность сделать один маленький батник на несколько строк со стандартными инструкциями cmd и запустить. бай-бай, mft, ты была хорошим другом…
> да ладно, я уже писал: права гостя, возможность сделать один маленький батник
> на несколько строк со стандартными инструкциями cmd и запустить. бай-бай, mft,
> ты была хорошим другом…Виндовс сэр.
> Какбэ эти опции не вчера появились. Было время погонять их в тестовом режиме.Ну так вы не погоняли же.
> не всегда можно отличить неполное разрушение от обычного гемора при грязном размонтировании.
Опять же - а вон перчики нашли. Так и запишем: квалификация тех субъектов повыше вашей.
> паники не было вроде. просто тролли всполошились.Да с фига ли там паниковать если оно сколь-нибудь заметно сыпется только при тяжелой нагрузке и нестандартных опциях? Но баг все-таки имел место быть. Просто в обычных услових он никому не мешал, а с нестандартными опциями уже мог вызвать проблемы.
Честно говоря, даже теоретическая возможность такого факапа должна любого админа продакшена заставить откатываться и делать внеочередные бэкапы, если уж откатить нельзя.
Еще один. Любой опытный админ знает, что абсолютно надежных ФС, железа и даже датацентров не бывает. Действия свои планирует, исходя из этого факта. Поэтому опытный админ на такие новости реагирует ровным счетом никак. Суетливо бэкапятся или откатываются только пионеры, впервые узнавшие, что ФС оказывается может умереть и данные могут похериться, а заодно не вкурившие в условия необходимые для проявления конкретно этого бага
> Честно говоря, даже теоретическая возможность такого факапа должна любого админа продакшена
> заставить откатываться и делать внеочередные бэкапы, если уж откатить нельзя.Паникеров в военное время расстреливают без суда и следствия.
>> Честно говоря, даже теоретическая возможность такого факапа должна любого админа продакшена
>> заставить откатываться и делать внеочередные бэкапы, если уж откатить нельзя.
> Паникеров в военное время расстреливают без суда и следствия.А в невоенное время они гибли под натиском разбушевавшейся толпы. :)
> Честно говоря, даже теоретическая возможность такого факапа должна любого админа продакшена
> заставить откатываться и делать внеочередные бэкапы, если уж откатить нельзя.Неоднократно сталкивался с ситуацией когда руководство не выделяет времени на бакапы ... им пох ..
> Неоднократно сталкивался с ситуацией когда руководство не выделяет времени на бакапы ...
> им пох ..Лучше тогда уходить самому, если такое вот "начальство" не было очевидно сразу -- примерно как лучше с умным потерять, чем с дураком [временно] найти.
>> Неоднократно сталкивался с ситуацией когда руководство не выделяет времени на бакапы ...
>> им пох ..
> Лучше тогда уходить самому, если такое вот "начальство" не было очевидно сразу
> -- примерно как лучше с умным потерять, чем с дураком [временно]
> найти.В таких организациях не штрафуют за простои, так что солдат спит служба идет деньги капают.
>Неоднократно сталкивался с ситуацией когда руководство не выделяет времени на бакапы ... им пох .."Пох" бывают разные.
1. "Пох, ибо хз" - элементарная неосведомлённость. Лечится информационной служебной запиской, в которой доступным образованному человеку-гуманитарию следует объяснить суть хранения данных.
2. "Пох, ибо нах" - осознанный риск потери данных. Выясняется в личной беседе с ответственным лицом. Смириться или менять место работы.
3. "Пох, ибо нех" - остервенелое нежелание организации нормальной работы организации. Не лечится. Не уйдёшь - будешь виноватым. Менять место работы.
>не выделяет времени на бакапы .в смысле? у нас в конторе бэкапы автоматом делаются, еженочно. на ленту - раз в месяц. в основном исходники и созданные установочные пакеты. виртуальные машины для тестирования бэкапить смысла особенно нет.
>>не выделяет времени на бакапы .
> в смысле?виндосерверы, видать. а в конторе сидят бедняги, прикованые к тяжёлым столам, и круглые сутки впахивают.
поэтому одмин не может нормально виндосервер заскриптовать и не может его временно остановить. «вот такие вот традиции в китае» (ц)
> какое-то мелкое нарушение это такая паника у пользователей!Цитирую:
В обычной ситуации это могло как максимум привести лишь к небольшому повреждению файловой системы, однако при активации опций "journal_checksum" и/или "journal_async_commit" проблема усугублялась и приводила к заметному для пользователя разрушению файловой системы.
> однако при активации опций "journal_checksum" и/или "journal_async_commit"Это первый раз, когда довелось услышать об их использовании.
См. тж. https://plus.google.com/117091380454742934025/posts/f5a1eHxUzSh
Господа не оскорбляйте друг друга.
Ext4 не плохая FS хотя для БД с фиксированным нодом оказывается несколько медленней. И новые фичи мало кому нужны на боевых серверах. но это же не повод называть друг друга тролями или быдло !!!
> Господа не оскорбляйте друг друга.
> Ext4 не плохая FS хотя для БД с фиксированным нодом оказывается несколько
> медленней. И новые фичи мало кому нужны на боевых серверах. но
> это же не повод называть друг друга тролями или быдло !!!zfs+raw ?
на Linux ?????
> на Linux ?????Низачто :)))
> это же не повод называть друг друга тролями или быдло !!!для веселья любой повод сойдёт.