URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 132623
[ Назад ]

Исходное сообщение
"Опыт создания хранилища Ceph c пропускной способностью тебибайт в секунду"

Отправлено opennews , 20-Янв-24 21:26 
Инженер из компании Clyso обобщил опыт создания кластера хранения на базе отказоустойчивой распределённой системы Ceph с пропускной способностью, превышающей тебибайт в секунду. Отмечается, что это первый кластер на базе Ceph, который смог достигнуть подобного показателя, но перед получением представленного результата инженерам потребовалось преодолеть серию не очевидных подводных камней...

Подробнее: https://www.opennet.me/opennews/art.shtml?num=60470


Содержание

Сообщения в этом обсуждении
"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 20-Янв-24 21:26 
Зумерки пошли гуглить про тебибайт

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено нах. , 21-Янв-24 01:29 
> Зумерки пошли гуглить про тебибайт

инженеры пошли читать доки EOS (нда... забавная говорящая лягушка, но что-то данные ей доверять неохота)



"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 20-Янв-24 21:39 
>RelWithDebInfo
>-O2

Расскажите инвалидам про PGO, кто-нибудь, представляю их шок от по-настоящему эффективного кода.

Есть ещё -fno-semantic-interposition -fno-plt ускоряющие тот же питон на ~50%.

>TCMalloc

А вот тут не удивлён, больше удивлён, что столько желающих бездумно пихнуть эту дрянь в проект.


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено ZWayland , 21-Янв-24 00:18 
Ты хоть видел LLVM-0 там RelWithDebInfo ?

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 21-Янв-24 00:48 
>LLVM

Вообще ужасно плохой и совершенно не универсальный код продуцирует, это да. Нет исключений. Разве что Skia, там шлангоспецифичные костыли нагорожены.


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Ext , 21-Янв-24 00:56 
>> Вообще ужасно плохой и совершенно не универсальный код продуцирует, это да

Как проводили замеры эмулировали ли вы clangd делая его ссылку в usr/bin как будто он есть никто иной как c++ ?


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 21-Янв-24 01:03 
Сборкой пакетов различными тулчейнами, выполнением сетов тестов (10 штук по кругу), анализом результатов и взятием среднего, а также разбором генерируемого кода в некоторых случаях. Советую меньше читать похороникс с его gcc -O3 (это вообще самый медленный код примерно всегда даёт).

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Ext , 21-Янв-24 02:03 
>> Сборкой пакетов различными тулчейнами, выполнением сетов тестов (10 штук по кругу), анализом результатов и взятием среднего, а также разбором генерируемого кода в некоторых случаях. Советую меньше читать похороникс с его gcc -O3 (это вообще самый медленный код примерно всегда даёт).

А , зачем говорить о производительности когда я спросил про clangd ? Вы услышали в этом  вопросе что то про -O3 ? Залепили минус и радуетесь как ребенок


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 21-Янв-24 02:08 
>>> Сборкой пакетов различными тулчейнами, выполнением сетов тестов (10 штук по кругу), анализом результатов и взятием среднего, а также разбором генерируемого кода в некоторых случаях. Советую меньше читать похороникс с его gcc -O3 (это вообще самый медленный код примерно всегда даёт).
> А , зачем говорить о производительности когда я спросил про clangd ?
> Вы услышали в этом  вопросе что то про -O3 ?
> Залепили минус и радуетесь как ребенок

Изначальный тейк
>LLVM ужасно плохой и совершенно не универсальный код продуцирует

и cland тут ни к селу ни к городу, а вот про минусы/плюсы это точно, ну, если кому-то от этого легче живётся, то всегда пожалуйста [картинка со слоном]


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Ceph , 21-Янв-24 03:13 
Может потому что слишком много статиков в исходном коде , ну так поубирайте их , нет не пробовали ?

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено onanim , 21-Янв-24 11:08 
> TCMalloc
> дрянь

а что насчёт jemalloc? если мне не изменяет память, старые версии 2.x оче ускоряли софт (но начиная с 3.x там что-то сломали и оно стало намного медленнее)
новые версии не юзал.


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Бывалый смузихлёб , 22-Янв-24 09:02 
> PR #55238 130 has landed today, removing jemalloc from the Rust standard library
> jemalloc is often more performant than the system’s allocator, but not always,
> and it adds a non-trivial amount to the size of the executable.

Уж если его даже из раста выкинули...


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено onanim , 22-Янв-24 15:21 
> раст

не показатель


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Ivan_83 , 21-Янв-24 15:54 
https://stackoverflow.com/questions/35745543/new-option-in-g...
https://stackoverflow.com/questions/65554551/why-gcc-generat...

Что то по описанию не похоже что это можно просто включить для всего софта в системе и забыть.


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 21-Янв-24 16:21 
Я так сделал, никаких проблем. В приличных корпоративных дистрах мейнтейнеры пакетов добавляют эти флаги.


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Ivan_83 , 21-Янв-24 19:37 
Я пересобрал фрю с этими двумя флагами и она просто не грузится.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 21-Янв-24 21:36 
> Я пересобрал фрю с этими двумя флагами и она просто не грузится.

Ну так фря и не линукс. Glibc без включенного -fsemantic-interposition тоже сломали, когда перешли на внешнюю libxcrypt. Раньше работало. И в честь этого решили убрать custom-cflags из юзов. Примерно все остальные пакеты у меня собраны без semip.


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 22-Янв-24 12:10 
Для тебя неуч

https://tracker.ceph.com/issues/40745

https://aur.archlinux.org/cgit/aur.git/tree/PKGBUILD?h=ceph

# -fno-plt causes linker errors (undefined reference to internal methods)
# similar issue: https://bugs.archlinux.org/task/54845
# https://github.com/intel/media-driver/commit/d95d8f7ab7ac94a...
# as of today (2019-07-12) the upstream maintainers do not consider this a bug in their code
# (IMHO rightfully so) and thus we strip the option here

Надеюсь ты разрабам ceph подкинешь патчей для исправления.


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 22-Янв-24 12:14 
Неуч, это означает только то, что код низкого качества. Понятно, что это не универсальный флаг. В принципе, ошибки линкера -- это наиболее легко выявляемая и диагностируемая проблема, и часто они возникают из-за багов в конкретном линкере.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Tron is Whistling , 20-Янв-24 22:47 
Про i/o latency ни слова :)

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Tron is Whistling , 20-Янв-24 22:55 
А в оригинале между прочим есть, там по факту почти запредельная latency для "network however was already built, and it's a beast".

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено нах. , 21-Янв-24 01:20 
да лана, мне гораздо интереснее через сколько секунд этот синхроглюкотрон у них навернулся и похоронил под собой все данные.

Полагаю, с супер-пупер оптимизацией этого не пришлось ждать слишком долго.


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 21-Янв-24 02:57 
А вот зависть — плохое чувство. Над собой нужно работать.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Всем Анонимам Аноним , 21-Янв-24 15:33 
К любой новости на opennet 80% коментариев, что все это хрень и глюкало. (подразумевается обычно что типа вот я бы лучше сделал в 1000 раз, если бы кто-то попросил меня слезть с дивана и попробовать хотя бы 1 раз что-то сделать)

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено aNonim , 21-Янв-24 16:29 
Эка, Вы, кучеряво "Сперва добейся" оформили, демагоги одобряют))  

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 21-Янв-24 21:45 
Скорее что про Льва Толстого и кого-то простого.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 21-Янв-24 22:32 
Не, у пох/наха к цефу особенно трепетное отношение. Особенно когда в связи с проксмосом упоминается, там вообще наступает экстаз. Видать что-то очень личное (например, в начале карьеры из-за цефа всё потерял и уволили).

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Tron is Whistling , 21-Янв-24 22:35 
У меня к цефу не менее трепетное отношение.
Я это сильно более 1 раза пытался тестировать, модное, молодёжное...
Но вот проблема - ни одного раза, когда оно мне смогло должную отказоустойчивость обеспечить, не случилось.
Вылет более одной ноды одновременно - это всё, хардкор, ад, содомия, скотоложество и т.п.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Пряник , 22-Янв-24 09:52 
Тогда ставить более двух реплик данных?

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Tron is Whistling , 22-Янв-24 10:24 
Да не, там всё жестоко даже с несколькими репликами. А особенно жестоко с EC.
PG просто "залипают" в неконзистентных состояниях с энной вероятностью - и начинай пляски с бубном.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Пряник , 22-Янв-24 12:25 
Очень размытая формулировка. Предположу, что из-за недоступности нескольких OSD начался Repair со Scrub. В старых версиях Scrub делался очень долго.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Tron is Whistling , 22-Янв-24 14:08 
Никакой размытой формулировки.
PG просто залипают в undersized, incomplete и прочих забавных состояниях.
Передёргивание целых OSD иногда даёт результаты, иногда нет.
Можно по-джедайски удалять битые куски PG - но это извращение и вообще опасная операция.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено 1 , 22-Янв-24 10:27 
Ну хоть не я один ....

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено User , 22-Янв-24 07:47 
Ну, у меня в окрестностях есть минимум два прецедента с крупным "разлетом-в-лоскутья" и восстановлением с бэкапа чего смогли, причем один из них - вполне себе облачный провайдер, т.е. на васянолапы не спишешь. По ощущениям - проблемная в плане надежности технология, со специфически высокими требованиями к эксплуатантам. Если у тебя нет прям _хороших_ специалистов на фуллтайм - лучше не связываться, как-то так.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 22-Янв-24 10:12 
8 лет работает и работает, ну случаются факапы, где их нет, но никогда ничего не рушилось

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Tron is Whistling , 22-Янв-24 10:26 
Ну, за 8 лет 3.14ца может при хорошем стечении обстоятельств просто не наступить.
У нас обязателен стресс-тест на хранилку - тестируется отвал нод при разных условиях.
И вот тут с цефом мы наступали в совершенно различные сорта приключений.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено User , 22-Янв-24 11:51 
> 8 лет работает и работает, ну случаются факапы, где их нет, но
> никогда ничего не рушилось

1. Может повезло.
2. Может - нагрузки нет\специфичная + п.1
3. Может - есть хорошие специалисты.
Может... да много что "может". Вот конкретно сейчас и руководитель направления devops и архитектор от подрядчика сошлись на "Очково мне, Славик - давай железную сторажку возьмем, дешевле выйдет". Руководитель от инфры - окнул.
С-с-ыкуны, чо.


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Tron is Whistling , 22-Янв-24 14:09 
> Может... да много что "может". Вот конкретно сейчас и руководитель направления devops
> и архитектор от подрядчика сошлись на "Очково мне, Славик - давай
> железную сторажку возьмем, дешевле выйдет". Руководитель от инфры - окнул.

Угу, я их не могу не поддержать в этом самом очковании, да.


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено пох. , 22-Янв-24 14:41 
> Не, у пох/наха к цефу особенно трепетное отношение. Особенно когда в связи с проксмосом
> упоминается, там вообще наступает экстаз.

ну да, оно в этой комбинации просто уникально выступило.

> Видать что-то очень личное

нет, просто та трагедь была очень хорошо задокументирована (и ты бы тоже про нее знал, если бы был инженером а не дол..ом)

И там все было настолько прекрасно, что я как тот доктор - хорошо, великолепно, просто замечательно!


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 22-Янв-24 19:51 
тут один уже сделал
https://git.yourcmc.ru/vitalif/vitastor/src/branch/master/RE...

понятия не имею насколько оно соответствует


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Tron is Whistling , 21-Янв-24 10:36 
Ну, тут я вообще уже даже интересоваться не рискую :)

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено User , 22-Янв-24 07:48 
"Печатаю со скоростью 1000 знаков в минуту - ну и фигня получается!"(Ц)

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено 12yoexpert , 21-Янв-24 00:22 
почему кто-то должен знать, что такое этот цэпх?

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 21-Янв-24 00:22 
> только в режиме максимальной производительности и отключить c-state

...и приготовить дохреналион долларов для энергокомпании, одобряющей такие рекорды :)


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 21-Янв-24 00:41 
Они как раз в Германии базируются. Можно будет просто переехать в США, и сразу срежется больше половины расходов.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 21-Янв-24 10:50 
Ты еще просто молод и не знаешь всех тонкостей. Это все полезно для взякийх хецнеров, у которых вагон клиентов локалост-адмнинов. Почитай доки у hp, dell и т.п. на предмет получения high performance и low latency методом тюнинга power profile и параметров cpu в самом bios/uefi. Откроешь для себя новый мир.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено onanim , 26-Янв-24 10:13 
> ... Почитай доки у
> hp, dell и т.п. на предмет получения high performance и low
> latency методом тюнинга power profile и параметров cpu в самом bios/uefi.
> Откроешь для себя новый мир.

а на практике оказывается, что дофига умный биос (или BMC?) роняет частоту оперативы, если поставить модули одинаковой модели, но из РАЗНЫХ ПАРТИЙ, а в доках лишь скромно указано "Unbalanced memory configurations will result in a performance loss so always populate memory channels identically with identical DIMMs for best performance", но не сказано, что "identically" это ОДНА ПАРТИЯ ОДНОЙ МОДЕЛИ, а не просто одинаковая модель.
вот это я открыл для себя новый мир, докупив в сервер идентичные планки к уже установленным.


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 21-Янв-24 11:42 
Это для топовых ребят:
https://opennet.ru/60108-top500

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено BeLord , 21-Янв-24 13:17 
ИТ отрасль, где учиться надо от старта и до выхода в утиль, если постоянно не учишься, то знания быстро приходят в негодность. А учиться постоянно мало кто вывезет. Половина админов слабо представляют, как железо работает, хотя админят те же кластеры, куча программистов слабо понимаю архитектуру процессоров, а потом удивляются почему код такой-) Модерация слабо поможет, критерии очень размыты. Пример, я  имел опыт работы с FreeBSD c 1994 по 1999, значит ли это что я могу давать комментарии по фри? Как по мне знания устарели, да со временем много забывается, другой человек будет считать иначе. Или есть опыт написания драйверов под нестандартное железо для шины PCI, ну и что, то что это все работала под вынь и осьпополам в 96 году, не говорит же, что я программист сейчас-))

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено BrainFucker , 21-Янв-24 13:42 
> ИТ отрасль, где учиться надо от старта и до выхода в утиль, если постоянно не учишься, то знания быстро приходят в негодность. А учиться постоянно мало кто вывезет.

Да, только я не про опыт, а про манеры общения. Во всех подобных околоайтишных раковниках контингент годами общается как гопота из подворотни. А знания тут ни при чём, когда специалист уже сеньор, ему больше софт скилы важны.


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 21-Янв-24 17:07 
брехня, Руководство всегда найдёт как обидеть.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 21-Янв-24 17:30 
Знания важны всегда. Софтскилз сеньёру нужен дополнительно когда знания нужно понести в массы и добавить к себе условный x10 полезности. Т.е. это уже переход от просто инженера к архитектору или техдиру

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено OpenEcho , 21-Янв-24 17:33 
> Во всех подобных околоайтишных раковниках контингент годами общается как гопота из подворотни.

Гопота рядом не стояла, там принято за кривой базар рожу бить, а здесь все безнаказанка и дешевая душонка позволяет АйТи "гениям" хоть где то показать свою "крутость", - нагадить и убежать не битым


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 21-Янв-24 21:50 
>общается как гопота из подворотни

Простите, а где головастым (без иронии) нердам (немного иронии) ещё удастся задоминировать? В подворотне можно и по роже получить, а тут и безопасно, и можно слегка "причаститься" к тем самым дворовым пацанам, хотя бы на словах.


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Пряник , 22-Янв-24 09:44 
Скорее это ты попался на троллинг с отыгрышем.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 21-Янв-24 17:28 
>  Пример, я  имел опыт работы с FreeBSD c 1994 по 1999, значит ли это что я могу давать комментарии по фри?

Можешь давать комментарии вообще по чему угодно, кто же запрещает


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено OpenEcho , 21-Янв-24 17:37 
> Можешь давать комментарии вообще по чему угодно, кто же запрещает

здравый интелект у него запрещает


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 21-Янв-24 12:08 
Отключить cstate в биос? Т.е. догадаться для начала хотя бы через tuned выставить latency-профиль они не догадались, а в биос полезли? Не представляю себе биос для серверных материнок, где бы по умолчанию не был режим, в котором C-state можно управлять софтварно. Но нет, конечно, задуматься о том что выбрать подходящий под нагрузку профиль (или напрямую сменить режим cpupower/sysctl/и тп, tuned никакой магией не занимается, просто удобные пресеты настроек для включения в одну команду) они не догадались, зато решили поковыряться в биосе. Чудесно.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Tron is Whistling , 21-Янв-24 12:22 
Софтварное управление C-state тоже имеет приличное время реакции.
В критичных к latency системах - да, лучше отключать и ставить max performance, факт.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 22-Янв-24 13:08 
Понятно что имеет время реакции. Но их можно *отключить* соответствующим режимом энергопотребления, и на это есть готовый профиль tuned. И это работает сразу же, без манипуляций биосом от дефолта - что с точки зрения управления (ansible или что угодно) совсем не то же самое что идти перезагружать тачки и манипулировать биосом после каждого обновления (хотя, большинство серверных вендоров нынче умеют не терять изменения настроек при обновлении фирмвари - еще бы десктопным материнкам об этом только мечтать... Но большинство != все)

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено 1 , 22-Янв-24 13:13 
> совсем не то же самое что идти перезагружать тачки и манипулировать биосом после каждого обновления

Если это сервер, то у него есть IPMI (ну или KVMoIP для особо страждущих). Ходить никуда не надо.


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Tron is Whistling , 22-Янв-24 22:04 
У делла даже есть варианты в заказе, когда по дефолту ставится max performance. И никуда идти не надо.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено 1 , 22-Янв-24 10:41 
> Т.е. догадаться для начала хотя бы через tuned выставить latency-профиль они не догадались, а в биос полезли?

А зачем догадываться ?
Отключение C-Stated в BIOS для нагруженных серверов, штатная процедура - прописанная в инструкции. У меня орки это делают, сразу после распаковки. И думать о профилях нет никакого смысла.


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено RM , 23-Янв-24 15:56 
По феншую, т.е. low latency мануалам, как уже сказали, сначала BIOS а потом уже настройки системы.
Как я понимаю - потому что P-States и C-States все же немного разные вещи.
И tuned больше про первые, чем про вторые. Ну и у народа Epic, не интел.
А также потому что процессоры нонче сильно умные и так и норовят power state promotion сделать на аппаратном уровне.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено InuYasha , 21-Янв-24 12:28 
Мне интересно только - кто юзер. Минэнерго США? ЦЕРН? Или какие-то другие враги народов?

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено пох. , 21-Янв-24 13:10 
Церн оказался круче и там в конце статьи ссылка на его собственное аналогов не имеющее (не тратьте клик - оно а-ля гластер разворачивается поверх xfs и только xfs - видимо так же хранит все лишние детали в ее EA, но при этом а-ля цеф требует отдельных демонов для меты, для дисков и для управления, и так же использует роксдряньбазу - но обычную, в файликах. То есть небольшой шанс потом вручную собрать когда оно рухнет остается, наверное, но вы этого точно не хотите)

У минэнерго скорее всего нет столько ненужных данных в таком количестве, и они свои складывают на обычные полки.

Тут пахнет ностоящей ноукой, где все нахаляву и в любых количествах.


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Tron is Whistling , 21-Янв-24 13:15 
Роксдб - это вообще отдельная тема.
Я с трудом понимаю, как люди вообще в это рискуют что-то более-менее ценное складывать.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено пох. , 21-Янв-24 13:37 
изначально видимо архитекторами хефа предполагалось что от нее требуется максимум скорости а ничего ценного в конкретном OSD нет и его можно целиком потерять.
ЦЕРН выступил круче и у них там лежит кэш? метаданных. Короче хз что у них там происходит при потере QDB или мусоре в базе - настолько детально лезть в их записки на манжетах (приличной документации как обычно нет) неохота. Возможно всеобщий амбец.


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 22-Янв-24 07:56 
чо с ним не так?

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Tron is Whistling , 22-Янв-24 08:54 
> чо с ним не так?

Гуглите rocksdb corruption.


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 22-Янв-24 19:54 
оно?

https://rocksdb.org/blog/2022/07/18/per-key-value-checksum.html

пишуть что всё хорошо

To prevent and detect corruption, RocksDB has several consistency checks


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено InuYasha , 21-Янв-24 13:35 
Я уже потратил нечто гораздо большее чем клик на этот гадюшник, но спасибо.

А может и не наукой, а корпоративной бигдатой типа алфавита..?


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено пох. , 21-Янв-24 13:49 
ненене, мы ее не для того собирали чтоб так просто лишиться.

Ну и алфавит не станет заказывать у стремной конторы сетап, а наловит в индийских джунглях еще полторы сотни разработчиков и удивит нас еще какой-нибудь новой бжней.


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 22-Янв-24 11:19 
А вроде раньше церн как раз ceph использовали.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Пряник , 22-Янв-24 09:46 
Откуда такая одержимость экономией энергией?

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено электронщег , 24-Янв-24 16:10 
А кто говорит про экономию энергии? Министерство энергетики США занимается куда более мрачными делишками ;)

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено X86 , 21-Янв-24 12:44 
Сколько ошибок в слове терабайт с хвостиком)

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено пох. , 21-Янв-24 13:28 
это ж текущий статус - а у этих самураев нет цели, только путь.


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 21-Янв-24 15:10 
неужели у них эта пропускная способность настолько точно определена, что в переводе новости нельзя Тб по-человечески назвать терабайтом?

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 21-Янв-24 18:15 
Разница между терабайтом и тибибайтом ~10%. Так что да, пропускная способность определена настолько точно.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено JL2001 , 21-Янв-24 18:58 
интересно

> При задействовании кодов коррекции ошибок EC62 пропускная способность составила 547 GiB/s при чтении и 387 GiB/s при записи (скорость записи оказалась выше чем без кодов коррекции)


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено нах. , 21-Янв-24 19:15 
ничего интересного - они ж с 3x сравнивают. Разумеется запись того же самого объема на шесть дисков (или даже на 4 - понятия не имею как правильно читать ихнее 62, нормальные люди во избежание разночтений пишут 6+2) будет быстрее чем на один, и даже с учетом восьмушек дополнительно.


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Tron is Whistling , 21-Янв-24 22:32 
Естественно.
3 реплики = трёхкратный объём записи (и передачи по сети соответственно) на каждый актуальный записанный блок

6+2 RS = 1.33 объёма на каждые 6 актуальных последовательных блоков

Правда при рандомной записи не по границе блока могут быть сюрпризы


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 21-Янв-24 20:20 
> При задействовании кодов коррекции ошибок EC62

Что это за тип ECC? Не гуглится, всё что находится это какая-то InfiniBand сетевушка от IBM.


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Tron is Whistling , 21-Янв-24 22:30 
Это какое-то презетное или в узкой среде принятое название профиля, я так понял.
Код Рида-Соломона, k=6, m=2, на каждые 6 блоков добавляются 2 избыточных.
Банальный RAID 6 из 8 юнитов (6+2), короче.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Sw00p aka Jerom , 21-Янв-24 22:37 
https://en.wikipedia.org/wiki/Erasure_code

6+2


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Sw00p aka Jerom , 21-Янв-24 22:41 
https://ceph.io/en/news/blog/2014/erasure-coding-in-ceph-2/

вот тут собственно по сабжу


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Пряник , 22-Янв-24 09:48 
Ceph это скорее не про скорость, а про доступность, облачность и надёжность.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено 1 , 22-Янв-24 10:46 
Первые два - да ...
С третьим есть куда стремиться.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 22-Янв-24 11:16 
Ceph can be very slow when not properly compiled with TCMalloc support.

Где в оригинале говорится что нужно отключить tcmalloc?


"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 22-Янв-24 11:24 
Нашел, да есть такое.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Мухорчатый , 22-Янв-24 22:19 
Хотел тут на редосе ceph запустить. Не суперпроизводительный, а самый обыкновенный. Угадайте - получилось или нет? ))))

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 23-Янв-24 10:54 
чо за reDOS ?

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено fyjybv , 23-Янв-24 16:10 
Ты, наверное, не пользовался cehpadm (так как система не входит в список официально поддерживаемых платформ), а ставил из официального репозитория с помошью встроенного пакетного менеджера и поэтому у тебя все получилось.
Ведь ни один нормальный человек не станет компилять из tar.gz.

"Опыт создания хранилища Ceph c пропускной способностью тебиб..."
Отправлено Аноним , 24-Янв-24 00:01 
А накатит патчик из новости про планировщик (https://www.opennet.me/opennews/art.shtml?num=60474) - ещё быстрее полетит)