forum.opennet.ru

Форум Разговоры, обсуждение новостей
Вариант для распечатки		Пред. тема \| След. тема
Режим отображения отдельной подветви беседы		[ Отслеживать ]

Оглавление

Компания Red Hat преобразовала проект Gluster в сообщество р..., opennews (??), 06-Май-13, (0) [смотреть все]

если упоминули Ruby то сразу понятно что не нужно, потому что тормоз, Аноним (-), 21:19 , 06-Май-13, (1) –8 //

А люди за этот тормоз деньги еще платят, да , Аноним (-), 21:32 , 06-Май-13, (2) –1
Так сейчас, когда код открыт, может кто то решится выпилить руби и заменить его , Аноним (-), 22:02 , 06-Май-13, (4) –4 //

Впервые вижу таких добрых бизнесменов Купили проект, который им заведомо неинте, Аноним (-), 23:07 , 06-Май-13, (5) +4 //

С конкуренциию подавляют скупкой конкурентов или патентов , Deffic (?), 23:48 , 06-Май-13, (9) –2

Замечательная версия У нее всего один недостаток - непонятно, с каким продуктом, Аноним (-), 01:26 , 07-Май-13, (15) +1

gpfs или как там называется кластер от redhat с жестко зашитым ограничением в , linux must _RIP_ (?), 08:36 , 07-Май-13, (28) –4

GPFS - это у IBM IBM General Parallel File System А у RedHat это GFS2 , SkyRE (ok), 11:29 , 07-Май-13, (39)

Вот только GFS2 - ни разу не конкурент для gluster Потому что GFS - это только , Аноним (-), 13:09 , 07-Май-13, (49)

В GPFS тоже нет избыточности Но и GPFS и GFS2 можно построить на RAID-ах , SkyRE (ok), 14:30 , 07-Май-13, (56)

А вот в Gluster есть избыточность, при чем _сетевая_ Это вам не рейд , Аноним (-), 18:24 , 07-Май-13, (72)
Вообще-то, в GPFS есть прозрачная синхронная репликация между нодами как данных,, Аноним (-), 19:12 , 07-Май-13, (82)
ну здрасте, а нейтив рейд , Михрютка (ok), 20:19 , 07-Май-13, (84)

Я строил кластер на 5-х рейдах без всякой репликации, т к места много нужно был, SkyRE (ok), 13:28 , 08-Май-13, (117) –1

там было другое здесь же в новостях с год назад - патентный тролль подал в суд, Алексей (??), 12:43 , 07-Май-13, (47) +2

Годы шли, а любители запихнуть код gluster в проприетарный продукт так и не нахо, Аноним (-), 13:15 , 07-Май-13, (52)

Шапка купила, но это еще не значит что оно им действительно нужно, в конце концо, Аноним (-), 12:25 , 07-Май-13, (45)

Шапка и Oracle - это как небо и земля Достаточно сравнить модели развития Linux, Аноним (-), 18:29 , 07-Май-13, (74) +1

да да, достаточно сравнить MySQL закрыл разве что тестовый набор и то до того к, linux must _RIP_ (?), 23:54 , 07-Май-13, (91) –1

Про ksplice можно забывать Если до оракла оно худо-бедно умело всё, то после ор, AlexAT (ok), 23:55 , 07-Май-13, (92) +1

скажите спасибо redhat и его защите бизнеса Показали пример как это можно делать, linux must _RIP_ (?), 10:07 , 08-Май-13, (107) –1

А то, что она через fuse работает, никого не смущает , Аноним (-), 23:08 , 06-Май-13, (6) +1
Если бы ты потрудился открыть документацию, то ты бы узнал, что сами вычисления , Аноним (-), 05:41 , 07-Май-13, (23) +3
по RoR ruby не судят, Aquarius (ok), 20:53 , 07-Май-13, (85)

Этот гластер - поделие, тьфу на него еще раз, мучался с ним два года Сейчас на , Alrond (ok), 23:10 , 06-Май-13, (7) //

Да, yжac Пробовали Ceph, но у него к CPU больше требования Спасибо за наводку, , t28 (?), 12:21 , 07-Май-13, (44) –1

то, что вы мучал ись - не говорит о плохой реализация glusterFS Moose тоже не с, midori (ok), 23:42 , 06-Май-13, (8)
а в роли какой фс его использовать может нфс да нет стандартный нфс куда ста, Sw00p aka Jerom (?), 00:03 , 07-Май-13, (10) –1 //

вот и красношляпники тоже посмотрели, почесали репу на тему где его использоват, ананис (?), 00:20 , 07-Май-13, (11) –1 //

узнают об этом из следующего релиза федоры ну, на крайний, дебиана , Andrey Mitrofanov (?), 00:25 , 07-Май-13, (12) +1
Аналогичных систем всего 2-3 Люстра, сабж и HDFS Другие или не активно развива, VoDA (ok), 00:28 , 07-Май-13, (14) //

POHMELFS , anonymous (??), 05:27 , 07-Май-13, (20) +2

это которая позволяет писать в 1 файл только одному клиенту которая принципиаль, linux must _RIP_ (?), 08:50 , 07-Май-13, (32) –1

ceph Которая кстати в ядро уже включена , anonymous (??), 08:23 , 07-Май-13, (27) +1
это не конкурент люстре - совсем совсем другие требования , linux must _RIP_ (?), 08:37 , 07-Май-13, (29) –1
Lustre VS Glusterнебо и земля не стоит сравнивать, Sw00p aka Jerom (?), 18:52 , 12-Май-13, (128)

И по общей сложности поддержки - тоже , AlexAT (ok), 07:14 , 13-Май-13, (131)

Аналогичная история произошла лет 20 назад - тогда редхат никак не мог придумать, Аноним (-), 01:30 , 07-Май-13, (17) +1 //

Про 20 лет почти угадал Компания начала свою работу в 1993 году, В 2003, Andrey Mitrofanov (?), 07:26 , 07-Май-13, (25)

вот вот - в 2003 году - redhat закрыла итоговый результат и стала продавать ег, linux must _RIP_ (?), 08:51 , 07-Май-13, (33) –5

Т е до 2003 года они ничего не продавали и жили на средства спонсоров , Аноним (-), 09:30 , 07-Май-13, (35)

если посмотреть на капитализацию и доходы RedHat - она резко пошла в гору - когд, linux must _RIP_ (?), 11:36 , 07-Май-13, (41) –6

И что именно всё Вам название centos жмёт Ибо от RHEL он названием и копирайто, pkdr (?), 12:28 , 07-Май-13, (46) +2

О да, а закрытые для постороннего репозитории RHEL тоже не существуют Или обнов, linux must _RIP_ (?), 13:07 , 07-Май-13, (48) –6

Знатное пригорание седалища у ораклышей Оно того стоило, определенно , Аноним (-), 13:13 , 07-Май-13, (51) +7

если вы не заметили у Oracle - свое ядро, а ядро redhat они все равно без ограни, linux must _RIP_ (?), 16:09 , 07-Май-13, (58) –4

Тогда почему именно у ораклят так пригорает анус , Аноним (-), 18:14 , 07-Май-13, (68) +3
Наверное, все дело в том, что именно оракл пытается свое чудо-инновационное тырп, Аноним (-), 18:22 , 07-Май-13, (71) +1
наверно не в курсе - но ядро у них свое полностью Стоило бы учить матчасть, реб, linux must _RIP_ (?), 19:06 , 07-Май-13, (78) –2
видимо потому что по себе судишь , linux must _RIP_ (?), 19:06 , 07-Май-13, (79) –1

к слову - это была такая защита их бизнеса в чем они сознавались - Red Hat repo, linux must _RIP_ (?), 16:14 , 07-Май-13, (61) –3

Так-так GPL и LKML - это уже синонимы Респект им и уважуха Пусть эффективные м, Аноним (-), 18:17 , 07-Май-13, (69) +1
красиво передернул возьми пирожек - LKML был приведен как пример каким был исхо, linux must _RIP_ (?), 19:05 , 07-Май-13, (77) –1

Поставить пакет из CentOS в систему с RHEL это прекрасно То, что они бинарно, AlexAT (ok), 07:28 , 08-Май-13, (101) +1

пошли отмазки - то есть нельзя вот прям так взять пакет который создан был для, linux must _RIP_ (?), 10:08 , 08-Май-13, (108) –1

Пакет, который создан был для RHEL , и пакет из RHEL - разница есть Всё, что , AlexAT (ok), 10:26 , 08-Май-13, (109) +1
Я пел о том что CentOS нефига не совместим с RedHat - в первую очередь по тому, linux must _RIP_ (?), 10:36 , 08-Май-13, (111) –1
С какого бы перепугу он не был совместим Весь софт под редхат, модули ядра и пр, AlexAT (ok), 15:55 , 08-Май-13, (120) +1
Это штатная функция ядра, вайн там сбоку Совсем путаете , profalex (?), 10:43 , 08-Май-13, (112) +1
а я и не говорю что это не штатная функция ядра - я говорю что в составе wine бы, linux must _RIP_ (?), 11:32 , 08-Май-13, (113) –1
Да не было никакого специального модуля Просто настройками ядра задавалось, что, Псевдоним (ok), 18:45 , 09-Май-13, (124)

Ваганыч, залогинься , Аноним (-), 13:11 , 07-Май-13, (50) +1

Подлизывай дальше шапке А она пусть продолжает дальше гадить другим открытым пр, linux must _RIP_ (?), 16:18 , 07-Май-13, (62) –2

Напомни-ка, что там с barn door применительно к MySQL , Аноним (-), 18:13 , 07-Май-13, (67) –1

это такой способ съезжать с темы но вот продолжим обсуждение поведения redhat -, linux must _RIP_ (?), 19:01 , 07-Май-13, (75) –1

Я их люблю не за бесплатные лицензии, а токмо за то, что они твой сpаный оракл щ, Аноним (-), 18:27 , 07-Май-13, (73) +4

смешной ты - оракл не мой, но лично он мне проблем не доставлял - в отличии от, linux must _RIP_ (?), 19:02 , 07-Май-13, (76) –1

Так ты продукт redhat для сообщества Да, дествительно, как-то незавершённо , Led (ok), 04:39 , 08-Май-13, (97)

плюсануть карму за NNN бабла сам придумал, или подсказал кто , Клыкастый (ok), 09:06 , 07-Май-13, (34)

так оно уровня люстры - где то рядом конечно с ocfs2 не сравнимо - для этого , VoDA (ok), 00:25 , 07-Май-13, (13) //

уровня люстры хм вы скажите - оно как с RDMA как оно на скоростях 4Gb s по с, linux must _RIP_ (?), 08:39 , 07-Май-13, (30) –1 //

К слову, поддержка RDMA у glusterfs есть , etw (ok), 13:23 , 07-Май-13, (54)

в fuse - , linux must _RIP_ (?), 16:09 , 07-Май-13, (59) –2

man ibverbs, Аноним (-), 17:23 , 07-Май-13, (64) +2

ibverbs в userland хотя да - что-то пробывали, и даже новый тип сокетов для это, linux must _RIP_ (?), 18:08 , 07-Май-13, (66) –1

В общем-то, ibverbs - это всего лишь API, причем в линуксе раскручивающееся напр, Аноним (-), 19:23 , 07-Май-13, (83) +1

да нет не спутал config RDS tristate The RDS Protocol EXPERIMENTAL , linux must _RIP_ (?), 23:47 , 07-Май-13, (86)

К тому же, fuse - это интерфейс для взаимодействия с VFS к слову, не единственн, Аноним (-), 17:26 , 07-Май-13, (65) +1

к слову fuse не только отвечает за vfs aka md операции но интерфейс взаимодейс, linux must _RIP_ (?), 23:49 , 07-Май-13, (87) –1

GlusterFS упирается в round-trip, FUSE там не помеха Тащить в пространство ядра, AlexAT (ok), 23:51 , 07-Май-13, (88) +1

но люстра и IBM это же сделали причем в обоих случаях красиво вынеся сетевой , linux must _RIP_ (?), 09:50 , 08-Май-13, (102) –1

Вы хотя бы примерно представляете себе структуру кластера для люстры А для gpfs, Аноним (-), 01:27 , 07-Май-13, (16) +1 //

вам пруфлинки нужны http paranoidchaos livejournal com 2111 html да прекрас, Sw00p aka Jerom (?), 19:00 , 12-Май-13, (129)

gpfs тоже не без греха Пару лет назад ее пытались использовать в одном хостинге, Аноним (-), 05:31 , 07-Май-13, (21) –1 //

Начиная с версии 3 3 она уже гораздо получше будет 3 3,3 4,3 5 развиваются и фи, SkyRE (ok), 11:40 , 07-Май-13, (43) //

Вообще-то, я именно о скалакси и рассказывал если мне не изменяет память, там и, Аноним (-), 13:34 , 07-Май-13, (55)

Да, и чем потом сказка кончилась - http habrahabr ru post 146971 с Xen - Hyp, SkyRE (ok), 14:52 , 07-Май-13, (57) –1

Эмм скалакси до сих пор на Xen На Hyper-V совершенно другой проект компании , Аноним (-), 17:02 , 07-Май-13, (63)

Я сильно и не вчитывался что у них там сейчас, да и с хостингом никоим образом н, SkyRE (ok), 13:36 , 08-Май-13, (118)

нормальный - это какой где в тамошнем узкие места А чем в скалакси она неправил, Псевдоним (ok), 20:26 , 08-Май-13, (122)

в моих тестах gpfs была намного стабилнее люстры , Sw00p aka Jerom (?), 19:02 , 12-Май-13, (130) –1

Используем Gluster в роли подложки для кластеризованного бэкенда , AlexAT (ok), 07:34 , 07-Май-13, (26) //

И как , Влад (??), 09:51 , 07-Май-13, (36) //

Работает Тормозновато с кучей мелких файлов, но репликация не подводила ни разу, AlexAT (ok), 10:12 , 07-Май-13, (38) +2

lustre не умеет реплицировать данные Эт эдакий raid0 по сети единственный досто, vadikgo (ok), 02:28 , 07-Май-13, (18) +2 //

Кстати, в РФ RBD-кластер в промышленной эксплуатации использует проект Flops, Аноним (-), 05:35 , 07-Май-13, (22) //

Это объясняет жалобы пользователей на форуме http forum flops ru в стиле Молод, vadikgo (ok), 11:31 , 07-Май-13, (40)

не умеет да и не надо было Хотя если почитаете материалы последнего LUG - то п, linux must _RIP_ (?), 08:43 , 07-Май-13, (31) –2 //

А какие способы гарантированного recovery кроме репликации вам известны , AlexAT (ok), 10:08 , 07-Май-13, (37) //

гарантированного а можно описать в каких случаях это вообще надо - а то Cray о, linux must _RIP_ (?), 11:38 , 07-Май-13, (42) –1

Если мы что-то не поддерживаем, значит, вам это не нужно , Аноним (-), 13:16 , 07-Май-13, (53)

к слову вариант для тех кому нужно - поддерживается - , linux must _RIP_ (?), 16:10 , 07-Май-13, (60) –1

Тогда зачем так старательно доказывать, что оно не нужно Может, лучше сначала п, Аноним (-), 18:19 , 07-Май-13, (70) +2

старательно я лишь сослался на опыт Cray - вполне себе а как у вас запекло , linux must _RIP_ (?), 19:08 , 07-Май-13, (80) –2
кстати raid5 6 вполне могут обеспечить надежность без полной репликации данных -, linux must _RIP_ (?), 19:09 , 07-Май-13, (81) –2

Простите, как быть с вашим RAIDx, если потеряется вся нода целиком Две ноды В , AlexAT (ok), 23:53 , 07-Май-13, (90) +1

нода целиком это как разу все диски рейд возьмут и умрут для мисье секрет что, linux must _RIP_ (?), 00:01 , 08-Май-13, (93) –2

Это очень просто Например, сгорел контроллер или baseboard Я даже больше скажу, Аноним (-), 01:54 , 08-Май-13, (95)

Достаточно сдохнуть батарейке в рейд контроллере Сразу-же отключается кэш на за, vadikgo (ok), 02:24 , 08-Май-13, (96)
Ну уж не всё так страшно Современные контроллеры прекрасно работают без ба, AlexAT (ok), 07:20 , 08-Май-13, (99) +1
Если случится такое - то выход из строя ноды будет самое легкое что произойдет , linux must _RIP_ (?), 10:00 , 08-Май-13, (105) –1
Если ноды зарезервированы, то это будет единственное, что произойдет На сложност, Псевдоним (ok), 11:51 , 08-Май-13, (114)

Это элементарно умерла мать память RAID-контроллер порвали оптику патчкорд до, AlexAT (ok), 07:17 , 08-Май-13, (98) +1

и что JBOD SAS и active-passive резервирование на соседную материнку какое-то , linux must _RIP_ (?), 09:55 , 08-Май-13, (103) –2
В течение часа для телекома, например - это ни хрена не допустимый простой Ост, AlexAT (ok), 10:03 , 08-Май-13, (106) +2
- смешной ты так что там на счет JBOD SAS и disk backplane к 2 разным материн, linux must _RIP_ (?), 10:30 , 08-Май-13, (110) –1
А что там насчет стоимости полного резевирования каждого компонента в сравнении , Псевдоним (ok), 12:00 , 08-Май-13, (115)
Не каждого active-passive я не зря указал не хватит - HSM - вполне может справ, linux must _RIP_ (?), 12:24 , 08-Май-13, (116) –1
active-standby или active-active - не важно Стоимость железа, поддерживающего т, Псевдоним (ok), 20:04 , 08-Май-13, (121) +1
А как насчет отказа backplane Или таки как насчет пожара в ДЦ Развертываемся и, AlexAT (ok), 15:53 , 08-Май-13, (119) +2
лежит рядом готовый к замене Замена отработана и тп Для выработавщих ресурс пр, linux must _RIP_ (?), 08:19 , 10-Май-13, (126) –3
Поздравляю с даунтаймом А даунтайма быть не должно Ага, а когда сдохнет product, Псевдоним (ok), 23:54 , 10-Май-13, (127) +2
еще раз почитайте что такое HSM в момент _обращения_ данные прийдут с ленты про, linux must _RIP_ (?), 12:29 , 13-Май-13, (132) –2
Т е придется еще держать кластер из ленточных накопителей связанную с ними ди, AlexAT (ok), 07:19 , 14-Май-13, (133) +2
Еще раз латентностные характеристики ленточного хранилища позволят ему выдержат, Псевдоним (??), 12:05 , 15-Май-13, (135)

Хорошая компания с хорошей практикой покупки проектов открытых 124 закрытых , Ph0zzy (ok), 06:57 , 07-Май-13, (24) //

Жалко ksplice проморгали Сейчас он в какое-то УГ превратился под эгидой одной и, AlexAT (ok), 23:51 , 07-Май-13, (89) +2 //

Это вы так о redhat отзываетесь да эти делали что могли что бы усложнить рабо, linux must _RIP_ (?), 00:03 , 08-Май-13, (94) –3 //

Для тупых ksplice сейчас под эгидой oracle То, что получилось в результате поку, AlexAT (ok), 07:22 , 08-Май-13, (100) +2

для очень тупых - как только redhat не смогло купить ksplice - так сразу начало , linux must _RIP_ (?), 09:57 , 08-Май-13, (104) –1

Многовато постов твоих, я бежала за вами три дня чтобы сказать как вы мне безра, Аноним (-), 22:29 , 08-Май-13, (123) +4

переход на личности а по теме что сказать то хотел , linux must _RIP_ (?), 08:17 , 10-Май-13, (125) –2

глупое вы Страшило, отправляйтесь к Гудвину , midori (ok), 10:57 , 15-Май-13, (134)

Сообщения [Сортировка по времени | RSS]

31. "Компания Red Hat преобразовала проект Gluster в сообщество р..." –2 +/–

Сообщение от linux must _RIP_ (?), 07-Май-13, 08:43

> lustre не умеет реплицировать данные. Эт эдакий raid0 по сети.
не умеет. да и не надо было. Хотя если почитаете материалы последнего LUG - то проект network raid реанимировали.
вы лучше скажите - как cephfs и gluster на скоростях гигабайты в секунду по ib?
как у них проблемы с recovery - правда ли что cephfs - надеется только на репликацию - и требует в 2 раза больше дисков и электричества для хранения того же объема данных (hint - 12P дискового массива жрут очень дофига, что бы удваивать)

Ответить | Правка | К родителю #18 | Наверх | Cообщить модератору

37. "Компания Red Hat преобразовала проект Gluster в сообщество р..." +/–

Сообщение от AlexAT (ok), 07-Май-13, 10:08

> как у них проблемы с recovery - правда ли что cephfs -
> надеется только на репликацию - и требует в 2 раза больше
А какие способы гарантированного recovery кроме репликации вам известны?

Ответить | Правка | Наверх | Cообщить модератору

42. "Компания Red Hat преобразовала проект Gluster в сообщество р..." –1 +/–

Сообщение от linux must _RIP_ (?), 07-Май-13, 11:38

>> как у них проблемы с recovery - правда ли что cephfs -
>> надеется только на репликацию - и требует в 2 раза больше
> А какие способы гарантированного recovery кроме репликации вам известны?
гарантированного? а можно описать в каких случаях это вообще надо :-)
а то Cray об этом не в курсе и не использует recovery вообще :)
А так.. хотя бы журналирование данных и метаопераций.

Ответить | Правка | Наверх | Cообщить модератору

53. "Компания Red Hat преобразовала проект Gluster в сообщество р..." +/–

Сообщение от Аноним (-), 07-Май-13, 13:16

> гарантированного? а можно описать в каких случаях это вообще надо :-)
"Если мы что-то не поддерживаем, значит, вам это не нужно"

Ответить | Правка | Наверх | Cообщить модератору

60. "Компания Red Hat преобразовала проект Gluster в сообщество р..." –1 +/–

Сообщение от linux must _RIP_ (?), 07-Май-13, 16:10

>> гарантированного? а можно описать в каких случаях это вообще надо :-)
> "Если мы что-то не поддерживаем, значит, вам это не нужно"
к слову вариант для тех кому нужно - поддерживается :-)

Ответить | Правка | Наверх | Cообщить модератору

70. "Компания Red Hat преобразовала проект Gluster в сообщество р..." +2 +/–

Сообщение от Аноним (-), 07-Май-13, 18:19

>>> гарантированного? а можно описать в каких случаях это вообще надо :-)
>> "Если мы что-то не поддерживаем, значит, вам это не нужно"
> к слову вариант для тех кому нужно - поддерживается :-)
Тогда зачем так старательно доказывать, что оно не нужно? Может, лучше сначала погуглить и выяснить, в каких именно аспектах требуется ваша яростная защита?

Ответить | Правка | Наверх | Cообщить модератору

80. "Компания Red Hat преобразовала проект Gluster в сообщество р..." –2 +/–

Сообщение от linux must _RIP_ (?), 07-Май-13, 19:08

>>>> гарантированного? а можно описать в каких случаях это вообще надо :-)
>>> "Если мы что-то не поддерживаем, значит, вам это не нужно"
>> к слову вариант для тех кому нужно - поддерживается :-)
> Тогда зачем так старательно доказывать, что оно не нужно? Может, лучше сначала
> погуглить и выяснить, в каких именно аспектах требуется ваша яростная защита?
старательно? я лишь сослался на опыт Cray ;-) вполне себе.. а как у вас запекло...

Ответить | Правка | Наверх | Cообщить модератору

81. "Компания Red Hat преобразовала проект Gluster в сообщество р..." –2 +/–

Сообщение от linux must _RIP_ (?), 07-Май-13, 19:09

>>>> гарантированного? а можно описать в каких случаях это вообще надо :-)
>>> "Если мы что-то не поддерживаем, значит, вам это не нужно"
>> к слову вариант для тех кому нужно - поддерживается :-)
> Тогда зачем так старательно доказывать, что оно не нужно? Может, лучше сначала
> погуглить и выяснить, в каких именно аспектах требуется ваша яростная защита?
кстати raid5/6 вполне могут обеспечить надежность без полной репликации данных - на этом был (и есть) основан люстровый network raid.

Ответить | Правка | К родителю #70 | Наверх | Cообщить модератору

90. "Компания Red Hat преобразовала проект Gluster в сообщество р..." +1 +/–

Сообщение от AlexAT (ok), 07-Май-13, 23:53

> кстати raid5/6 вполне могут обеспечить надежность без полной репликации данных - на
> этом был (и есть) основан люстровый network raid.
Простите, как быть с вашим RAIDx, если потеряется вся нода целиком? Две ноды? В случае Gluster всё проще - там можно реплицироваться на любое число нод. At expense of performance.

Ответить | Правка | Наверх | Cообщить модератору

93. "Компания Red Hat преобразовала проект Gluster в сообщество р..." –2 +/–

Сообщение от linux must _RIP_ (?), 08-Май-13, 00:01

>> кстати raid5/6 вполне могут обеспечить надежность без полной репликации данных - на
>> этом был (и есть) основан люстровый network raid.
> Простите, как быть с вашим RAIDx, если потеряется вся нода целиком? Две
> ноды? В случае Gluster всё проще - там можно реплицироваться на
> любое число нод. At expense of performance.
нода целиком? это как? разу все диски рейд возьмут и умрут? для мисье секрет что raid5/6 может востанавливаться на воткнутый hot spare винт?
может не стоит покупать винчестеры по 20 баксов - а стоит посмотреть на серьезные вещи?
hint. наши железянщики рассказывают что не все марки одинаково хороши для рейдов + ext4 причем разница в скорости может достигать в разы - при одних и тех же параметрах md.

Ответить | Правка | Наверх | Cообщить модератору

95. "Компания Red Hat преобразовала проект Gluster в сообщество р..." +/–

Сообщение от Аноним (-), 08-Май-13, 01:54

> нода целиком?
Это очень просто. Например, сгорел контроллер или baseboard. Я даже больше скажу, ноды могут сразу целыми стойками из строя выходить даже при резервировании питания по независимым линиям: например, на одно из линий падает напряжение (трансформатор на подстанции взял и накрылся) во время пиковой нагрузки, и через второй PDU на другой линии в стойке ток поднялся выше расчетного значения, в итоге, второй PDU в стойке тоже отключился. И привет, стойка обесточена.
Подобных сценариев можно массу на ходу придумать. Именно поэтому равноправные узлы кластера в некоторых местах принято разносить по разным стойкам. Или, например, использовать несколько датацентров, строя архитектуру таким образом, чтобы выход из строя одного датацентра не прервал работу сервиса.
А ты: "диски, диски..."
> это как? разу все диски рейд возьмут и умрут?
Например, произошел сбой драйвера контроллера или сам контроллер сдох.

Ответить | Правка | Наверх | Cообщить модератору

96. "Компания Red Hat преобразовала проект Gluster в сообщество р..." +/–

Сообщение от vadikgo (ok), 08-Май-13, 02:24

> Например, произошел сбой драйвера контроллера или сам контроллер сдох.
Достаточно сдохнуть батарейке в рейд контроллере. Сразу-же отключается кэш на запись и весь массив становится неработоспособен.

Ответить | Правка | Наверх | Cообщить модератору

99. "Компания Red Hat преобразовала проект Gluster в сообщество р..." +1 +/–

Сообщение от AlexAT (ok), 08-Май-13, 07:20

>> Например, произошел сбой драйвера контроллера или сам контроллер сдох.
> Достаточно сдохнуть батарейке в рейд контроллере. Сразу-же отключается кэш на запись и
> весь массив становится неработоспособен.
Ну... уж не всё так страшно :) Современные контроллеры прекрасно работают без батарейки, в режиме кеширования write-through

Ответить | Правка | Наверх | Cообщить модератору

105. "Компания Red Hat преобразовала проект Gluster в сообщество р..." –1 +/–

Сообщение от linux must _RIP_ (?), 08-Май-13, 10:00

>> нода целиком?
> Это очень просто. Например, сгорел контроллер или baseboard. Я даже больше скажу,
> ноды могут сразу целыми стойками из строя выходить даже при резервировании
> питания по независимым линиям: например, на одно из линий падает напряжение
> (трансформатор на подстанции взял и накрылся) во время пиковой нагрузки, и
> через второй PDU на другой линии в стойке ток поднялся выше
> расчетного значения, в итоге, второй PDU в стойке тоже отключился.
> И привет, стойка обесточена.
Если случится такое - то выход из строя ноды будет самое легкое что произойдет. Худшее - очередной атлантис сдохнет на орбите или биологический/ядерный эксперемент накроется :-)
Это будет веселее.

> Подобных сценариев можно массу на ходу придумать. Именно поэтому равноправные узлы кластера
> в некоторых местах принято разносить по разным стойкам. Или, например, использовать
> несколько датацентров, строя архитектуру таким образом, чтобы выход из строя одного
> датацентра не прервал работу сервиса.
:-) у вас слишком простой сценарий.
> А ты: "диски, диски..."
>> это как? разу все диски рейд возьмут и умрут?
откройте для себя disk backplane с JBOD контролером.
hint. так и вижу как фирма расчитывающая спецэфекты для черного рыцаря (ну или любую другую что они делали) - ходит через океан на другой DC за файлами с кадрами.

Ответить | Правка | К родителю #95 | Наверх | Cообщить модератору

114. "Компания Red Hat преобразовала проект Gluster в сообщество р..." +/–

Сообщение от Псевдоним (ok), 08-Май-13, 11:51

>Если случится такое - то выход из строя ноды будет самое легкое что произойдет.
Если ноды зарезервированы, то это будет единственное, что произойдет.
>:-) у вас слишком простой сценарий.
На сложность претензий не было, скорее, наоборот, это первое, что в голову пришло :)
>откройте для себя disk backplane с JBOD контролером.
В общем-то, тупой HBA вместо RAID-контроллера от сбоя драйвера этого HBA не защищает. И уж тем более, не предотвращает простой, если диски подключены через единственный контроллер.
А резервировать каждый компонент сервера, и все равно с отсутствием гарантии, что нода не может стать недоступна, не факт, что дешевле, чем поставить 2 менее дорогих ноды с меньшим уровнем внутреннего резервирования.
>hint. так и вижу как фирма расчитывающая спецэфекты для черного рыцаря (ну или любую другую что они делали) - ходит через океан на другой DC за файлами с кадрами.
Эта фирма не ходит, а многие другие ходят, чтобы не допустить глобального простоя сервиса в случае катастрофы. Я о том тебе и говорю, что задачи и требования разные бывают и считать, что всем в качестве средства резервирования подойдут исключительно RAID-массивы, а большего никому не требуется - наивно. Тот же гугл, например, почему-то, одни рейд-массивы не устраивают.

Ответить | Правка | Наверх | Cообщить модератору

98. "Компания Red Hat преобразовала проект Gluster в сообщество р..." +1 +/–

Сообщение от AlexAT (ok), 08-Май-13, 07:17

> нода целиком? это как?
Это элементарно: умерла мать/память/RAID-контроллер / порвали оптику/патчкорд до FCoE-коммутатора / etc. Т.е. выпала вся нода целиком.
> мисье секрет что raid5/6 может востанавливаться на воткнутый hot spare винт?
Постановка задачи однозначная: выпала НОДА, а не "все винты умерли", и нечего додумывать. Не важно, что там случилось. Пожар в DC был, может быть, и умерло всё, а не только винты. Или питалово отключили просто (тогда данные целы, но толку от них чуть менее, чем 0). Главное - нода потеряна.
Итак, что будем делать? И как поможет RAID1/5/6/100500 в данном случае?

Ответить | Правка | К родителю #93 | Наверх | Cообщить модератору

103. "Компания Red Hat преобразовала проект Gluster в сообщество р..." –2 +/–

Сообщение от linux must _RIP_ (?), 08-Май-13, 09:55

>> нода целиком? это как?
> Это элементарно: умерла мать/память/RAID-контроллер / порвали оптику/патчкорд до FCoE-коммутатора
> / etc. Т.е. выпала вся нода целиком.
и что? JBOD SAS и active-passive резервирование на соседную материнку. какое-то время проживет - при этом в течении часа сдохшее поменяют.

>> мисье секрет что raid5/6 может востанавливаться на воткнутый hot spare винт?
> Постановка задачи однозначная: выпала НОДА, а не "все винты умерли", и нечего
> додумывать. Не важно, что там случилось. Пожар в DC был, может
> быть, и умерло всё, а не только винты. Или питалово отключили
> просто (тогда данные целы, но толку от них чуть менее, чем
> 0). Главное - нода потеряна.
> Итак, что будем делать? И как поможет RAID1/5/6/100500 в данном случае?
у вас слишком маленькие объемы данных что бы защищать это реплицированием - и слишком маленькие скорости - что бы работало в разнесенных географически DC. когда у вас начнут требовать скорости 2.5Gb/s на запись per node и 4GB/s на чтение и объемы данных per node - от 20P тогда поговорим о реплицировании и разнесении по разным датацентрам.

hint. если что-то с питанием - страдает все - а не только 1 нода :-) пожар ровно так же. Но все это сильно искуственные условия.

Ответить | Правка | Наверх | Cообщить модератору

106. "Компания Red Hat преобразовала проект Gluster в сообщество р..." +2 +/–

Сообщение от AlexAT (ok), 08-Май-13, 10:03

> и что? JBOD SAS и active-passive резервирование на соседную материнку. какое-то время
> проживет - при этом в течении часа сдохшее поменяют.
"В течение часа" для телекома, например - это ни хрена не допустимый простой.
Остальное - вода. Кто-то делает, кто-то ищет отговорки вида "вот когда начнут".

Ответить | Правка | Наверх | Cообщить модератору

110. "Компания Red Hat преобразовала проект Gluster в сообщество р..." –1 +/–

Сообщение от linux must _RIP_ (?), 08-Май-13, 10:30

>> и что? JBOD SAS и active-passive резервирование на соседную материнку. какое-то время
>> проживет - при этом в течении часа сдохшее поменяют.
> "В течение часа" для телекома, например - это ни хрена не допустимый
> простой.
> Остальное - вода. Кто-то делает, кто-то ищет отговорки вида "вот когда начнут".
:-) смешной ты. так что там на счет JBOD SAS и disk backplane к 2 разным материнкам, с резервированием по блокам питания и сетевым? с дополнительными блоками защиты на входе в каждую стойку и в целом всей комнаты? Телеком всегда на таком экономил.
ну и отдельной электростанцией :-)
hint. японский кластер из top100 (не помню уже его теперешнюю позицию) - потреблял около 6-10Мегаватт*ч. Да да - я посмотрю как будет резервироваться такая мощность :-) и в какую копеечку этот резерв обойдется вам.
hint2. репликация может (и частично должна) делаться другими средствами - а не FS. в частности HSM - хорошо "реплицирует" FS на ленточки.

Ответить | Правка | К родителю #106 | Наверх | Cообщить модератору

115. "Компания Red Hat преобразовала проект Gluster в сообщество р..." +/–

Сообщение от Псевдоним (ok), 08-Май-13, 12:00

>>> и что? JBOD SAS и active-passive резервирование на соседную материнку. какое-то время
>>> проживет - при этом в течении часа сдохшее поменяют.
>> "В течение часа" для телекома, например - это ни хрена не допустимый
>> простой.
>> Остальное - вода. Кто-то делает, кто-то ищет отговорки вида "вот когда начнут".
> :-) смешной ты. так что там на счет JBOD SAS и disk
> backplane к 2 разным материнкам, с резервированием по блокам питания и
> сетевым? с дополнительными блоками защиты на входе в каждую стойку и
> в целом всей комнаты?
А что там насчет стоимости полного резевирования каждого компонента в сравнении с стоимостью второй обычной ноды?
> ну и отдельной электростанцией :-)
Отдельной подстанцией. С распределением нагрузки в энергосети между разными электростанциями энергетики сами справляются.
> hint2. репликация может (и частично должна) делаться другими средствами - а не
> FS. в частности HSM - хорошо "реплицирует" FS на ленточки.
А что там с доступностью и актуальностью данных, хранящихся на лентах? У меня такое чувство, что ты путаешь цели бэкапов и high availability.

Ответить | Правка | К родителю #110 | Наверх | Cообщить модератору

116. "Компания Red Hat преобразовала проект Gluster в сообщество р..." –1 +/–

Сообщение от linux must _RIP_ (?), 08-Май-13, 12:24

> А что там насчет стоимости полного резевирования каждого компонента в сравнении с стоимостью второй обычной ноды?
Не каждого. active-passive я не зря указал.

> Отдельной подстанцией. С распределением нагрузки в энергосети между разными электростанциями энергетики сами справляются.
не хватит :-)
> А что там с доступностью и актуальностью данных, хранящихся на лентах? У меня такое чувство, что ты путаешь цели бэкапов и high availability.
HSM - вполне может справиться в real time с заливанием на ленты. главное сделать правильно.
для FS это выглядит как обычный файл при доступе к которому возникает задержка (если так настроено).
ps. вариантов может быть чуть более чем дофига - и без гемороя с репликацией и контролем целостности в этом случае
pps. о parity declustering я в курсе.

Ответить | Правка | К родителю #115 | Наверх | Cообщить модератору

121. "Компания Red Hat преобразовала проект Gluster в сообщество р..." +1 +/–

Сообщение от Псевдоним (ok), 08-Май-13, 20:04

>> А что там насчет стоимости полного резевирования каждого компонента в сравнении с стоимостью второй обычной ноды?
> Не каждого. active-passive я не зря указал.
active-standby или active-active - не важно. Стоимость железа, поддерживающего такую конфигурацию, выше, порой, намного. А отсутствие SPOF на нижних уровнях архитектуры опять же не гарантируется. Проще, дешевле и надежнее при построении масштабного сервиса сразу предусматривать отказоустойчивую архитектуру, а не молиться на фичастые полки и RAID.
>> Отдельной подстанцией. С распределением нагрузки в энергосети между разными электростанциями энергетики сами справляются.
> не хватит :-)
Вот прям всякому, кому необходима отказоустойчивость, и не хватит? :)
>> А что там с доступностью и актуальностью данных, хранящихся на лентах? У меня такое чувство, что ты путаешь цели бэкапов и high availability.
> HSM - вполне может справиться в real time с заливанием на ленты.
А с production-нагрузкой он справится? Еще раз, не путай бэкапы и отказоустойчивость всей системы. Они нацелены на решение разных проблем.
> главное сделать правильно.
> для FS это выглядит как обычный файл при доступе к которому возникает
> задержка (если так настроено).
Да пусть этот архив как угодно выглядит, хоть gopher-ресурсом прикидывается. Если при выходе из стоя одной ноды ты лезешь в библиотеку за резервной копией, а сервис при этом лежит - это уже не система для широкой промышленной эксплуатации. В лучшем случае, это нишевое решение для работы специальных условиях, а в худшем - локалхост школьника Пети (это еще умный школьник, если он бэкапы делает).
> ps. вариантов может быть чуть более чем дофига - и без гемороя
> с репликацией и контролем целостности в этом случае
Любое распределенное хранилище построено на компромиссе между условиями CAP-теоремы. Либо оно не распределенное и является одним большим SPOF.

Ответить | Правка | К родителю #116 | Наверх | Cообщить модератору

119. "Компания Red Hat преобразовала проект Gluster в сообщество р..." +2 +/–

Сообщение от AlexAT (ok), 08-Май-13, 15:53

> :-) смешной ты. так что там на счет JBOD SAS и disk
> backplane к 2 разным материнкам
А как насчет отказа backplane?
Или таки как насчет пожара в ДЦ? Развертываемся из бэкапа с ленточек несколько суток?
Я предпочту онлайновую репликацию. Неважно, hot или hot standby.

Ответить | Правка | К родителю #110 | Наверх | Cообщить модератору

126. "Компания Red Hat преобразовала проект Gluster в сообщество р..." –3 +/–

Сообщение от linux must _RIP_ (?), 10-Май-13, 08:19

>> :-) смешной ты. так что там на счет JBOD SAS и disk
>> backplane к 2 разным материнкам
> А как насчет отказа backplane?
лежит рядом готовый к замене. Замена отработана и тп. Для выработавщих ресурс проводится предварительная замена.

> Или таки как насчет пожара в ДЦ? Развертываемся из бэкапа с ленточек
> несколько суток?
> Я предпочту онлайновую репликацию. Неважно, hot или hot standby.
если сгорит ДЦ у NASA - то потери от данных - будут самым малым что может быть.
Тоже самое можно сказать про Лос-Аламос (ака sandia.gov), или Ок Ридж.
опять же HSM - прозрачно перекинет данные с FS на ленту.

Ответить | Правка | К родителю #119 | Наверх | Cообщить модератору

127. "Компания Red Hat преобразовала проект Gluster в сообщество р..." +2 +/–

Сообщение от Псевдоним (ok), 10-Май-13, 23:54

>лежит рядом готовый к замене. Замена отработана и тп. Для выработавщих ресурс проводится предварительная замена.
Поздравляю с даунтаймом. А даунтайма быть не должно.
>опять же HSM - прозрачно перекинет данные с FS на ленту.
Ага, а когда сдохнет production-сервер, все будет лежать, а ты будешь восстанавливать данные с ленты. Нафига такое счастье?

У меня складывается такое впечатление, что ты нам тут растолковываешь, как сделать так, чтобы данные не потерялись, а мы тебе толкуем о том, что даже простой сервиса - это уже ЧП, а потеря данных - за гранью добра и зла.

Ответить | Правка | К родителю #126 | Наверх | Cообщить модератору

132. "Компания Red Hat преобразовала проект Gluster в сообщество р..." –2 +/–

Сообщение от linux must _RIP_ (?), 13-Май-13, 12:29

еще раз почитайте что такое HSM.
в момент _обращения_ данные прийдут с ленты. прозрачно для приложения.

Ответить | Правка | К родителю #127 | Наверх | Cообщить модератору

133. "Компания Red Hat преобразовала проект Gluster в сообщество р..." +2 +/–

Сообщение от AlexAT (ok), 14-Май-13, 07:19

> еще раз почитайте что такое HSM.
> в момент _обращения_ данные прийдут с ленты. прозрачно для приложения.
Т.е. придется еще держать кластер из ленточных накопителей + связанную с ними дисковую полку + робота для загрузки? Выйдет в десятки раз дороже. Спасибо, у нас задача - не попилить на инфраструктуре, а решить проблему отказоустойчивости с минимальными затратами и максимальным эффектом.

Ответить | Правка | К родителю #132 | Наверх | Cообщить модератору

135. "Компания Red Hat преобразовала проект Gluster в сообщество р..." +/–

Сообщение от Псевдоним (??), 15-Май-13, 12:05

Еще раз: латентностные характеристики ленточного хранилища позволят ему выдержать production-нагрузку?

Ответить | Правка | К родителю #132 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема

Партнёры:

Хостинг:

Закладки на сайте
Проследить за страницей

Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру


	31. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	–2 +/–
	Сообщение от linux must _RIP_ (?), 07-Май-13, 08:43
	> lustre не умеет реплицировать данные. Эт эдакий raid0 по сети. не умеет. да и не надо было. Хотя если почитаете материалы последнего LUG - то проект network raid реанимировали. вы лучше скажите - как cephfs и gluster на скоростях гигабайты в секунду по ib? как у них проблемы с recovery - правда ли что cephfs - надеется только на репликацию - и требует в 2 раза больше дисков и электричества для хранения того же объема данных (hint - 12P дискового массива жрут очень дофига, что бы удваивать)
	Ответить \| Правка \| К родителю #18 \| Наверх \| Cообщить модератору


	37. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	+/–
	Сообщение от AlexAT (ok), 07-Май-13, 10:08
	> как у них проблемы с recovery - правда ли что cephfs - > надеется только на репликацию - и требует в 2 раза больше А какие способы гарантированного recovery кроме репликации вам известны?
	Ответить \| Правка \| Наверх \| Cообщить модератору


	42. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	–1 +/–
	Сообщение от linux must _RIP_ (?), 07-Май-13, 11:38
	>> как у них проблемы с recovery - правда ли что cephfs - >> надеется только на репликацию - и требует в 2 раза больше > А какие способы гарантированного recovery кроме репликации вам известны? гарантированного? а можно описать в каких случаях это вообще надо :-) а то Cray об этом не в курсе и не использует recovery вообще :) А так.. хотя бы журналирование данных и метаопераций.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	53. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	+/–
	Сообщение от Аноним (-), 07-Май-13, 13:16
	> гарантированного? а можно описать в каких случаях это вообще надо :-) "Если мы что-то не поддерживаем, значит, вам это не нужно"
	Ответить \| Правка \| Наверх \| Cообщить модератору


	60. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	–1 +/–
	Сообщение от linux must _RIP_ (?), 07-Май-13, 16:10
	>> гарантированного? а можно описать в каких случаях это вообще надо :-) > "Если мы что-то не поддерживаем, значит, вам это не нужно" к слову вариант для тех кому нужно - поддерживается :-)
	Ответить \| Правка \| Наверх \| Cообщить модератору


	70. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	+2 +/–
	Сообщение от Аноним (-), 07-Май-13, 18:19
	>>> гарантированного? а можно описать в каких случаях это вообще надо :-) >> "Если мы что-то не поддерживаем, значит, вам это не нужно" > к слову вариант для тех кому нужно - поддерживается :-) Тогда зачем так старательно доказывать, что оно не нужно? Может, лучше сначала погуглить и выяснить, в каких именно аспектах требуется ваша яростная защита?
	Ответить \| Правка \| Наверх \| Cообщить модератору


	80. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	–2 +/–
	Сообщение от linux must _RIP_ (?), 07-Май-13, 19:08
	>>>> гарантированного? а можно описать в каких случаях это вообще надо :-) >>> "Если мы что-то не поддерживаем, значит, вам это не нужно" >> к слову вариант для тех кому нужно - поддерживается :-) > Тогда зачем так старательно доказывать, что оно не нужно? Может, лучше сначала > погуглить и выяснить, в каких именно аспектах требуется ваша яростная защита? старательно? я лишь сослался на опыт Cray ;-) вполне себе.. а как у вас запекло...
	Ответить \| Правка \| Наверх \| Cообщить модератору


	81. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	–2 +/–
	Сообщение от linux must _RIP_ (?), 07-Май-13, 19:09
	>>>> гарантированного? а можно описать в каких случаях это вообще надо :-) >>> "Если мы что-то не поддерживаем, значит, вам это не нужно" >> к слову вариант для тех кому нужно - поддерживается :-) > Тогда зачем так старательно доказывать, что оно не нужно? Может, лучше сначала > погуглить и выяснить, в каких именно аспектах требуется ваша яростная защита? кстати raid5/6 вполне могут обеспечить надежность без полной репликации данных - на этом был (и есть) основан люстровый network raid.
	Ответить \| Правка \| К родителю #70 \| Наверх \| Cообщить модератору


	90. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	+1 +/–
	Сообщение от AlexAT (ok), 07-Май-13, 23:53
	> кстати raid5/6 вполне могут обеспечить надежность без полной репликации данных - на > этом был (и есть) основан люстровый network raid. Простите, как быть с вашим RAIDx, если потеряется вся нода целиком? Две ноды? В случае Gluster всё проще - там можно реплицироваться на любое число нод. At expense of performance.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	93. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	–2 +/–
	Сообщение от linux must _RIP_ (?), 08-Май-13, 00:01
	>> кстати raid5/6 вполне могут обеспечить надежность без полной репликации данных - на >> этом был (и есть) основан люстровый network raid. > Простите, как быть с вашим RAIDx, если потеряется вся нода целиком? Две > ноды? В случае Gluster всё проще - там можно реплицироваться на > любое число нод. At expense of performance. нода целиком? это как? разу все диски рейд возьмут и умрут? для мисье секрет что raid5/6 может востанавливаться на воткнутый hot spare винт? может не стоит покупать винчестеры по 20 баксов - а стоит посмотреть на серьезные вещи? hint. наши железянщики рассказывают что не все марки одинаково хороши для рейдов + ext4 причем разница в скорости может достигать в разы - при одних и тех же параметрах md.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	95. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	+/–
	Сообщение от Аноним (-), 08-Май-13, 01:54
	> нода целиком? Это очень просто. Например, сгорел контроллер или baseboard. Я даже больше скажу, ноды могут сразу целыми стойками из строя выходить даже при резервировании питания по независимым линиям: например, на одно из линий падает напряжение (трансформатор на подстанции взял и накрылся) во время пиковой нагрузки, и через второй PDU на другой линии в стойке ток поднялся выше расчетного значения, в итоге, второй PDU в стойке тоже отключился. И привет, стойка обесточена. Подобных сценариев можно массу на ходу придумать. Именно поэтому равноправные узлы кластера в некоторых местах принято разносить по разным стойкам. Или, например, использовать несколько датацентров, строя архитектуру таким образом, чтобы выход из строя одного датацентра не прервал работу сервиса. А ты: "диски, диски..." > это как? разу все диски рейд возьмут и умрут? Например, произошел сбой драйвера контроллера или сам контроллер сдох.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	96. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	+/–
	Сообщение от vadikgo (ok), 08-Май-13, 02:24
	> Например, произошел сбой драйвера контроллера или сам контроллер сдох. Достаточно сдохнуть батарейке в рейд контроллере. Сразу-же отключается кэш на запись и весь массив становится неработоспособен.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	99. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	+1 +/–
	Сообщение от AlexAT (ok), 08-Май-13, 07:20
	>> Например, произошел сбой драйвера контроллера или сам контроллер сдох. > Достаточно сдохнуть батарейке в рейд контроллере. Сразу-же отключается кэш на запись и > весь массив становится неработоспособен. Ну... уж не всё так страшно :) Современные контроллеры прекрасно работают без батарейки, в режиме кеширования write-through
	Ответить \| Правка \| Наверх \| Cообщить модератору


	105. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	–1 +/–
	Сообщение от linux must _RIP_ (?), 08-Май-13, 10:00
	>> нода целиком? > Это очень просто. Например, сгорел контроллер или baseboard. Я даже больше скажу, > ноды могут сразу целыми стойками из строя выходить даже при резервировании > питания по независимым линиям: например, на одно из линий падает напряжение > (трансформатор на подстанции взял и накрылся) во время пиковой нагрузки, и > через второй PDU на другой линии в стойке ток поднялся выше > расчетного значения, в итоге, второй PDU в стойке тоже отключился. > И привет, стойка обесточена. Если случится такое - то выход из строя ноды будет самое легкое что произойдет. Худшее - очередной атлантис сдохнет на орбите или биологический/ядерный эксперемент накроется :-) Это будет веселее. > Подобных сценариев можно массу на ходу придумать. Именно поэтому равноправные узлы кластера > в некоторых местах принято разносить по разным стойкам. Или, например, использовать > несколько датацентров, строя архитектуру таким образом, чтобы выход из строя одного > датацентра не прервал работу сервиса. :-) у вас слишком простой сценарий. > А ты: "диски, диски..." >> это как? разу все диски рейд возьмут и умрут? откройте для себя disk backplane с JBOD контролером. hint. так и вижу как фирма расчитывающая спецэфекты для черного рыцаря (ну или любую другую что они делали) - ходит через океан на другой DC за файлами с кадрами.
	Ответить \| Правка \| К родителю #95 \| Наверх \| Cообщить модератору


	114. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	+/–
	Сообщение от Псевдоним (ok), 08-Май-13, 11:51
	>Если случится такое - то выход из строя ноды будет самое легкое что произойдет. Если ноды зарезервированы, то это будет единственное, что произойдет. >:-) у вас слишком простой сценарий. На сложность претензий не было, скорее, наоборот, это первое, что в голову пришло :) >откройте для себя disk backplane с JBOD контролером. В общем-то, тупой HBA вместо RAID-контроллера от сбоя драйвера этого HBA не защищает. И уж тем более, не предотвращает простой, если диски подключены через единственный контроллер. А резервировать каждый компонент сервера, и все равно с отсутствием гарантии, что нода не может стать недоступна, не факт, что дешевле, чем поставить 2 менее дорогих ноды с меньшим уровнем внутреннего резервирования. >hint. так и вижу как фирма расчитывающая спецэфекты для черного рыцаря (ну или любую другую что они делали) - ходит через океан на другой DC за файлами с кадрами. Эта фирма не ходит, а многие другие ходят, чтобы не допустить глобального простоя сервиса в случае катастрофы. Я о том тебе и говорю, что задачи и требования разные бывают и считать, что всем в качестве средства резервирования подойдут исключительно RAID-массивы, а большего никому не требуется - наивно. Тот же гугл, например, почему-то, одни рейд-массивы не устраивают.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	98. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	+1 +/–
	Сообщение от AlexAT (ok), 08-Май-13, 07:17
	> нода целиком? это как? Это элементарно: умерла мать/память/RAID-контроллер / порвали оптику/патчкорд до FCoE-коммутатора / etc. Т.е. выпала вся нода целиком. > мисье секрет что raid5/6 может востанавливаться на воткнутый hot spare винт? Постановка задачи однозначная: выпала НОДА, а не "все винты умерли", и нечего додумывать. Не важно, что там случилось. Пожар в DC был, может быть, и умерло всё, а не только винты. Или питалово отключили просто (тогда данные целы, но толку от них чуть менее, чем 0). Главное - нода потеряна. Итак, что будем делать? И как поможет RAID1/5/6/100500 в данном случае?
	Ответить \| Правка \| К родителю #93 \| Наверх \| Cообщить модератору


	103. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	–2 +/–
	Сообщение от linux must _RIP_ (?), 08-Май-13, 09:55
	>> нода целиком? это как? > Это элементарно: умерла мать/память/RAID-контроллер / порвали оптику/патчкорд до FCoE-коммутатора > / etc. Т.е. выпала вся нода целиком. и что? JBOD SAS и active-passive резервирование на соседную материнку. какое-то время проживет - при этом в течении часа сдохшее поменяют. >> мисье секрет что raid5/6 может востанавливаться на воткнутый hot spare винт? > Постановка задачи однозначная: выпала НОДА, а не "все винты умерли", и нечего > додумывать. Не важно, что там случилось. Пожар в DC был, может > быть, и умерло всё, а не только винты. Или питалово отключили > просто (тогда данные целы, но толку от них чуть менее, чем > 0). Главное - нода потеряна. > Итак, что будем делать? И как поможет RAID1/5/6/100500 в данном случае? у вас слишком маленькие объемы данных что бы защищать это реплицированием - и слишком маленькие скорости - что бы работало в разнесенных географически DC. когда у вас начнут требовать скорости 2.5Gb/s на запись per node и 4GB/s на чтение и объемы данных per node - от 20P тогда поговорим о реплицировании и разнесении по разным датацентрам. hint. если что-то с питанием - страдает все - а не только 1 нода :-) пожар ровно так же. Но все это сильно искуственные условия.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	106. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	+2 +/–
	Сообщение от AlexAT (ok), 08-Май-13, 10:03
	> и что? JBOD SAS и active-passive резервирование на соседную материнку. какое-то время > проживет - при этом в течении часа сдохшее поменяют. "В течение часа" для телекома, например - это ни хрена не допустимый простой. Остальное - вода. Кто-то делает, кто-то ищет отговорки вида "вот когда начнут".
	Ответить \| Правка \| Наверх \| Cообщить модератору


	110. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	–1 +/–
	Сообщение от linux must _RIP_ (?), 08-Май-13, 10:30
	>> и что? JBOD SAS и active-passive резервирование на соседную материнку. какое-то время >> проживет - при этом в течении часа сдохшее поменяют. > "В течение часа" для телекома, например - это ни хрена не допустимый > простой. > Остальное - вода. Кто-то делает, кто-то ищет отговорки вида "вот когда начнут". :-) смешной ты. так что там на счет JBOD SAS и disk backplane к 2 разным материнкам, с резервированием по блокам питания и сетевым? с дополнительными блоками защиты на входе в каждую стойку и в целом всей комнаты? Телеком всегда на таком экономил. ну и отдельной электростанцией :-) hint. японский кластер из top100 (не помню уже его теперешнюю позицию) - потреблял около 6-10Мегаватт*ч. Да да - я посмотрю как будет резервироваться такая мощность :-) и в какую копеечку этот резерв обойдется вам. hint2. репликация может (и частично должна) делаться другими средствами - а не FS. в частности HSM - хорошо "реплицирует" FS на ленточки.
	Ответить \| Правка \| К родителю #106 \| Наверх \| Cообщить модератору


	115. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	+/–
	Сообщение от Псевдоним (ok), 08-Май-13, 12:00
	>>> и что? JBOD SAS и active-passive резервирование на соседную материнку. какое-то время >>> проживет - при этом в течении часа сдохшее поменяют. >> "В течение часа" для телекома, например - это ни хрена не допустимый >> простой. >> Остальное - вода. Кто-то делает, кто-то ищет отговорки вида "вот когда начнут". > :-) смешной ты. так что там на счет JBOD SAS и disk > backplane к 2 разным материнкам, с резервированием по блокам питания и > сетевым? с дополнительными блоками защиты на входе в каждую стойку и > в целом всей комнаты? А что там насчет стоимости полного резевирования каждого компонента в сравнении с стоимостью второй обычной ноды? > ну и отдельной электростанцией :-) Отдельной подстанцией. С распределением нагрузки в энергосети между разными электростанциями энергетики сами справляются. > hint2. репликация может (и частично должна) делаться другими средствами - а не > FS. в частности HSM - хорошо "реплицирует" FS на ленточки. А что там с доступностью и актуальностью данных, хранящихся на лентах? У меня такое чувство, что ты путаешь цели бэкапов и high availability.
	Ответить \| Правка \| К родителю #110 \| Наверх \| Cообщить модератору


	116. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	–1 +/–
	Сообщение от linux must _RIP_ (?), 08-Май-13, 12:24
	> А что там насчет стоимости полного резевирования каждого компонента в сравнении с стоимостью второй обычной ноды? Не каждого. active-passive я не зря указал. > Отдельной подстанцией. С распределением нагрузки в энергосети между разными электростанциями энергетики сами справляются. не хватит :-) > А что там с доступностью и актуальностью данных, хранящихся на лентах? У меня такое чувство, что ты путаешь цели бэкапов и high availability. HSM - вполне может справиться в real time с заливанием на ленты. главное сделать правильно. для FS это выглядит как обычный файл при доступе к которому возникает задержка (если так настроено). ps. вариантов может быть чуть более чем дофига - и без гемороя с репликацией и контролем целостности в этом случае pps. о parity declustering я в курсе.
	Ответить \| Правка \| К родителю #115 \| Наверх \| Cообщить модератору


	121. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	+1 +/–
	Сообщение от Псевдоним (ok), 08-Май-13, 20:04
	>> А что там насчет стоимости полного резевирования каждого компонента в сравнении с стоимостью второй обычной ноды? > Не каждого. active-passive я не зря указал. active-standby или active-active - не важно. Стоимость железа, поддерживающего такую конфигурацию, выше, порой, намного. А отсутствие SPOF на нижних уровнях архитектуры опять же не гарантируется. Проще, дешевле и надежнее при построении масштабного сервиса сразу предусматривать отказоустойчивую архитектуру, а не молиться на фичастые полки и RAID. >> Отдельной подстанцией. С распределением нагрузки в энергосети между разными электростанциями энергетики сами справляются. > не хватит :-) Вот прям всякому, кому необходима отказоустойчивость, и не хватит? :) >> А что там с доступностью и актуальностью данных, хранящихся на лентах? У меня такое чувство, что ты путаешь цели бэкапов и high availability. > HSM - вполне может справиться в real time с заливанием на ленты. А с production-нагрузкой он справится? Еще раз, не путай бэкапы и отказоустойчивость всей системы. Они нацелены на решение разных проблем. > главное сделать правильно. > для FS это выглядит как обычный файл при доступе к которому возникает > задержка (если так настроено). Да пусть этот архив как угодно выглядит, хоть gopher-ресурсом прикидывается. Если при выходе из стоя одной ноды ты лезешь в библиотеку за резервной копией, а сервис при этом лежит - это уже не система для широкой промышленной эксплуатации. В лучшем случае, это нишевое решение для работы специальных условиях, а в худшем - локалхост школьника Пети (это еще умный школьник, если он бэкапы делает). > ps. вариантов может быть чуть более чем дофига - и без гемороя > с репликацией и контролем целостности в этом случае Любое распределенное хранилище построено на компромиссе между условиями CAP-теоремы. Либо оно не распределенное и является одним большим SPOF.
	Ответить \| Правка \| К родителю #116 \| Наверх \| Cообщить модератору


	119. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	+2 +/–
	Сообщение от AlexAT (ok), 08-Май-13, 15:53
	> :-) смешной ты. так что там на счет JBOD SAS и disk > backplane к 2 разным материнкам А как насчет отказа backplane? Или таки как насчет пожара в ДЦ? Развертываемся из бэкапа с ленточек несколько суток? Я предпочту онлайновую репликацию. Неважно, hot или hot standby.
	Ответить \| Правка \| К родителю #110 \| Наверх \| Cообщить модератору


	126. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	–3 +/–
	Сообщение от linux must _RIP_ (?), 10-Май-13, 08:19
	>> :-) смешной ты. так что там на счет JBOD SAS и disk >> backplane к 2 разным материнкам > А как насчет отказа backplane? лежит рядом готовый к замене. Замена отработана и тп. Для выработавщих ресурс проводится предварительная замена. > Или таки как насчет пожара в ДЦ? Развертываемся из бэкапа с ленточек > несколько суток? > Я предпочту онлайновую репликацию. Неважно, hot или hot standby. если сгорит ДЦ у NASA - то потери от данных - будут самым малым что может быть. Тоже самое можно сказать про Лос-Аламос (ака sandia.gov), или Ок Ридж. опять же HSM - прозрачно перекинет данные с FS на ленту.
	Ответить \| Правка \| К родителю #119 \| Наверх \| Cообщить модератору


	127. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	+2 +/–
	Сообщение от Псевдоним (ok), 10-Май-13, 23:54
	>лежит рядом готовый к замене. Замена отработана и тп. Для выработавщих ресурс проводится предварительная замена. Поздравляю с даунтаймом. А даунтайма быть не должно. >опять же HSM - прозрачно перекинет данные с FS на ленту. Ага, а когда сдохнет production-сервер, все будет лежать, а ты будешь восстанавливать данные с ленты. Нафига такое счастье? У меня складывается такое впечатление, что ты нам тут растолковываешь, как сделать так, чтобы данные не потерялись, а мы тебе толкуем о том, что даже простой сервиса - это уже ЧП, а потеря данных - за гранью добра и зла.
	Ответить \| Правка \| К родителю #126 \| Наверх \| Cообщить модератору


	132. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	–2 +/–
	Сообщение от linux must _RIP_ (?), 13-Май-13, 12:29
	еще раз почитайте что такое HSM. в момент _обращения_ данные прийдут с ленты. прозрачно для приложения.
	Ответить \| Правка \| К родителю #127 \| Наверх \| Cообщить модератору


	133. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	+2 +/–
	Сообщение от AlexAT (ok), 14-Май-13, 07:19
	> еще раз почитайте что такое HSM. > в момент _обращения_ данные прийдут с ленты. прозрачно для приложения. Т.е. придется еще держать кластер из ленточных накопителей + связанную с ними дисковую полку + робота для загрузки? Выйдет в десятки раз дороже. Спасибо, у нас задача - не попилить на инфраструктуре, а решить проблему отказоустойчивости с минимальными затратами и максимальным эффектом.
	Ответить \| Правка \| К родителю #132 \| Наверх \| Cообщить модератору


	135. "Компания Red Hat преобразовала проект Gluster в сообщество р..."	+/–
	Сообщение от Псевдоним (??), 15-Май-13, 12:05
	Еще раз: латентностные характеристики ленточного хранилища позволят ему выдержать production-нагрузку?
	Ответить \| Правка \| К родителю #132 \| Наверх \| Cообщить модератору