День добрый.Заранее прошу прощения за беспокойство и возможное повторения вопроса.
Дело в том, что я столкнулся с проблемой аттестации (verification and validation) аппаратной конфигурации серверов, которые заказчик предполагает установить в дата-центре, т.е. требуется проверить на соответствие комплектации получаемых серверов некому эталонному (или спецификации) и провести, видимо, stress testing, чтобы убедиться в отсутствии неисправных/"битых" комплектующих в серверах. Задача связана с тем, что было/будет куплено большое количество дешевых noname серверов в качестве которых приходится сомневаться.
Вопрос в том как это можно сделать с помощью открытого ПО?
Я уверен, что все большие дата-центры, Yandex/Mail.RU/etc, сборщика отечественного "железа" и проч. компании с этими проблемами сталкиваются ежедневно, но к сожалению у меня нет возможности спросить людей из них напрямую, поэтому взываю к помощи публично.
Заранее благодарен за любую помощь.
С уважением
>[оверквотинг удален]
> (или спецификации) и провести, видимо, stress testing, чтобы убедиться в отсутствии
> неисправных/"битых" комплектующих в серверах. Задача связана с тем, что было/будет куплено
> большое количество дешевых noname серверов в качестве которых приходится сомневаться.
> Вопрос в том как это можно сделать с помощью открытого ПО?
> Я уверен, что все большие дата-центры, Yandex/Mail.RU/etc, сборщика отечественного "железа"
> и проч. компании с этими проблемами сталкиваются ежедневно, но к
> сожалению у меня нет возможности спросить людей из них напрямую, поэтому
> взываю к помощи публично.
> Заранее благодарен за любую помощь.
> С уважениемРаньше считалось лучший тест - пересобрать ядро и мир на фряхе.
>[оверквотинг удален]
> (или спецификации) и провести, видимо, stress testing, чтобы убедиться в отсутствии
> неисправных/"битых" комплектующих в серверах. Задача связана с тем, что было/будет куплено
> большое количество дешевых noname серверов в качестве которых приходится сомневаться.
> Вопрос в том как это можно сделать с помощью открытого ПО?
> Я уверен, что все большие дата-центры, Yandex/Mail.RU/etc, сборщика отечественного "железа"
> и проч. компании с этими проблемами сталкиваются ежедневно, но к
> сожалению у меня нет возможности спросить людей из них напрямую, поэтому
> взываю к помощи публично.
> Заранее благодарен за любую помощь.
> С уважениемhttp://yandex.ru/search/?text=стресс%20тест%20для%20линукс&clid=9582&lr=213
http://skeletor.org.ua/?p=1062Что касается проверки комплектности -ну вы же в своем этом датацентре используете систему мониторинга да? Вот и подключите сервер к этой системе..она вам и покажет аппаратный состав сервера.
Ну или скриптами - выдернуть количество процессоров, памяти, дисков...
вообще подходец конечно интересный - покупаем незнамо чего у незнамо кого :)
пысы: сейчас вообще буратин много развелось - кто серваки из гуано собирает, кто локалки на CCA/CCS UTP строит ... каждый страдает геморроем по своему :)
> вообще подходец конечно интересный - покупаем незнамо чего у незнамо кого :)Да, это не совсем понятно, ведь все равно каждый сервер будет руками устанавливаться в стойку..соответственно человек будет его подключать- он и увидит его параметры...и запустит на нем стресс-тест...
Хотя если например они покупают сервера УЖЕ стоящие в стойках...оптом...или например это виртуальные машины...100 штук... например переводят свою инфраструктуру на отусорсинг.. все равно странно...
>[оверквотинг удален]
>> сожалению у меня нет возможности спросить людей из них напрямую, поэтому
>> взываю к помощи публично.
>> Заранее благодарен за любую помощь.
>> С уважением
> http://yandex.ru/search/?text=стресс тест для линукс&clid=9582&lr=213
> http://skeletor.org.ua/?p=1062
> Что касается проверки комплектности -ну вы же в своем этом датацентре используете
> систему мониторинга да? Вот и подключите сервер к этой системе..она вам
> и покажет аппаратный состав сервера.
> Ну или скриптами - выдернуть количество процессоров, памяти, дисков...Большое спасибо за ссылки --- я их знаю.
Вопрос, в том есть ли уже готовые решения/шаблоны, который позволят не писать своих скриптов полностью.
>[оверквотинг удален]
> т.е. требуется проверить на соответствие комплектации получаемых серверов некому эталонному
> (или спецификации) и провести, видимо, stress testing, чтобы убедиться в отсутствии
> неисправных/"битых" комплектующих в серверах. Задача связана с тем, что было/будет куплено
> большое количество дешевых noname серверов в качестве которых приходится сомневаться.
> Вопрос в том как это можно сделать с помощью открытого ПО?
> Я уверен, что все большие дата-центры, Yandex/Mail.RU/etc, сборщика отечественного "железа"
> и проч. компании с этими проблемами сталкиваются ежедневно, но к
> сожалению у меня нет возможности спросить людей из них напрямую, поэтому
> взываю к помощи публично.
> Заранее благодарен за любую помощь.Вы уж отделите котлеты от мух:
1) продавец оборудования <-> покупатель
оборудование по спецификации == деньгипродавец - поставляет, покупатель - платит деньги и проверяет
Если в верхней схеме есть посредник:
продавец <-> посредник <-> покупатель
и продавец и покупатель могут возложить на посредника проверку
2) проверку осуществляет посредник или покупатель, используя сотрудников
соответствующей квалификации.Тесты - соответствующее ПО от производителя, если такое отсутствует, любое
подходящее ПО3) перед отправкой в Датацентр, можно опломбировать собственной пломбой
и утрясти это с ДатацентромSorry, какой-то плач Ярославны...
>[оверквотинг удален]
> Если в верхней схеме есть посредник:
> продавец <-> посредник <-> покупатель
> и продавец и покупатель могут возложить на посредника проверку
> 2) проверку осуществляет посредник или покупатель, используя сотрудников
> соответствующей квалификации.
> Тесты - соответствующее ПО от производителя, если такое отсутствует, любое
> подходящее ПО
> 3) перед отправкой в Датацентр, можно опломбировать собственной пломбой
> и утрясти это с Датацентром
> Sorry, какой-то плач Ярославны...Простите, но вопрос не в том, кто и за что, а в том как и чем, т.е. как провести аттестацию большого кол-ва оборудования и чем пользоваться. Дело в том, что вопрос появился, в первую очередь, из-за масштаба "ямы".
Т.о. чуть уточню вопрос:
какими утилитами для аттестации серверного "железа" Вы порекомендуете воспользоваться в случае большого их числа?
ПС: к сожалению, производитель не предоставил необх. ПО
ППС: сходные проблемы должны появляться и в случае установки кластеров, потому если кто этим занимался...
ПППС: за ссылки спасибо, я их знаю, но в случае большого числа, я не уверен, что это оптимальное решение...
> ППС: сходные проблемы должны появляться и в случае установки кластеров, потому если кто этим занимался...Я занимаюсь. Таких проблем нет :)
Ибо нет дераков строить кластер где каждая нода - уникальна.
У меня всё зелёное и под прямым углом. Два вендора, всего 4-ре модели блэйдов.
Изначально был один вендор и одна модель, но всё растёт, все изменяется.Почитай про контроль сложности проектов, там о том как не попасть в подобную яму.
Впрочем если ты уже попал ... желаю удачи! (не сарказм).
>> ППС: сходные проблемы должны появляться и в случае установки кластеров, потому если кто этим занимался...
> Я занимаюсь. Таких проблем нет :)
> Ибо нет дераков строить кластер где каждая нода - уникальна.
> У меня всё зелёное и под прямым углом. Два вендора, всего 4-ре
> модели блэйдов.
> Изначально был один вендор и одна модель, но всё растёт, все изменяется.
> Почитай про контроль сложности проектов, там о том как не попасть в
> подобную яму.
> Впрочем если ты уже попал ... желаю удачи! (не сарказм).Ноды одинаковы, но при таких объемах есть вероятность, что одна-другая придет с недоставленной памятью, одним, а не двумя процессорами или без ethernet card. Именно для этого запускается процесс валидации полученного оборудования...
> Ноды одинаковы, но при таких объемах есть вероятность, что одна-другая придет с
> недоставленной памятью, одним, а не двумя процессорами или без ethernet card.
> Именно для этого запускается процесс валидации полученного оборудования...Да бросьте Вы про объемы, вычислительные центры с кластерами и счетом, всегда
находят жирного поставщика и без проблем согласуют с ним вопросы замены, возврата
и тд и тп, и сотрудничество это обычно длительное, посему, кидалово исключается.воруете или покупаете софт, создает загрузочные:
- usb flash или cd
- записываете туда комплект софта, всякие aida64, memtest ...
- пишете bat-файли проверяете:
- физически и зрительно - человек
- используя ПО - человекНет ничего универсального, а если и есть более или менее стоящее - коммерческое.
Универсальное - это правильный заказ по спецификации у относительно честного поставщика
с которым всегда можно согласовать неувязки.
>> Ноды одинаковы, но при таких объемах есть вероятность, что одна-другая придет с
>> недоставленной памятью, одним, а не двумя процессорами или без ethernet card.
>> Именно для этого запускается процесс валидации полученного оборудования...
> Да бросьте Вы про объемы, вычислительные центры с кластерами и счетом, всегда
> находят жирного поставщика и без проблем согласуют с ним вопросы замены, возврата
> и тд и тп, и сотрудничество это обычно длительное, посему, кидалово исключается.
> воруете или покупаете софт, создает загрузочные:
> - usb flash или cdЛучше все таки по PXE загружать...
>> Ноды одинаковы, но при таких объемах есть вероятность, что одна-другая придет с
>> недоставленной памятью, одним, а не двумя процессорами или без ethernet card.
>> Именно для этого запускается процесс валидации полученного оборудования...
> Да бросьте Вы про объемы, вычислительные центры с кластерами и счетом, всегда
> находят жирного поставщика и без проблем согласуют с ним вопросы замены, возврата
> и тд и тп, и сотрудничество это обычно длительное, посему, кидалово исключается.Простите, но условия таковы каковы они есть, поэтому обсуждать это бессмысленно...
> воруете или покупаете софт, создает загрузочные:
> - usb flash или cd
> - записываете туда комплект софта, всякие aida64, memtest ...
> - пишете bat-файл
> и проверяете:
> - физически и зрительно - человек
> - используя ПО - человек
> Нет ничего универсального, а если и есть более или менее стоящее -
> коммерческое.Какие коммерческие продукты Вы имеете ввиду?
> Универсальное - это правильный заказ по спецификации у относительно честного поставщика
> с которым всегда можно согласовать неувязки.Перед согласованием их необх. выявить...
>[оверквотинг удален]
>> Я занимаюсь. Таких проблем нет :)
>> Ибо нет дераков строить кластер где каждая нода - уникальна.
>> У меня всё зелёное и под прямым углом. Два вендора, всего 4-ре
>> модели блэйдов.
>> Изначально был один вендор и одна модель, но всё растёт, все изменяется.
>> Почитай про контроль сложности проектов, там о том как не попасть в
>> подобную яму.
>> Впрочем если ты уже попал ... желаю удачи! (не сарказм).
> Ноды одинаковы, но при таких объемах есть вероятность, что одна-другая придет с
> недоставленной памятью, одним, а не двумя процессорамиЧто тут же покажет система мониторинга... :)
Хотя поскольку вы проигнорировали эту мысль- у вас что, нет системы мониторинга оборудования? Даже на каком нить нагиосе или забиксе?>или без ethernet card.
Да, мониторить по сети сервера без сетевой карты это проблема...согласен...
> Именно для этого запускается процесс валидации полученного оборудования...Обычно эта валидация проходит при приемке техники а не после того как вы эту технику поставили в стойку...
>[оверквотинг удален]
>> Ноды одинаковы, но при таких объемах есть вероятность, что одна-другая придет с
>> недоставленной памятью, одним, а не двумя процессорами
> Что тут же покажет система мониторинга... :)
> Хотя поскольку вы проигнорировали эту мысль- у вас что, нет системы мониторинга
> оборудования? Даже на каком нить нагиосе или забиксе?
>>или без ethernet card.
> Да, мониторить по сети сервера без сетевой карты это проблема...согласен...
>> Именно для этого запускается процесс валидации полученного оборудования...
> Обычно эта валидация проходит при приемке техники а не после того как
> вы эту технику поставили в стойку...Дело в том, что это pre-installation этап, т.е. да, системы мониторинга нет.
> Дело в том, что это pre-installation этап, т.е. да, системы мониторинга нет.у меня стойкое ощущение что вы не читаете ответы ...
>> Дело в том, что это pre-installation этап, т.е. да, системы мониторинга нет.
> у меня стойкое ощущение что вы не читаете ответы ...Вы не совсем правы. Я их внимательном образом читаю, но предлагаемые решения, к сожалению, не являются мне неизвестными.
Я очень надеялся, задавая вопрос, что существуют некая "серебряная" утилита, которая мне неизвестна. Я полагал, что данная задача не может не вставать в компаниях а-ля Yandex/Google/Badoo/Mail.RU, а так же Т-Платформа, Aquarius и проч., и, соответсвенно, они там ее отлили. Но либо не отлили, либо оч. секретна.
Простите за беспокойство и еще раз большое спасибо за ответы и потраченное время.
С уважением
> Я очень надеялся, задавая вопрос, что существуют некая "серебряная" утилита, которая мне
> неизвестна.это называется "синдром Windows-зависимости" ... с осложнением "кнопка-сделать-хорошо".
>> Я очень надеялся, задавая вопрос, что существуют некая "серебряная" утилита, которая мне
>> неизвестна.
> это называется "синдром Windows-зависимости" ... с осложнением "кнопка-сделать-хорошо".М.б., хотя я предполагал, что это использование стандартных/готовых утилит, а не их разработка...
Ну, да ладно )
>[оверквотинг удален]
> Вы не совсем правы. Я их внимательном образом читаю, но предлагаемые решения,
> к сожалению, не являются мне неизвестными.
> Я очень надеялся, задавая вопрос, что существуют некая "серебряная" утилита, которая мне
> неизвестна. Я полагал, что данная задача не может не вставать в
> компаниях а-ля Yandex/Google/Badoo/Mail.RU, а так же Т-Платформа, Aquarius и проч., и,
> соответсвенно, они там ее отлили. Но либо не отлили, либо оч.
> секретна.
> Простите за беспокойство и еще раз большое спасибо за ответы и потраченное
> время.
> С уважениемтакой ответ может быть лишь от специалиста, далекого от указанной области.
Ничего личного.Еще раз, из того что Вы написали, непонятно Ваше место в схеме, например:
- Вы datacenter <- принимаете оборудование для размещения -> заказчик
зачем Datacenter'у тестировать или гонять стресс-тесты на оборудовании заказчика?!Сохранность оборудования и отвественность за него Датацентра?
Акт приема-передачи, требования датацентра к оборудованию, сертифицированность,
тогда понятно, но тут необходимо обдумать что и как,
один из менее геморройных вариантов - пломба заказчика.
Это комплекс юридических и технических мер.По вашим словам, трудно понять какое место в схеме занимаете Вы и соответственно,
зона ответственности.А универсальной пилюли-теста - нет, коммерческое ПО с устройствами считывания,
маркировки - уверен, есть.Если Вы датацентр, значит плюс - автоматизированная
система учета оборудования в которую будут занесены определенные данные - БД.Образно:
- Какие данные - основа, сомневаюсь что: клавиатура - 102 кл.
Заказчик - у меня была клавиатура 105 кл!!! Подать сюды!
У меня был интегрированный IPMI!!! Неустойка.Или, допустим, Вы заказчик, не соизволили узнать требования Датацентра и привезли
оборудование не соответствующее условиям и документам Датацентра, результат
- до свидания, до новых встреч.
Смысл понятен?Не вижу проблем, позвонить, договориться о встрече с разными Датацентрами
и выяснить методику...Коммерческий Датацентр - это не хухры-мухры: технически и энергетически
сложное сооружение с соответствующим ПО и тех-устройствами для него
и c правовыми, юридическими документами.
>[оверквотинг удален]
> У меня был интегрированный IPMI!!! Неустойка.
> Или, допустим, Вы заказчик, не соизволили узнать требования Датацентра и привезли
> оборудование не соответствующее условиям и документам Датацентра, результат
> - до свидания, до новых встреч.
> Смысл понятен?
> Не вижу проблем, позвонить, договориться о встрече с разными Датацентрами
> и выяснить методику...
> Коммерческий Датацентр - это не хухры-мухры: технически и энергетически
> сложное сооружение с соответствующим ПО и тех-устройствами для него
> и c правовыми, юридическими документами.Простите, но это не важно. Все уточнения, которые Вы просите, не имеют отношения к поставленной задаче, а именно "...аттестации (verification and validation) аппаратной конфигурации серверов <...>, т.е. требуется проверить на соответствие комплектации получаемых серверов некому эталонному (или спецификации) и провести, видимо, stress testing, чтобы убедиться в отсутствии неисправных/"битых" комплектующих в серверах..."
Вопрос, не касается юридических и прочих сторон дела --- только технической.
Возможно, это всплывет позднее, но, в данный момент, это абсолютно лишнее.
>[оверквотинг удален]
>> оборудование не соответствующее условиям и документам Датацентра, результат
>> - до свидания, до новых встреч.
>> Смысл понятен?
>> Не вижу проблем, позвонить, договориться о встрече с разными Датацентрами
>> и выяснить методику...
>> Коммерческий Датацентр - это не хухры-мухры: технически и энергетически
>> сложное сооружение с соответствующим ПО и тех-устройствами для него
>> и c правовыми, юридическими документами.
> Простите, но это не важно. Все уточнения, которые Вы просите, не имеют
> отношения к поставленной задаче, а именно "...аттестации (verification and validation)я не прошу, мне все равно
> аппаратной конфигурации серверов <...>, т.е. требуется проверить на соответствие комплектации
> получаемых серверов некому эталонному (или спецификации) и провести, видимо, stress testing,
> чтобы убедиться в отсутствии неисправных/"битых" комплектующих в серверах..."
> Вопрос, не касается юридических и прочих сторон дела --- только технической.
> Возможно, это всплывет позднее, но, в данный момент, это абсолютно лишнее.Зачем тогда "verification and validation"?
(товар - деньги - товар, проверка - для юридической составляющей)Есть стресс-тесты, которыми можно убить определенное железо, так что это
отношения к "verification and validation" не имеет.Битые комплектующие, меняют по гарантии.
В соответствие с формулировкой, Вам дали более чем исчерпывающий ответ, остальное
придет на практике, удачи.
>> Дело в том, что это pre-installation этап, т.е. да, системы мониторинга нет.
> у меня стойкое ощущение что вы не читаете ответы ...судя по ответам - этот человек не имеет отношения к ИТ вообще.
задача, как ему уже было неоднократно сказано- решается элементарным скриптом написать который 10 минут,написать к нему автоматизацию- еще час-два (большая часть из которых уйдет на решение какой ширины делать колонки в отчете). Человек этого не понимает, потому что никаким образом к подобной работе отношения не имеет.
более того,тот кто будет запускать этот скрипт- похоже тоже с оборудованием дела не имел. для него этот скрипт будет мего-крутым черным ящиком.
это не плохо, но этот нюанс надо понимать, потому что ответы рассчитанные на людей "в теме" -как раз вызывают такую реакцию- он отвечает нечто, что кажется что он вообще не читает писем которые ему пишут...
>[оверквотинг удален]
> (или спецификации) и провести, видимо, stress testing, чтобы убедиться в отсутствии
> неисправных/"битых" комплектующих в серверах. Задача связана с тем, что было/будет куплено
> большое количество дешевых noname серверов в качестве которых приходится сомневаться.
> Вопрос в том как это можно сделать с помощью открытого ПО?
> Я уверен, что все большие дата-центры, Yandex/Mail.RU/etc, сборщика отечественного "железа"
> и проч. компании с этими проблемами сталкиваются ежедневно, но к
> сожалению у меня нет возможности спросить людей из них напрямую, поэтому
> взываю к помощи публично.
> Заранее благодарен за любую помощь.
> С уважениемСетевая загрузка , debian live , dmidecode, lspci, lsscsi, lsusb, lsblk, ip li, lsmod плюс отправка через curl на веб сервер решает задачу, останется сшбрать данные в табличный вид и произвесои минимальный анализ.
подготовленному человеку на 4 часа работы
>[оверквотинг удален]
>> Я уверен, что все большие дата-центры, Yandex/Mail.RU/etc, сборщика отечественного "железа"
>> и проч. компании с этими проблемами сталкиваются ежедневно, но к
>> сожалению у меня нет возможности спросить людей из них напрямую, поэтому
>> взываю к помощи публично.
>> Заранее благодарен за любую помощь.
>> С уважением
> Сетевая загрузка , debian live , dmidecode, lspci, lsscsi, lsusb, lsblk, ip
> li, lsmod плюс отправка через curl на веб сервер решает задачу,
> останется сшбрать данные в табличный вид и произвесои минимальный анализ.
> подготовленному человеку на 4 часа работыСпасибо
ocs-reports все это собирает в табличный вид.
но придется вам собирать некий дистрибутив, который вы будете грузить через PXE, в котором через скрипт в автозугрузке будет отсылаться рапорт на сервер.и еще есть
http://www.stresslinux.org/sl/
> ocs-reports все это собирает в табличный вид.
> но придется вам собирать некий дистрибутив, который вы будете грузить через PXE,
> в котором через скрипт в автозугрузке будет отсылаться рапорт на сервер.
> и еще есть
> http://www.stresslinux.org/sl/Спасибо за ссылки. Посмотрю.