Столкнулся на работе с низкой производительностью дисковой подсистемы. Стал анализировать отчеты nmon, так вот наткнулся на интересную особенность, периодически в отчете, в disk busy проскакивает значение -1, сразу после значения в 100%. Что это значит?
> Столкнулся на работе с низкой производительностью дисковой подсистемы. Стал анализировать
> отчеты nmon, так вот наткнулся на интересную особенность, периодически в отчете,
> в disk busy проскакивает значение -1, сразу после значения в 100%.
> Что это значит?aix пропатчен?
oslevel -s
>> Столкнулся на работе с низкой производительностью дисковой подсистемы. Стал анализировать
>> отчеты nmon, так вот наткнулся на интересную особенность, периодически в отчете,
>> в disk busy проскакивает значение -1, сразу после значения в 100%.
>> Что это значит?
> aix пропатчен?
> oslevel -s5300-11-06-1107
На сайте IBM пишут, что доступна версия 5300-12-04-1119.
>>> Столкнулся на работе с низкой производительностью дисковой подсистемы. Стал анализировать
>>> отчеты nmon, так вот наткнулся на интересную особенность, периодически в отчете,
>>> в disk busy проскакивает значение -1, сразу после значения в 100%.
>>> Что это значит?
>> aix пропатчен?
>> oslevel -s
> 5300-11-06-1107
> На сайте IBM пишут, что доступна версия 5300-12-04-1119.было бы хорошо, для начала пропатчить.
что за сторидж?
>>>> Столкнулся на работе с низкой производительностью дисковой подсистемы. Стал анализировать
>>>> отчеты nmon, так вот наткнулся на интересную особенность, периодически в отчете,
>>>> в disk busy проскакивает значение -1, сразу после значения в 100%.
>>>> Что это значит?
>>> aix пропатчен?
>>> oslevel -s
>> 5300-11-06-1107
>> На сайте IBM пишут, что доступна версия 5300-12-04-1119.
> было бы хорошо, для начала пропатчить.
> что за сторидж?Хорошо, попробую обновить...хуже не будет.
> Столкнулся на работе с низкой производительностью дисковой подсистемы. Стал анализировать
> отчеты nmon, так вот наткнулся на интересную особенность, периодически в отчете,
> в disk busy проскакивает значение -1, сразу после значения в 100%.
> Что это значит?Не Oracle часом на AIX гоняете?
>> Столкнулся на работе с низкой производительностью дисковой подсистемы. Стал анализировать
>> отчеты nmon, так вот наткнулся на интересную особенность, периодически в отчете,
>> в disk busy проскакивает значение -1, сразу после значения в 100%.
>> Что это значит?
> Не Oracle часом на AIX гоняете?Именно его. А как это влияет?
>>> Столкнулся на работе с низкой производительностью дисковой подсистемы. Стал анализировать
>>> отчеты nmon, так вот наткнулся на интересную особенность, периодически в отчете,
>>> в disk busy проскакивает значение -1, сразу после значения в 100%.
>>> Что это значит?
>> Не Oracle часом на AIX гоняете?
> Именно его. А как это влияет?Прямым образом. Тюнинг AIX под Oracle не делали? В каком режиме смонтированы партиции с датафайлами, контрольниками и логами вашей БД? Разносили ли на разные диски Redo/Undo/Archivelog/Controlfile/Datafile? Сколько контрольников у вашей БД?
Запустите statspack на вашей БД, все будет яснее.
>[оверквотинг удален]
>>>> отчеты nmon, так вот наткнулся на интересную особенность, периодически в отчете,
>>>> в disk busy проскакивает значение -1, сразу после значения в 100%.
>>>> Что это значит?
>>> Не Oracle часом на AIX гоняете?
>> Именно его. А как это влияет?
> Прямым образом. Тюнинг AIX под Oracle не делали? В каком режиме смонтированы
> партиции с датафайлами, контрольниками и логами вашей БД? Разносили ли на
> разные диски Redo/Undo/Archivelog/Controlfile/Datafile? Сколько контрольников у вашей
> БД?
> Запустите statspack на вашей БД, все будет яснее.Из тюнинга делали: экспериментировали с aioservers и с монтированием ФС в режиме dio. Это делали все до меня, я, если честно, еще не совсем разобрался во всем, т.к. работаю несколько дней всего:) Вообще там сделали так: несколько дисков объединили в рейд с целью получения одного большого диска, на нем создали vg, на которой есть раздел под логи и для всего остального - второй раздел.
>[оверквотинг удален]
>> партиции с датафайлами, контрольниками и логами вашей БД? Разносили ли на
>> разные диски Redo/Undo/Archivelog/Controlfile/Datafile? Сколько контрольников у вашей
>> БД?
>> Запустите statspack на вашей БД, все будет яснее.
> Из тюнинга делали: экспериментировали с aioservers и с монтированием ФС в режиме
> dio. Это делали все до меня, я, если честно, еще не
> совсем разобрался во всем, т.к. работаю несколько дней всего:) Вообще там
> сделали так: несколько дисков объединили в рейд с целью получения одного
> большого диска, на нем создали vg, на которой есть раздел под
> логи и для всего остального - второй раздел.Кстати, aioserver запущен в количестве 500 штук, при том что процессоров на сервере 16 (8 реальных, 8 виртуальных), на сайте IBM находил статейку, что количество aioserver должно быть равным двукратному количеству процессоров. Может в эту сторону покопать?
>[оверквотинг удален]
>> Из тюнинга делали: экспериментировали с aioservers и с монтированием ФС в режиме
>> dio. Это делали все до меня, я, если честно, еще не
>> совсем разобрался во всем, т.к. работаю несколько дней всего:) Вообще там
>> сделали так: несколько дисков объединили в рейд с целью получения одного
>> большого диска, на нем создали vg, на которой есть раздел под
>> логи и для всего остального - второй раздел.
> Кстати, aioserver запущен в количестве 500 штук, при том что процессоров на
> сервере 16 (8 реальных, 8 виртуальных), на сайте IBM находил статейку,
> что количество aioserver должно быть равным двукратному количеству процессоров. Может
> в эту сторону покопать?Когда я в последний раз говорил с саппортом IBM из Словении, они рекомендовали установить число AIO серверов по формуле NCPU*4 И увеличить число запросов на асинхронный ввод/вывод обрабатываемое одним сервером(сказали подобрать эмпирически это число). Файловые системы я так понимаю у вас JFS2? Для JFS2 режим DIO объявлен устаревшим и использоваться не должен, он только для JFSv1. Для вас нужен режим CIO. Из скольки LUN собран RAID и откуда взяты эти LUN? Если LUN взяты с самого сервера ( встроенные диски сервера), то я бы порекомендовал отказаться от их использования ввиду крайней тормознутости встроенных в сервер контроллеров. Также для распараллеливания записи на диски можно увеличить число DBW-процессов в оракле.
> Когда я в последний раз говорил с саппортом IBM из Словении, они
> рекомендовали установить число AIO серверов по формуле NCPU*4 И увеличить число
> запросов на асинхронный ввод/вывод обрабатываемое одним сервером(сказали подобрать эмпирически
> это число). Файловые системы я так понимаю у вас JFS2? Для
> JFS2 режим DIO объявлен устаревшим и использоваться не должен, он только
> для JFSv1. Для вас нужен режим CIO. Из скольки LUN собран
> RAID и откуда взяты эти LUN? Если LUN взяты с самого
> сервера ( встроенные диски сервера), то я бы порекомендовал отказаться от
> их использования ввиду крайней тормознутости встроенных в сервер контроллеров. Также для
> распараллеливания записи на диски можно увеличить число DBW-процессов в оракле.Да, ФС JFS2. С AIO серверами и CIO будем экспериментировать, а что касается дисков то они, вроде бы, работают через Fibre Channel. Более подоробно я даже сказать сейчас не могу, ибо попросту не знаю...
>[оверквотинг удален]
>> это число). Файловые системы я так понимаю у вас JFS2? Для
>> JFS2 режим DIO объявлен устаревшим и использоваться не должен, он только
>> для JFSv1. Для вас нужен режим CIO. Из скольки LUN собран
>> RAID и откуда взяты эти LUN? Если LUN взяты с самого
>> сервера ( встроенные диски сервера), то я бы порекомендовал отказаться от
>> их использования ввиду крайней тормознутости встроенных в сервер контроллеров. Также для
>> распараллеливания записи на диски можно увеличить число DBW-процессов в оракле.
> Да, ФС JFS2. С AIO серверами и CIO будем экспериментировать, а что
> касается дисков то они, вроде бы, работают через Fibre Channel. Более
> подоробно я даже сказать сейчас не могу, ибо попросту не знаю...Дисковый массив не производства IBM случаем? У нас были проблемы с их стораджем DS6800. Оно тоже подключалось через SAN по оптике. После продолжительного копания и выяснения причин, получилось что оно больше 30 мб/с псп дать не может, ибо умеет только RAID5, о котором Oracle во всех гайдах говорит - ни когда не используйте, отсутствием кеша под чтение/запись ( точнее он там есть,но на наши 48 дисков его там было всего-лишь около 500 мб). Как мы не бились - оттюнинговать нам даже саппорт из IBM (со Словении приезжали дядьки) не смогли.
Поговорите с вашим DBA, пусть запустит STATSPACK на вашей БД и проанализирует результаты. Так оно будет проще выяснить причину, чем тыкать пальцем в небо.
>[оверквотинг удален]
> копания и выяснения причин, получилось что оно больше 30 мб/с псп
> дать не может, ибо умеет только RAID5, о котором Oracle во
> всех гайдах говорит - ни когда не используйте, отсутствием кеша
> под чтение/запись ( точнее он там есть,но на наши 48 дисков
> его там было всего-лишь около 500 мб). Как мы не бились
> - оттюнинговать нам даже саппорт из IBM (со Словении приезжали дядьки)
> не смогли.
> Поговорите с вашим DBA, пусть запустит STATSPACK на вашей БД и проанализирует
> результаты. Так оно будет проще выяснить причину, чем тыкать пальцем в
> небо.Спасибо за советы:) Будем работать, а если еще вопросы возникнут, то я сразу в гугл, а потом сюда)))