Добрый день.Ищу помощи в вопросе:
Есть два сервера NTP они присылают на мои системы HP-UX два разных времени с разницей в +/- 7 секунд.
если один из NTP решит синхронизироваться с вышестоящим сервером и обнаруживает смещение то он переводит свое локальное время до вышестоящего сервера, например на +7 сек.
В этот момент на моих HP-UX ни один сервер не признается валидным для синхронизации. далее коллизии со временем (2-5 минут) проходят и мои сервера берут для синхронизации NTP сервер на угад из этих двух. это может оказаться как сервер у которого уже +7 сек так и сервер на котором все еще +0 секунд относительно моих HP-UX. с кем первее синхронизируется, того и назначает сервером NTP.
дальше происходит смешная ситуация если мои серваки выбрали NTP у которого +7сек через минуты 2-5 они тоже изменяют свое время.
дальше если текущий NTP опять изменит время на любое, мои серваки , опять сбрасывают доверие ко всем NTP и начинают процедуру проверки доверия(или как ее назвать...), могут взять за основной NTP сервер тот у которого еще не произошла доводка на +7 секунд. в итоге мои серваки через минут 5 откатывают время на -7 секунд назад.
База данных в шоке, приложения в шоке. SAP начинает спать дампы с ошибками.Как можно избежать ситуацию когда NTP сервера вот так себя ведут? разница между NTP серверами бывает достигает 7-14 секунд на протяжении 3 часов. потом опять проходит. NTP сервера не мои, я могу только направить совет тем админам, если он будет.
Заранее благодарен.
> Добрый день.
> Ищу помощи в вопросе:
> Есть два сервера NTP они присылают на мои системы HP-UX два разных
> времени с разницей в +/- 7 секунд.Увлекательно, деражите нас в курсе событий.
> Как можно избежать ситуацию когда NTP сервера вот так себя ведут? разница
Синхронизоваться с сервером, который не скачет козликом, а не с этим барахлом, элементарно же. Либо найти другой такой, либо сделать эти такими.
> между NTP серверами бывает достигает 7-14 секунд на протяжении 3 часов.
> потом опять проходит. NTP сервера не мои, я могу только направить
> совет тем админам, если он будет.Тебе совет не заниматься чужими проблемами (вариант1 выше). pool.ntp.org не? Да, у самого провайдер :/ блокирует.
Им Совет - заняться администрированием сервиса. Ну, там, повыяснять причины, попытаться сформулировать, чего можно подкрутить, сделать мониторинг-графики, следить за ними, смотреть, дали ли принятые меры желаемый результат. Сменить сервер [железо] для ntpd: менее нагруженный задачами, поставить приоритет ntpd выше, не виртуалка, но торренто-качалка на RPi, сеть не забитая на 150%, ядро не 2.6.18, и т.п.
> Заранее благодарен.
Подскажите пожалуйста:
1) как работает режим slew который черех "-x" запускается. Я не совсем понимаю логику работы.
2) опции minpoll 4 maxpoll 4 выставляют для точной синхронизации, minpoll 4 maxpoll 6 для менее точной. Но опять таки почему? не вижу логики и ман не спасает.
3) если НТП сервак бегает туда сюда по шкале времени в +/- 14 секунд в промежутке 3 часа, но все равно держится определенной планки вышестоящего НТП. Как мне моего клиента можно настроить, чтоб он игнорировал эти расхождения? Мой клиент пашет стабильно, но он все время выправляет время с кривого нтп и скочит в след за ним.... На сколько я понял по ману - это физически невозможно, т.к. клиент все равно вынужден брать время с сервера и выставлять свое время по нему, даже если сервер врет но не более чем на 1000 секунд. как я думаю если сервер врет в пределах 1000сек я никуда не денусь и буду ловить его косяки... ну мне бы хотя-бы чтобы клиент время менял не скачками, а например по 0,5сек раз в минуту.... вроде как я понял slew как раз это делает, но не уверен. Буду признателен за консультацию.
> Подскажите пожалуйста:
> 1) как работает режим slew который черех "-x" запускается. Я не совсем
> понимаю логику работы.На вскидку - я тоже не знаю. Вроже, другой API ядра в каких-то случах испольщуется для изменения времени [этого самого] ядра.
> 2) опции minpoll 4 maxpoll 4 выставляют для точной синхронизации, minpoll 4
> maxpoll 6 для менее точной. Но опять таки почему? не вижу
> логики и ман не спасает.в xxxpoll-ах лежит интевал опроса апстрима в "двойисной экспоненциальной" нотации.
minpoll 4 == опрашивать апстрим не чаще [раза в] 16 сек.
maxpoll 6 == опрашивать апстрим не режее [раза в] 64 сек."опрашивать" - в т.ч. и в значении "синхронизоваться с" ~для выбранного апстрима.
> 3) если НТП сервак бегает туда сюда по шкале времени в +/-
> 14 секунд в промежутке 3 часа, но все равно держится определенной
> планки вышестоящего НТП. Как мне моего клиента можно настроить, чтоб он
> игнорировал эти расхождения? Мой клиент пашет стабильно, но он все времяКлиент на это не рассчитан, вроде. Поэтому я и написал -- замена или исправление сервера.
Ну, может, какой порог в тонких настройках ntpd-клиента поставить ниже 7с. Но такой чёрной магиией я не владею, и сдаётся мне, что получить что-то отличное от отсутствия синхронизации при "выпрыгивании" сервера за те 7с не получится. Упражнение по рассмотрению 2ух прыгающих козликом апстримов и вероятности выпригивания обоих и выяснению, откуда "настроенный" таким магическим образом клиент будет при этом брать время, "оставляю читателю"(ТМ).
> по 0,5сек раз в минуту.... вроде как я понял slew как
> раз это делает, но не уверен. Буду признателен за консультацию.Не имел с этим дела, дальше сломанного телефона с манов не помогу.
driftfile /etc/ntp.drift
logfile /var/tmp/ntp.log
logconfig =allall
server 192.168.1.2 prefer minpoll 4 maxpoll 6 #stratum3
server 192.168.1.3 #stratum3restrict 192.168.1.2 #stratum4
restrict 192.168.1.3 #stratum4server 192.168.1.4 #stratum4
restrict 192.168.1.4 #stratum4server 192.168.2.5 #stratum4
server 192.168.3.6 #stratum4restrict 192.168.2.5 #stratum4
restrict 192.168.3.6 #stratum4restrict 192.168.0.0 mask 255.255.0.0 #all 192.168.X.X
restrict 127.0.0.1
restrict default ignoreПока сделал так, но мне кажется это мало поможет если оба стратум 3 начнут скакать на разные интервалы туда сюда.