URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID13
Нить номер: 902
[ Назад ]

Исходное сообщение
"Вопрос по NTP"

Отправлено Shinma , 07-Май-15 09:38 
Добрый день.

Ищу помощи в вопросе:

Есть два сервера NTP они присылают на мои системы HP-UX два разных времени с разницей в +/- 7 секунд.
если один из NTP решит синхронизироваться с вышестоящим сервером и обнаруживает смещение то он переводит свое локальное время до вышестоящего сервера, например на +7 сек.
В этот момент на моих HP-UX ни один сервер не признается валидным для синхронизации. далее коллизии со временем (2-5 минут) проходят и мои сервера берут для синхронизации NTP сервер на угад из этих двух. это может оказаться как сервер у которого уже +7 сек так и сервер на котором все еще +0 секунд относительно моих HP-UX. с кем первее синхронизируется, того и назначает сервером NTP.
дальше происходит смешная ситуация если мои серваки выбрали NTP у которого +7сек через минуты 2-5 они тоже изменяют свое время.
дальше если текущий NTP опять изменит время на любое, мои серваки , опять сбрасывают доверие ко всем NTP и начинают процедуру проверки доверия(или как ее назвать...), могут взять за основной NTP сервер тот у которого еще не произошла доводка на +7 секунд. в итоге мои серваки через минут 5 откатывают время на -7 секунд назад.
База данных в шоке, приложения в шоке. SAP начинает спать дампы с ошибками.

Как можно избежать ситуацию когда NTP сервера вот так себя ведут? разница между NTP серверами бывает достигает 7-14 секунд на протяжении 3 часов. потом опять проходит. NTP сервера не мои, я могу только направить совет тем админам, если он будет.
Заранее благодарен.



Содержание

Сообщения в этом обсуждении
"Вопрос по NTP"
Отправлено Andrey Mitrofanov , 07-Май-15 10:17 
> Добрый день.
> Ищу помощи в вопросе:
> Есть два сервера NTP они присылают на мои системы HP-UX два разных
> времени с разницей в +/- 7 секунд.

Увлекательно, деражите нас в курсе событий.

> Как можно избежать ситуацию когда NTP сервера вот так себя ведут? разница

Синхронизоваться с сервером, который не скачет козликом, а не с этим барахлом, элементарно же. Либо найти другой такой, либо сделать эти такими.

> между NTP серверами бывает достигает 7-14 секунд на протяжении 3 часов.
> потом опять проходит. NTP сервера не мои, я могу только направить
> совет тем админам, если он будет.

Тебе совет не заниматься чужими проблемами (вариант1 выше). pool.ntp.org не? Да, у самого провайдер :/ блокирует.

Им Совет - заняться администрированием сервиса. Ну, там, повыяснять причины, попытаться сформулировать, чего можно подкрутить, сделать мониторинг-графики, следить за ними, смотреть, дали ли принятые меры желаемый результат. Сменить сервер [железо] для ntpd: менее нагруженный задачами, поставить приоритет ntpd выше, не виртуалка, но торренто-качалка на RPi, сеть не забитая на 150%, ядро не 2.6.18, и т.п.

> Заранее благодарен.


"Вопрос по NTP"
Отправлено Shinma , 12-Май-15 15:39 
Подскажите пожалуйста:
1) как работает режим slew который черех "-x" запускается. Я не совсем понимаю логику работы.
2) опции minpoll 4 maxpoll 4 выставляют для точной синхронизации, minpoll 4 maxpoll 6 для менее точной. Но опять таки почему? не вижу логики и ман не спасает.
3) если НТП сервак бегает туда сюда по шкале времени в +/- 14 секунд в промежутке 3 часа, но все равно держится определенной планки вышестоящего НТП. Как мне моего клиента можно настроить, чтоб он игнорировал эти расхождения? Мой клиент пашет стабильно, но он все время выправляет время с кривого нтп и скочит в след за ним.... На сколько я понял по ману - это физически невозможно, т.к. клиент все равно вынужден брать время с сервера и выставлять свое время по нему, даже если сервер врет но не более чем на 1000 секунд. как я думаю если сервер врет в пределах 1000сек я никуда не денусь и буду ловить его косяки... ну мне бы хотя-бы чтобы клиент время менял не скачками, а например по 0,5сек раз в минуту.... вроде как я понял slew как раз это делает, но не уверен. Буду признателен за консультацию.

"Вопрос по NTP"
Отправлено Andrey Mitrofanov , 12-Май-15 19:10 
> Подскажите пожалуйста:
> 1) как работает режим slew который черех "-x" запускается. Я не совсем
> понимаю логику работы.

На вскидку - я тоже не знаю. Вроже, другой API ядра в каких-то случах испольщуется для изменения времени [этого самого] ядра.


> 2) опции minpoll 4 maxpoll 4 выставляют для точной синхронизации, minpoll 4
> maxpoll 6 для менее точной. Но опять таки почему? не вижу
> логики и ман не спасает.

в xxxpoll-ах лежит интевал опроса апстрима в "двойисной экспоненциальной" нотации.
minpoll 4 == опрашивать апстрим не чаще [раза в] 16 сек.
maxpoll 6 == опрашивать апстрим не режее [раза в] 64 сек.

"опрашивать" - в т.ч. и в значении "синхронизоваться с" ~для выбранного апстрима.

> 3) если НТП сервак бегает туда сюда по шкале времени в +/-
> 14 секунд в промежутке 3 часа, но все равно держится определенной
> планки вышестоящего НТП. Как мне моего клиента можно настроить, чтоб он
> игнорировал эти расхождения? Мой клиент пашет стабильно, но он все время

Клиент на это не рассчитан, вроде. Поэтому я и написал -- замена или исправление сервера.

Ну, может, какой порог в тонких настройках ntpd-клиента поставить ниже 7с. Но такой чёрной магиией я не владею, и сдаётся мне, что получить что-то отличное от отсутствия синхронизации при "выпрыгивании" сервера за те 7с не получится. Упражнение по рассмотрению 2ух прыгающих козликом апстримов и вероятности выпригивания обоих и выяснению, откуда "настроенный" таким магическим образом клиент будет при этом брать время, "оставляю читателю"(ТМ).

> по 0,5сек раз в минуту.... вроде как я понял slew как
> раз это делает, но не уверен. Буду признателен за консультацию.

Не имел с этим дела, дальше сломанного телефона с манов не помогу.


"Вопрос по NTP"
Отправлено Shinma , 01-Июн-15 14:11 
driftfile /etc/ntp.drift
logfile /var/tmp/ntp.log
logconfig =allall
server 192.168.1.2  prefer minpoll 4 maxpoll 6      #stratum3
server 192.168.1.3                                  #stratum3

restrict 192.168.1.2                                   #stratum4                  
restrict 192.168.1.3                                   #stratum4                      

server 192.168.1.4                                    #stratum4              
restrict 192.168.1.4                                   #stratum4                

server 192.168.2.5                                    #stratum4              
server 192.168.3.6                                    #stratum4              

restrict 192.168.2.5                                     #stratum4          
restrict 192.168.3.6                                   #stratum4          

restrict 192.168.0.0   mask 255.255.0.0                #all 192.168.X.X
restrict 127.0.0.1
restrict default ignore

Пока сделал так, но мне кажется это мало поможет если оба стратум 3 начнут скакать на разные интервалы туда сюда.