Имеется 2 свежекупленных сервера:
HP Proliant DL180R06
HP Proliant ML350p Gen8
Надо запустить на них CentOS.
Проблема: при отсутствии сетевой активности (5-10 мин) засыпают сетевые интерфейсы на этих серверах. Выглядит это дело в двух вариантах:
- проходит какое-то время и сервер перестает пинговаться, тогда идем к нему и с локальной консоли пингуем что-нибудь в сети, после этого все ок,
- пинг к серверу проходит через несколько пропущенных пакетов (2-5 пакета), либо ssh-соединение устанавливается со второго раза.В логах и dmesg - тишина.
Что пробовал делать:
- CentOS 6.3 ядро 2.6.32-279.el6.x86_64 из дистрибутива - глюк есть,
- CentOS 6.3 ядро 2.6.32-279.14.1.el6.x86_64 из апдейтов - глюк есть,
- CentOS 6.3 ядро 3.2.34 сам собрал - глюк есть,
- CentOS 6.3 ядро 3.6.8 сам собрал - глюк есть,
- Ubuntu 12.04.1 LTS ядро 3.2.0-29-generic - глюка нет!
Баловался с настройками Power Managment, ACPI и ASPM в конфигах ядер - не помогло.
На одном сервере сетевая Intel E1000 (модуль igb), на другом Broadcom Tigon3 (модуль tg3).БИОСы серверов ковырял - ничего такого связанного с засыпанием не нашел, да и не в биосе это дело получается, раз убунта работает. Либо это засыпает целиком вся система (не только сетевухи), тогда где это настроивается?
Что можете посоветовать?
Выключить в BIOS поддержку ACPI?
> Что можете посоветовать?Собрать ядро с конфигом от убунты.
>> Что можете посоветовать?
> Собрать ядро с конфигом от убунты.Вот это я забыл сделать.
Так, собрал, проверил, не помогло :( Видимо это связано с CentOS.
>>> Что можете посоветовать?
>> Собрать ядро с конфигом от убунты.
> Вот это я забыл сделать.
> Так, собрал, проверил, не помогло :( Видимо это связано с CentOS.Было бы странно.
Какие параметры сетевой карты выставляет убунта (ethtool)?
> Что можете посоветовать?в параметры загрузки ядра добавить pcie_aspm=off
>> Что можете посоветовать?
> в параметры загрузки ядра добавить pcie_aspm=offМне не помогло :/
Совет про pcie_aspm=off пробовал - не помогло, даже из ядра удалял поддержку ASPM.Экспериментировал с сервером HP Proliant ML350p Gen8 (сетевая Broadcom Tigon3), поставил 2 системы: CentOS 6.3(minimal) и Ubuntu 12.04.1 LTS.
===> ethtool CentOS:
Settings for eth0:
Supported ports: [ TP ]
Supported link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Half 1000baseT/Full
Supports auto-negotiation: Yes
Advertised link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Half 1000baseT/Full
Advertised pause frame use: Symmetric
Advertised auto-negotiation: Yes
Link partner advertised link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Full
Link partner advertised pause frame use: Symmetric
Link partner advertised auto-negotiation: Yes
Speed: 1000Mb/s
Duplex: Full
Port: Twisted Pair
PHYAD: 1
Transceiver: internal
Auto-negotiation: on
MDI-X: on
Supports Wake-on: g
Wake-on: g
Current message level: 0x000000ff (255)
Link detected: yes===> ethtool Ubuntu:
Settings for eth0:
Supported ports: [ TP ]
Supported link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Half 1000baseT/Full
Supported pause frame use: No
Supports auto-negotiation: Yes
Advertised link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Half 1000baseT/Full
Advertised pause frame use: Symmetric
Advertised auto-negotiation: Yes
Speed: 1000Mb/s
Duplex: Full
Port: Twisted Pair
PHYAD: 1
Transceiver: internal
Auto-negotiation: on
MDI-X: Unknown
Supports Wake-on: g
Wake-on: g
Current message level: 0x000000ff (255)
drv probe link timer ifdown ifup rx_err tx_err
Link detected: yesвроде, ничего криминального нет.
Может это засыпает не сетевуха, а вся система?
>[оверквотинг удален]
> Wake-on: g
> Current message level: 0x000000ff
> (255)
>
>
> drv probe link
> timer ifdown ifup rx_err tx_err
> Link detected: yes
> вроде, ничего криминального нет.
> Может это засыпает не сетевуха, а вся система?Поставьте серваки на пинг друг друга и забудьте о проблеме;)
> Поставьте серваки на пинг друг друга и забудьте о проблеме;)Да, уже думал над этим решением :) но хотелось бы разобраться в проблеме.