Помогите... горю!!!!Подскажите плиз, теряется сеть через 10 минут после перегрузки сервера... причем теряет совсем...
не пингует даже defaultgateway ... после перегрузки все нормально но только на непродолжительное время.
tcpdump видит какие то одиночные входящие пакеты... но в целом входящих не видит.
Куда хоть копать?
>Помогите... горю!!!!
>
>Подскажите плиз, теряется сеть через 10 минут после перегрузки сервера... причем
>теряет совсем...
>
>не пингует даже defaultgateway ... после перегрузки все нормально но только
>на непродолжительное время.
>
>tcpdump видит какие то одиночные входящие пакеты... но в целом входящих
>не видит.
>
>Куда хоть копать?Подробнее можно?
ifconfig
cat /etc/rc.conf
cat /etc/rc.firewall
netstat -nr
>Подробнее можно?
>ifconfigns1# ifconfig
fxp0: flags=8802<BROADCAST,SIMPLEX,MULTICAST> mtu 1500
options=8<VLAN_MTU>
ether 00:e0:18:78:21:0d
media: Ethernet autoselect (none)
status: no carrier
fxp1: flags=8843<UP,BROADCAST,RUNNING,SIMPLEX,MULTICAST> mtu 1500
options=8<VLAN_MTU>
inet6 fe80::2e0:18ff:fe78:210e%fxp1 prefixlen 64 scopeid 0x2
inet 81.176.67.76 netmask 0xfffffff0 broadcast 81.176.67.79
ether 00:e0:18:78:21:0e
media: Ethernet autoselect (100baseTX <full-duplex>)
status: active
lo0: flags=8049<UP,LOOPBACK,RUNNING,MULTICAST> mtu 16384
inet6 ::1 prefixlen 128
inet6 fe80::1%lo0 prefixlen 64 scopeid 0x3
inet 127.0.0.1 netmask 0xff000000
>cat /etc/rc.confinetd_enable="YES"
linux_enable="YES"
firewall_enable="YES"
firewall_type="/etc/ipfw.conf"
nfs_client_enable="YES"
sshd_enable="YES"
sendmail_enable="YES"
sendmail_flags="-bd -q30m"
SENDMAIL_CF_DIR="/usr/local/share/sendmail/cf"
ifconfig_fxp1="inet 81.176.67.76 netmask 255.255.255.240"
#ifconfig_fxp1_alias0="inet 81.176.76.194 netmask 255.255.255.255"
defaultrouter="81.176.67.65"
hostname="ns1.explosion.ru"
named_enable="yes"
enable_quotas="YES"
check_quotas="YES"
mailgraph_enable="YES">cat /etc/rc.firewall
стандарный freebsd 6.0 не редактировался, правила вписывались только в ipfw.conf
>netstat -nr
# netstat -nr
Routing tables
Internet:
Destination Gateway Flags Refs Use Netif Expire
default 81.176.67.65 UGS 0 30050253 fxp1
81.176.67.64/28 link#2 UC 0 0 fxp1
81.176.67.65 00:0f:f7:92:04:00 UHLW 2 0 fxp1 1200
81.176.67.76 00:e0:18:78:21:0e UHLW 1 1207103 lo0
127.0.0.1 127.0.0.1 UH 0 42738 lo0
Internet6:
Destination Gateway Flags Netif Expire
::1 ::1 UH lo0
fe80::%fxp1/64 link#2 UC fxp1
fe80::2e0:18ff:fe78:210e%fxp1 00:e0:18:78:21:0e UHL lo0
fe80::%lo0/64 fe80::1%lo0 U lo0
fe80::1%lo0 link#3 UHL lo0
ff01::/32 ::1 U lo0
ff02::%fxp1/32 link#2 UC fxp1
ff02::%lo0/32 ::1 UC lo0Спасибо если подскажете!
>
>>Подробнее можно?
>>ifconfig
>
>ns1# ifconfig
>fxp0: flags=8802<BROADCAST,SIMPLEX,MULTICAST> mtu 1500
> options=8<VLAN_MTU>
> ether 00:e0:18:78:21:0d
> media: Ethernet autoselect (none)
>
> status: no carrier
>fxp1: flags=8843<UP,BROADCAST,RUNNING,SIMPLEX,MULTICAST> mtu 1500
> options=8<VLAN_MTU>
> inet6 fe80::2e0:18ff:fe78:210e%fxp1 prefixlen 64
>scopeid 0x2
> inet 81.176.67.76 netmask 0xfffffff0
>broadcast 81.176.67.79
> ether 00:e0:18:78:21:0e
> media: Ethernet autoselect (100baseTX <full-duplex>)
> status: active
>lo0: flags=8049<UP,LOOPBACK,RUNNING,MULTICAST> mtu 16384
> inet6 ::1 prefixlen 128
>
> inet6 fe80::1%lo0 prefixlen 64
>scopeid 0x3
> inet 127.0.0.1 netmask 0xff000000
>
>
>
>>cat /etc/rc.conf
>
>inetd_enable="YES"
>linux_enable="YES"
>
>firewall_enable="YES"
>firewall_type="/etc/ipfw.conf"
>
>
>nfs_client_enable="YES"
>
>sshd_enable="YES"
>
>sendmail_enable="YES"
>sendmail_flags="-bd -q30m"
>SENDMAIL_CF_DIR="/usr/local/share/sendmail/cf"
>
>
>
>ifconfig_fxp1="inet 81.176.67.76 netmask 255.255.255.240"
>#ifconfig_fxp1_alias0="inet 81.176.76.194 netmask 255.255.255.255"
>defaultrouter="81.176.67.65"
>
>hostname="ns1.explosion.ru"
>
>named_enable="yes"
>enable_quotas="YES"
>check_quotas="YES"
>
>mailgraph_enable="YES"
>
>>cat /etc/rc.firewall
>
>стандарный freebsd 6.0 не редактировался, правила вписывались только в ipfw.conf
>
>>netstat -nr
>
># netstat -nr
>Routing tables
>
>Internet:
>Destination Gateway
> Flags
> Refs Use Netif Expire
>
>default
>81.176.67.65 UGS
> 0 30050253 fxp1
>81.176.67.64/28 link#2
> UC
> 0
> 0 fxp1
>81.176.67.65 00:0f:f7:92:04:00 UHLW
> 2
> 0 fxp1 1200
>81.176.67.76 00:e0:18:78:21:0e UHLW
> 1 1207103
>lo0
>127.0.0.1 127.0.0.1
> UH
> 0
>42738 lo0
>
>Internet6:
>Destination
>
>Gateway
>
> Flags Netif Expire
>::1
>
> ::1
>
>
> UH
> lo0
>fe80::%fxp1/64
> link#2
>
> UC
> fxp1
>fe80::2e0:18ff:fe78:210e%fxp1 00:e0:18:78:21:0e
> UHL
> lo0
>fe80::%lo0/64
> fe80::1%lo0
>
> U
> lo0
>fe80::1%lo0
>
>link#3
>
> UHL
>lo0
>ff01::/32
>
> ::1
>
> U
> lo0
>ff02::%fxp1/32
> link#2
>
> UC
> fxp1
>ff02::%lo0/32
> ::1
>
>
> UC
> lo0
>
>Спасибо если подскажете!
Оба! Интел 100 Мегабитный?!
Знаем - знаем карточка хороша... но есть одно но!У меня была ситуация. Мышина (6.1) - шлюз, на входе и выходе fxp карты. Но в течении от 10 минут до 4 часов она точно так-же теряет сеть. Симптомы теже.
Проблема была вызвана нак называемым interrupt флуд'ом. Тоесть когда через карту проходит слишком большое количество пакетов и она просто "задергала" это прерывание.
У меня была ошибка в маршрутизации, между двумя роутерами, что вызвало неимоверный шторм пакетов приводящий к такой перегрузке.
Я бы посоветовал:
Включить опцию POLLING - это позволит снизить частоту вызова прерывания.
Прочитать про параметр HZ и применить по своим нуждам.
Естественно посмотреть внимательно на трафик который ходит через сетевую карту.Успехов!
>
>У меня была ситуация. Мышина (6.1) - шлюз, на входе и выходе
>fxp карты. Но в течении от 10 минут до 4 часов
>она точно так-же теряет сеть. Симптомы теже.
>
>Проблема была вызвана нак называемым interrupt флуд'ом. Тоесть когда через карту проходит
>слишком большое количество пакетов и она просто "задергала" это прерывание.
>
>У меня была ошибка в маршрутизации, между двумя роутерами, что вызвало неимоверный
>шторм пакетов приводящий к такой перегрузке.
>
>Я бы посоветовал:
>
>Включить опцию POLLING - это позволит снизить частоту вызова прерывания.
>Прочитать про параметр HZ и применить по своим нуждам.не могли бы подсказать по последним двум пунктам... где это и как. Посмотрел в sysctl - polling не нашел.
>>
>>У меня была ситуация. Мышина (6.1) - шлюз, на входе и выходе
>>fxp карты. Но в течении от 10 минут до 4 часов
>>она точно так-же теряет сеть. Симптомы теже.
>>
>>Проблема была вызвана нак называемым interrupt флуд'ом. Тоесть когда через карту проходит
>>слишком большое количество пакетов и она просто "задергала" это прерывание.
>>
>>У меня была ошибка в маршрутизации, между двумя роутерами, что вызвало неимоверный
>>шторм пакетов приводящий к такой перегрузке.
>>
>>Я бы посоветовал:
>>
>>Включить опцию POLLING - это позволит снизить частоту вызова прерывания.
>>Прочитать про параметр HZ и применить по своим нуждам.
>
>не могли бы подсказать по последним двум пунктам... где это и как.
>Посмотрел в sysctl - polling не нашел.Цитата http://www.opennet.me/tips/info/649.shtml
man polling - периодических опрос состояния ядром, вместо генерации прерываний
(полезно при очень большом числе пакетов проходящих через сетевую карту),
возможен комбинированный вариант, когда polling включается при преодалении определенного порога нагрузки).
В конфигурации ядра
options DEVICE_POLLING
options HZ=1000
Далее:
sysctl kern.polling.enable=1
sysctl kern.polling.user_frac=50
>Помогите... горю!!!!
>
>Подскажите плиз, теряется сеть через 10 минут после перегрузки сервера... причем
>теряет совсем...
>
>не пингует даже defaultgateway ... после перегрузки все нормально но только
>на непродолжительное время.
>
>tcpdump видит какие то одиночные входящие пакеты... но в целом входящих
>не видит.
>
>Куда хоть копать?а помогает ли ifconfig $net_if down; ifconfig $net_if up ?
>а помогает ли ifconfig $net_if down; ifconfig $net_if upА что это за переменные и какого действие команды? ... не сталкивался раньше с таким.
>>а помогает ли ifconfig $net_if down; ifconfig $net_if up
>
>А что это за переменные и какого действие команды? ... не сталкивался
>раньше с таким.
Сие означает просьбу попробовать последовательность команд
ifconfig fxp1 down
ifconfig fxp1 up
Т.е. подозрения на автоопределение скорости.
Поддерживаю.
Если команды помогут - на серваке и на свиче нужно будет указать скорость принудительно.
>Сие означает просьбу попробовать последовательность команд
>ifconfig fxp1 down
>ifconfig fxp1 up
>Т.е. подозрения на автоопределение скорости.
>Поддерживаю.
>Если команды помогут - на серваке и на свиче нужно будет указать
>скорость принудительно.Угу, ясно. Дело то в том, что сервер далеко и сделать это удастся только из скрипта... ну или мучить техподдержку.
А для общего образования объясните пожалуйста почему коннект "теряется" только через определнное время?
>
>>Сие означает просьбу попробовать последовательность команд
>>ifconfig fxp1 down
>>ifconfig fxp1 up
>>Т.е. подозрения на автоопределение скорости.
>>Поддерживаю.
>>Если команды помогут - на серваке и на свиче нужно будет указать
>>скорость принудительно.
>
>Угу, ясно. Дело то в том, что сервер далеко и сделать это
>удастся только из скрипта... ну или мучить техподдержку.
>
>А для общего образования объясните пожалуйста почему коннект "теряется" только через определнное
>время?Ну на первый взгяд вроде всё впорядке, поэтому попробуйте для начало присвоить IP= 81.176.67.76 интерфейсу fxp0, лучше такое делать на локальной консоли, ибо инет пропадёт. А со второго fxp1 уберите этот адрес и выставьте какой-то другой.
Далее, после того как пропал инет снова наберите netstat -nr нужно убедиться что у вас по прежнему есть запись в роутах направляющая пакеты на гетвей, и что она такая же.
Смотрите там есть строчка
81.176.67.65 00:0f:f7:92:04:00 UHLW 2 0 fxp1 1200
это IP и МАС адреса гетвея, а последнее число - актуальность, это число со временем уменьшается, пока не будет заново подтвержедено очередным ARP запросом что гетвей имеет такой MAC. Если очередной ARP запрос не пройдёт в течении определённого времени (обычно от 1 до 10 минут), то актуальность уменьшится до 0, эта строчка будет удалена и твой хост будет думать что гетвей просто выключен, соответственно никакие пакеты ходить к нему не будут.
Причины:
1. Самая первая ричина это если в файрволе указано правило убивающее ARP запросы и бруткасты это правило выглядит примерно так
deny layer2 from any to any mac-type arp
2. Если такое правило указано на гетвее
3. Если глючит драйвер сетевухи
4. Если слишком умная сетевуха и принимает брудкасты ARP за атаку и тупо их убивает (неправильно наистроен драйвер)
5. Если используется не прямой подключение к гетвею, а через мост или что-то что может не пропускать ARP запросыТо что я здесь написал базируется лишь на одном предположении что не получаются или не отсылаются ARP запросы, для того чтоб это проверить нужно тогда когда пропала сеть набрать netstat -nr и посмотреть что там на счёт строчки с мак адресом гетвея, если её нет то реально куда-то пропадают ARP запросы, а елси есть , то глюк в чём-то ещё .
Кстати после того ка пропала сеть нужно попробовать пинг самого себя, т.е.
ping 81.176.67.76
Если пинги не идут то нужно посомотреть что выдаёт ifconfig, возможно что слетает IP с самом интерефеса (это глюк драйвера или сетевухи).
>
>Ну на первый взгяд вроде всё впорядке, поэтому попробуйте для начало присвоить
>IP= 81.176.67.76 интерфейсу fxp0, лучше такое делать на локальной консоли, ибо
>инет пропадёт. А со второго fxp1 уберите этот адрес и выставьте
>какой-то другой.Спасибо за подробное объяснение!
Специально перевели на fxp1, т.к. думали что с 0 какие-то проблемы.>Далее, после того как пропал инет снова наберите netstat -nr нужно убедиться
>что у вас по прежнему есть запись в роутах направляющая пакеты
>на гетвей, и что она такая же.
>Смотрите там есть строчка
>81.176.67.65 00:0f:f7:92:04:00 UHLW
> 2
> 0 fxp1 1200
>это IP и МАС адреса гетвея, а последнее число - актуальность, это
>число со временем уменьшается, пока не будет заново подтвержедено очередным ARP
>запросом что гетвей имеет такой MAC. Если очередной ARP запрос не
>пройдёт в течении определённого времени (обычно от 1 до 10 минут),
>то актуальность уменьшится до 0, эта строчка будет удалена и твой
>хост будет думать что гетвей просто выключен, соответственно никакие пакеты ходить
>к нему не будут.
>Причины:
>1. Самая первая ричина это если в файрволе указано правило убивающее ARP
>запросы и бруткасты это правило выглядит примерно так
>deny layer2 from any to any mac-type arpнет, не указано.
>2. Если такое правило указано на гетвее
>3. Если глючит драйвер сетевухи
>4. Если слишком умная сетевуха и принимает брудкасты ARP за атаку и
>тупо их убивает (неправильно наистроен драйвер)п.3-4: Это может случится внезапно? ... т.к. до этого год все было нормально?
>5. Если используется не прямой подключение к гетвею, а через мост или
>что-то что может не пропускать ARP запросы
>>То что я здесь написал базируется лишь на одном предположении что не
>получаются или не отсылаются ARP запросы, для того чтоб это проверить
>нужно тогда когда пропала сеть набрать netstat -nr и посмотреть что
>там на счёт строчки с мак адресом гетвея, если её нет
>то реально куда-то пропадают ARP запросы, а елси есть , то
>глюк в чём-то ещё .>Кстати после того ка пропала сеть нужно попробовать пинг самого себя, т.е.
>
>ping 81.176.67.76
>Если пинги не идут то нужно посомотреть что выдаёт ifconfig, возможно что
>слетает IP с самом интерефеса (это глюк драйвера или сетевухи).Ясно. Буду пробовать! ... но после криков в датацентре, их специалисты долго сидели, что-то поменяли и все заработало (по крайней мере уже сутки работает). Мне было сказано что была зашита от мены mac адреса и подключения других IP... ее сняли, но подтвержить что именно это было причиной никто не может (или не хочет).