Действо происходит на OpenSUSE 15.1 4.12.14-lp151.27-default;Проблемное карточко вот такое:
03:02.0 Ethernet controller [0200]: Realtek Semiconductor Co., Ltd. RTL-8100/8101L/8139 PCI Fast Ethernet Adapter [10ec:8139] (rev 10)
Subsystem: Realtek Semiconductor Co., Ltd. RTL-8100/8101L/8139 PCI Fast Ethernet Adapter [10ec:8139]В системе есть два модуля ядра для этой карты: 8139cp и 8139too(0.9.28), используется второй, с первым она вообще отказывается работать.
Вторая карта встройка:
00:19.0 Ethernet controller [0200]: Intel Corporation 82566DM-2 Gigabit Network Connection [8086:10bd] (rev 02)
Subsystem: Dell OptiPlex 755 [1028:0211]Встройка смотрит во внутренюю сеть, где гуляет трафик NFS и tor-proxy, а 8139 в сторону роутера ну и соответственно тырнета.
Проблема следующая: если не давать особой нагрузки на 8139 (серфинг и максимум видосики в ютубчике) - может пахать неделями, а вот если дать что-то посерьезнее (ну скажем торрент) линк виснет за 5-15 минут (если дать нагрузку на аплоад, то ещё быстрее). Лечится это только перезагрузкой, никакие network restart или modprobe -r 8139too&&modprobe 8139too не помагают((
Порты свича, в который всё это подключается, менял - не то, причем при зависании линка на свиче всеравно какие-то пакеты в обе стороны ходят (ну как минимум свичу так кажется). Что система что свич говорят что линк поднят и куда не погляди - всё прям прекрасно, но даже пинги до свича не проходят.
Пробовал подкинуть другую карточку: со всего что нашлось под рукой только идентичная 8139 - поведение такое-же.
Есть ещё одна машина с opensuse tumbleweed 5.1.7-1-pae-i686, сеть на ней разбросана 1:1 с этой
02:00.0 Ethernet controller [0200]: Broadcom Inc. and subsidiaries NetLink BCM5787 Gigabit Ethernet PCI Express [14e4:169b] (rev 02)и на ней всё работает.
Subsystem: Dell Device [1028:0220]
Kernel driver in use: tg3
Kernel modules: tg3
03:02.0 Ethernet controller [0200]: Realtek Semiconductor Co., Ltd. RTL-8100/8101L/8139 PCI Fast Ethernet Adapter [10ec:8139] (rev 10)
Subsystem: Realtek Semiconductor Co., Ltd. RTL-8100/8101L/8139 PCI Fast Ethernet Adapter [10ec:8139]
Kernel driver in use: 8139too
Kernel modules: 8139cp, 8139tooЕсть идеи в какую сторону копать?
> Проблема следующая: если не давать особой нагрузки на 8139 (серфинг и максимум
> видосики в ютубчике) - может пахать неделями, а вот если дать
> что-то посерьезнее (ну скажем торрент) линк виснет за 5-15 минут (если
> дать нагрузку на аплоад, то ещё быстрее). Лечится это только перезагрузкой,
> никакие network restart или modprobe -r 8139too&&modprobe 8139too не помагают((Netperf-ом проблема триггерится?
А в dmesg что?> Есть ещё одна машина с opensuse tumbleweed 5.1.7-1-pae-i686,
> ...
> на ней всё работает.Если есть возможность, проверьте проблемные карточки в этой машине. Чтобы исключить/подтвердить глючность конкретных экземпляров.
> Есть идеи в какую сторону копать?
Попробовать заведомо полноценный блок питания.
Протестировать память.
Продуть слоты/переткнуть в другой слот.
Посмотреть на карточку пирометром (прям на злобу дня).
Попробовать с другим патч кордом.
> Netperf-ом проблема триггерится?Да. От 2-х до 10-и минут.
Если запустить тест в две стороны - меньше минуты.> А в dmesg что?
Пусто.
> Если есть возможность, проверьте проблемные карточки в этой машине. Чтобы исключить/подтвердить
> глючность конкретных экземпляров.Последнее что хотелось бы делать - это ковырять в ту машину. Она постоянно используется, да еще и расположена весьма труднодоступно(
> Попробовать заведомо полноценный блок питания.
> Протестировать память.Завтра попробую подкинуть, есть один запасной и далеко не самый плохой.
Заодно и память поганяю> Продуть слоты/переткнуть в другой слот.
И то и другое делалось при подбрасывании второй карты.
> Посмотреть на карточку пирометром (прям на злобу дня).
Во время 3-х вылетов выше 50° не поднялось (хз на сколько можно доверять пирометру за 10$, но на ощупь ~так-же).
> Попробовать с другим патч кордом.
Это первое что было опробовано, вместе с перетыканием по разным портам свича ;)
>> Netperf-ом проблема триггерится?
> Да. От 2-х до 10-и минут.
> Если запустить тест в две стороны - меньше минуты.Замечательно. Хоть какая-то определённость.
>> Попробовать заведомо полноценный блок питания.
>> Протестировать память.
> Завтра попробую подкинуть, есть один запасной и далеко не самый плохой.
> Заодно и память поганяю...заодно прикинуть стоимость этих мероприятий и сравнить с ценой на новую карточку не RTL.
> Замечательно. Хоть какая-то определённость.Вот только что делать с этой определенностью - ХЗ
> ...заодно прикинуть стоимость этих мероприятий и сравнить с ценой на новую карточку
> не RTL.Та ясен пень))) Вот нашёл неподалёку от себя жменю Intel pro100s по два бакса, может завтра сползаю заберу.
Но здесь уже блин дело спортивного интереса :D :D
Я сколько помню эти карточки (а через мои руки, в своё время, этих зверьков прошла не одна сотня), они зарекомендовали себя как самое неубиваемое решение на 100mbps, а тут такая подстава в двух экземплярах....
> Но здесь уже блин дело спортивного интереса :D :D
> Я сколько помню эти карточки (а через мои руки, в своё время,
> этих зверьков прошла не одна сотня), они зарекомендовали себя как самое
> неубиваемое решение на 100mbps, а тут такая подстава в двух экземплярах....А почему карточки?
Я бы на PCI мост подумал - южный мост, видимо. Перегревается, или, как указали ранее, питания не хватает.
Осмотрите конденсаторы на мат. плате.
> ...заодно прикинуть стоимость этих мероприятий и сравнить с ценой на новую карточку
> не RTL.Вот поддержу обеими руками - вот именно 8139 у меня всегда вызывала желание немедленно ее выкинуть и тщательно вымыть руки после нее...
> Вот поддержу обеими руками - вот именно 8139 у меня всегда вызывала
> желание немедленно ее выкинуть и тщательно вымыть руки после нее...А у меня от них прямо противоположное мнение ;)
Итак продолжение истории:
1) прогнал родную память - проблем 0.
2) Подкинул другой БП и память - реакция такая-же.
3) Споткнулся на столе об внешний SSD и от нефиг делать таки его раскурочил.
Короче выковырял я его с кармана, запихал во внутрь и ввинтил на него седьмые окна. Дабы сильно не заморачиваться чем дать нагрузку - зацепил на рутрекере два десятка популярных торрентов (~50Gb) с максимумом сидов и личей и запихнул это всё на ночь в клиент.
Результат: к утру всё скачано и отдано ~30Gb, сеть не уложило.Кажись железную составляющую можно исключить.
Попробую обновить ядро (модули эти, ЕМНИП, там) - посмотрим что будет.
Непонятно только в каких логах смотреть что все-же реально происходит.
Обновление до 4.12.14-lp151.28.44.1 ничего не дало. Где-то ходили слухи что в 15.1 в ядре что-то там накосячили.... Пошел пробовать прикручивать что-то НЕ из реп 15.1
Накатил 4.19.114-1-default - результат тот-же.Дальше споткнулся в dmesg что при загрузке первым пытается загрузиться 8139ср, не находит совместимую карту и следом за ним грузится 8139too. Не знаю что меня дернуло, но решил сравнить это всё с соседней машиной на tumbleweed.
Странно, но там 8139ср, каким-то чудным образом, затесался в блэклист и не пытался грузиться. Прибил его и здесь — уже 40 мин практически при максимальной нагрузке торрентом на аплоад. Странно это конечно, чем оно вдруг могло мешать, но если обойдется этим — вообще супер ))
> Странно, но там 8139ср, каким-то чудным образом, затесался в блэклист и не
> пытался грузиться. Прибил его и здесь — уже 40 мин практически
> при максимальной нагрузке торрентом на аплоад. Странно это конечно, чем оно
> вдруг могло мешать, но если обойдется этим — вообще супер ))Грабли господни неисповедимы...
Не долго длилась моя радость :D
Ничего не изменилось, видать просто было случайное разовое просветление(
По ходу копаний выяснилось что виснет не сам 8139too, а mii, т.к modprobe -r 8139too mii && modprobe 8139too возвращает соединение к жизни...
> Не долго длилась моя радость :D
> Ничего не изменилось, видать просто было случайное разовое просветление(
> По ходу копаний выяснилось что виснет не сам 8139too, а mii, т.к
> modprobe -r 8139too mii && modprobe 8139too возвращает соединение к жизни...подарите кому-нибудь 8139 и не мучайтесь.
Странный подход, на выход использовать какашку Realtek 8139, а
на внутреннюю сеть Intel 82566DM-2.Если не хочется тратить деньги и есть PCI-E слот, полно дешевых карт
на базе Realtek 8111, другие не советую. Ну и отключите TSO.
> подарите кому-нибудь 8139 и не мучайтесь.Та такое и будет, пускай только карантин закончится, ну а пока можно и с ней повоевать. Меня аж подколбашивает от мысли что в окнах оно работает, а здесь нет :[
> Странный подход, на выход использовать какашку Realtek 8139, а
> на внутреннюю сеть Intel 82566DM-2.Что странного?
Внутри временами инфа гуляет десятками гиг, есть NFS-шары, а на одной машинке и вообще хомяк оттуда монтируется. А в мир всеравно канал 100/100 - там и сотки сетевушки за глаза.> Если не хочется тратить деньги и есть PCI-E слот, полно дешевых карт
> на базе Realtek 8111, другие не советую. Ну и отключите TSO.С наличием PCIex напряг: на мамке только один х16, но он занят, ну и ещё пара PCI (это dell optiplex 755dt), так что менять прийдётся на что-то pci'ное
>> подарите кому-нибудь 8139 и не мучайтесь.
> Та такое и будет, пускай только карантин закончится, ну а пока можно
> и с ней повоевать. Меня аж подколбашивает от мысли что в
> окнах оно работает, а здесь нет :[драйвер вестимо, вариаций realtek 8139, 8169, 8111 полно, чипы
продавались и карты мог делать кто угодно и как угодно.> С наличием PCIex напряг: на мамке только один х16, но он занят,
> ну и ещё пара PCI (это dell optiplex 755dt), так что
> менять прийдётся на что-то pci'ноенайти сейчас что-то pci'ное не просто, возможно ebay?
pci: лучше intel, если найдете, а из pci скорей всего 8169,
тоже не айс, чуть лучше 8139.