URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 130670
[ Назад ]

Исходное сообщение
"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 дней работы"

Отправлено opennews , 03-Июн-23 19:04 
В поставляемой с 2018 года серии серверных процессоров AMD EPYC 7002 ("Rome"), построенных на базе микроархитектуры "Zen 2", выявлена ошибка, в результате которой процессор зависает после 1044 дней работы без сброса состояния (перезагрузки системы). В качестве обходных путей блокирования проблемы рекомендуется отключить поддержку энергосберегающего режима  CC6 или перезагружать сервер чаще, чем раз в 1044 дней (примерно 2 года 10 месяцев)...

Подробнее: https://www.opennet.me/opennews/art.shtml?num=59243


Содержание

Сообщения в этом обсуждении
"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 03-Июн-23 19:04 
> примерно 2 года 10 месяцев

а можно точнее?


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Rock , 03-Июн-23 22:10 
> а можно точнее?

В статье указано абсолютно точное число. Попробуйте перечитать ее.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 04:53 
не могу, я тупой олень

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 05:22 
Для оленей цитата:

Судя по опубликованному на Reddit предположению, зависание происходит когда счётчик в регистре TSC (Time Stamp Counter), отсчитывающем число рабочих циклов после сброса, при частоте 2800 MHz достигает значения 0x380000000000000

Что тут не понятно? Зависает когда проц сделает 0x380000000000000 тактов (это число в 16-ричной системе). При частоте 2800МГц на это уходит около пары лет. Если частота другая, будет плюс-минус сколько-то. Современные процы частоту меняют все время подстраиваясь под нагрузку и соответственно от нагрузки еще зависит. В холостом режиме на пониженной частоте небось и лет пять может болтаться, или сколько там минимальная частота относительно 2800.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Jorik , 04-Июн-23 01:42 
EPYC FAIL

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 05:17 
> EPYC FAIL

your_trial_period_is_over.jpg (hardware edition)


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Alladin , 03-Июн-23 19:05 
Даже в майбахе такого нет!

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Gjklppoki , 03-Июн-23 22:52 
Топ гир, запорожец?

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 22:19 
Кларксон умолчал, что в G-Classe есть.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Ананас4к , 05-Июн-23 21:03 
Сабж классный был.. комменты под этой новостью доставляют. И топ гир и эпик фэйл

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 03-Июн-23 19:09 
Вот почему нужно сидеть на старом железе. Сижу на 4 пне и не вижу никаких проблем. Смузи-сайты и макакингом не занимаюсь.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Alladin , 03-Июн-23 19:14 
А вы точно не выключаете свой пень даже через два года? кажись через полгода он уже зависнет..

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 03-Июн-23 19:16 
С оплатой лишних пару стоек ты сам попосишь проц пошустрее и поэфыективнее, чтобы можно было в одну стойку уместить.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено n00by , 04-Июн-23 10:50 
Он не попросит: в прошлый раз признался, что отматывает электросчётчик.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 03-Июн-23 19:17 
> https://www.manualslib.com/manual/547870/Intel-Sl8k2-Pentium...

C 30й по 73ю страницу описаны баги этой линейки процессоров Pentium 4 90 nm.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Андрей , 03-Июн-23 19:17 
И он у тебя более 1044 дня без перезагрузки работает ?

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 03-Июн-23 19:19 
Тссс... у нищуков нет столько денег на электричество, особенно учитывая эффективность этого хлама.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Zenitur , 03-Июн-23 20:48 
Не знаю как насчёт двух лет аптайма, но месяцев 10 аптайма на домашнем компе - легко. Могло бы и больше быть, если бы иногда свет не вырубало. А если ждущий режим считается за аптайм, тогда и ноут у меня может работать год без выключения, правда 80% времени - в режиме ожидания :)

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено ыы , 03-Июн-23 21:49 
есть такая штука как упса... иногда помогает :)

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 03-Июн-23 21:54 
Можешь сидеть дальше, твой локалхост никого не интересует.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Анониссимус , 03-Июн-23 19:16 
Представляю круглизну глаз инженера, первым понявшего причину странного зависания :D

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 03-Июн-23 19:18 
Кажется, я нашёл причину, но пооверить сможем примерно через 2 года и 10 мясецев azazaz

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Danil , 03-Июн-23 23:18 
там можно в регистры писать любые числа, зачем ждать

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Neon , 05-Июн-23 04:41 
Ну тогда и сбросить этот несчастный счетчик тогда нет проблем)))

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 03-Июн-23 19:19 
$ uptime
19:17:34 up 1548 days,  3:35,  1 user,  load average: 0.23, 0.22, 0.15
$ dmesg|grep A20
[    0.000000] sunxi: Allwinner A20 (AW1651/sun7i) detected.

учитесь, амд!


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено EuPhobos , 03-Июн-23 19:24 
Ты не обновляешь систему?

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Oe , 03-Июн-23 19:39 
Зачем?

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 13:20 
К инету подключен? Тогда мы идём к вам!
Пожалуйста, перейдите на указанную страницу.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Kuromi , 03-Июн-23 19:51 
Так там проц Alwinner (ARM). Скорее всего какая-то встройка в которую никаких обновлений не светит все равно.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 03-Июн-23 22:38 
А что там обновлять если это скорее всего какой-то домашний NAS или роутер? Если голой жьёпой в интернет не светит, то беспокоиться вообще не о чем. Тем более это какой-то одноплатник, на который производитель забил, выпустив один раз кастомное ядро с патчами и всё.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 05:24 
> Ты не обновляешь систему?

У него одноплатник allwinner'овский. У меня на таких иногда года по полтора аптайма образуется, если оно вот так откровенно в сеть не вывешено.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 03-Июн-23 19:44 
1054 дней http://ixbt.photo/photo/261300/484599arRI2EwuK/jvAch2QbgA/86...
насколько помню, продолжал еще полгода работал без перезагрузки

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 03-Июн-23 20:05 
Ну всё сейчас начнутся с ссылки на серв с аптаймом 24 года. Так вот же она https://habr.com/ru/articles/320930/

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Zenitur , 03-Июн-23 20:54 
На сайте с приколами читал такую историю. Парень купил с рук ноут для дедушки. Обслужил, заменил батарею, и вдруг резко понадобилось уезжать из деревни обратно в город. Ноут остался на чердаке включенным. Проходит 12 лет. Парень закончил школу, институт, женился, завёл детей. Когда он снова поднялся на тот самый чердак, его невозмутимо встретил экран с Win 3.1 и запущенным Сапёром...

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено ыы , 03-Июн-23 21:40 
а мог бы приключиться пожар...

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Котофалк , 03-Июн-23 22:16 
если нет аккумулятора с литием - не мог.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено ыы , 04-Июн-23 21:17 
дождь, протекшая крыша, залило из форточки, мышка пописала... мало ли...

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Котофалк , 06-Июн-23 19:10 
> дождь, протекшая крыша, залило из форточки, мышка пописала... мало ли...

Всё так. Тонкость в том, что стационарный комп или ноут без аккумуляторов ничего не добавляют к этой картине.



"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Брат Анон , 05-Июн-23 08:09 
Чтобы устроить пожар 220 В и грязной воды достаточно.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Котофалк , 06-Июн-23 19:08 
> Чтобы устроить пожар 220 В и грязной воды достаточно.

Нет конечно. Для пожара нужны горючие (поддерживающие горение) материалы. В среднестатистическом жилище их хватает. А в ноуте без аккумулятора их нет. Поэтому наличие включённого ноута на вероятность возникновения пожара влияет чуть менее, чем никак.



"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено n00by , 07-Июн-23 07:09 
>> Чтобы устроить пожар 220 В и грязной воды достаточно.
> Нет конечно. Для пожара нужны горючие (поддерживающие горение) материалы. В среднестатистическом
> жилище их хватает. А в ноуте без аккумулятора их нет. Поэтому
> наличие включённого ноута на вероятность возникновения пожара влияет чуть менее, чем
> никак.

За 12 лет на чердаке ноут запылится. При этом забьётся в первую очередь система охлаждения. Пыль в деревне - частицы чернозёма и растений. Стол на чердаке у деда - пересушенное дерево, а не ДСП.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Котофалк , 13-Июн-23 19:52 
> При этом забьётся в первую очередь система охлаждения.

Всё верно. Ведёт вырубанию. В дальнейшем с огромной вероятностью - проблемам с включением вообще.

>  Пыль в деревне - частицы чернозёма и растений. Стол на чердаке у деда - пересушенное дерево, а не ДСП.
> Чтобы устроить пожар 220 В и грязной воды достаточно.

Договорись уже внутри себя чего там достаточно. И да, я бы спокойно отнёсся к принципу "я так не делаю и не рекомендую, мало ли что", но вот эти "обоснования" - ерунда на постном масле. Компы, годами работающие в самых разных условиях - медицинский факт. Поговори со строителями домосеток, в каких условиях у них свичи стояли, что в грозы происходило. Повторю ещё раз, вдруг дойдёт. Как причина пожара современная (лет 20 назад - включая) компьютерная техника, не содержащая литиевых аккумуляторов, на пару порядков менее опасна, чем просто тупо проводка.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено n00by , 14-Июн-23 06:29 
>> При этом забьётся в первую очередь система охлаждения.
> Всё верно. Ведёт вырубанию.

Ведёт, в первую очередь, к тепловому пробою полупроводника, со всеми вытекающими. Что бы его избежать, вводится контур обратной связи. С "огромной вероятностью" он сработает, да. То есть вероятность неопределена.

> В дальнейшем с огромной вероятностью - проблемам с
> включением вообще.

То есть вероятность, что включится, отлична от нуля.

>>  Пыль в деревне - частицы чернозёма и растений. Стол на чердаке у деда - пересушенное дерево, а не ДСП.
>> Чтобы устроить пожар 220 В и грязной воды достаточно.
> Договорись уже внутри себя чего там достаточно.

Договорись? Научись читать, потом раздавай советы, приписывая оппоненту чужие слова.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Котофалк , 14-Июн-23 17:46 
> Ведёт, в первую очередь, к тепловому пробою полупроводника, со всеми вытекающими.

Звучит страшно. Выглядит как "найди меня наощупь/тепловизором" потому что зачастую повреждения не видны глазом.

> То есть вероятность, что включится, отлична от нуля.

И при этом вероятность "включится" в стороне от обсуждаемой "вероятность стать причиной пожара". Ну так про между прочим температура возгорания дерева от 450°C.

> Договорись? Научись читать, потом раздавай советы, приписывая оппоненту чужие слова.

Другой ник не гарантия, что собеседник другой и слова чужие. Есть же ненулевая вероятность... )


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено n00by , 14-Июн-23 20:06 
>> Договорись? Научись читать, потом раздавай советы, приписывая оппоненту чужие слова.
> Другой ник не гарантия, что собеседник другой и слова чужие. Есть же
> ненулевая вероятность... )

Спасибо, что охарактеризовал, кто ты есть.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Котофалк , 15-Июн-23 21:14 
Да уж это как водится.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено n00by , 16-Июн-23 08:11 
> Другой ник не гарантия, что собеседник другой и слова чужие.
> Да уж это как водится.

Мне одно не понятно: зачем ты пишешь как "Брат Анон" и при этом с собой споришь?


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Брат Анон , 20-Июн-23 08:36 
> Нет конечно. Для пожара нужны горючие (поддерживающие горение) материалы. В среднестатистическом
> жилище их хватает. А в ноуте без аккумулятора их нет. Поэтому
> наличие включённого ноута на вероятность возникновения пожара влияет чуть менее, чем
> никак.

Разумеется, да. Твои пото-жировые выделения и китайский негорючий пластик горят великолепно.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Котофалк , 22-Июн-23 18:30 
На ноут, оставленный на годы на чердаке их не хватит, тем более что основная их масса будет на твоём мониторе :-)

И откуда китайский пластик в продукции американских HP, ASUS, Dell, Lenovo? Вы на что намекаете?


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Брат Анон , 23-Июн-23 08:36 
> На ноут, оставленный на годы на чердаке их не хватит, тем более
> что основная их масса будет на твоём мониторе :-)

Что, и пластика в ноуте нет? И пыль не набивается в него (особенно тополиный пух)?

> И откуда китайский пластик в продукции американских HP, ASUS, Dell, Lenovo? Вы
> на что намекаете?

Смотрю на свой леново: ты где сделан? Леново (грустно): в Китае.
Смотрю на рабочий асус: а ты где сделан, мой особо защищённый сертифицированный друг? Асус (покраснев от стыда): в Китае.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 03-Июн-23 22:45 
Всё это страшилки из совка. В то время делали телевизоры на текстолите который горел как ракетное топливо. В нынешнее время 99% бытовых и промышленных пожаров происходят от несоблюдения техники безопастности, т.е. человеческий фактор. Само по себе оборудование в принципе пожар не может создать. Слишком малые токи и напряжения, да и гореть там нечему.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Oe , 04-Июн-23 00:03 
В подавляющем большинстве как отечественных так и импортных телевизоров используется гетинакс, и даже он не горит, да и стеклотекстолит тоже. Горели когда ставили гвозди вместо предохранителей.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Электрон , 04-Июн-23 01:05 
> Само по себе оборудование в принципе пожар не может создать.

Индусы и не такое спроектируют. Хотя нет, китайцы. Блин, тайваньцы. Да, а какая разница?

1) gamersnexus nzxt h1 riser fire hazard
2) gamersnexus gigabyte exploding power supplies
3) gamersnexus melted motherboard

"Гореть нечему" - рядом находиться может что угодно. Да, я согласен про 99%, но дешевая зарядка воткнутая рядом со шторами...


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 05:30 
Однако вот именно поджечь допустим FR4 - ну попробуйте вообще. FR так то означает "устойчивый к горению". И кстати какой-нибудь корпус питальника тоже обычно или металлический, или если пластиковый то UL94 V0.

Поэтому вот именно сжечь что-то... ну разве что литиевая батарейка, но это не про ноут с вин 3.1, их тогда еще не было. Да и защитами она там обложена, ее скорее контроллер навечно отключит и заблокирует чем что-то еще. Не особо кстари приятный прикол если вы ноутом пользовались а контроллер решил что ему что-то не нравится - и - опа - еще 5 секунд назад у вас была батарейка, а теперь она 100% бесполезна.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноньимъ , 04-Июн-23 02:46 
>Само по себе оборудование в принципе пожар не может создать. >Слишком малые токи и напряжения, да и гореть там нечему.

Какая звенящая чушь, вы хоть поинтересуйтесь каким током современные смартфоны заряжаются, и плотностью энергии литиевых аккумуляторов.

Я уже молчу про стационарные ПК в которых сотни ампер гуляют.

Ну а в миксере понятно гореть вообще нечему, слишком малые токи и напряжения.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 04:57 
тебе бы в универ сходить, перестанешь нести чушь

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 05:34 
> тебе бы в универ сходить, перестанешь нести чушь

Ну вообще-то линии мощного питальника 12 вольт в ATX специально делят на несколько подветок, с индивидуальными защитами. Чтобы опасность снизить, лимит кажется 240W на ветку, т.е. 20 ампер.

Тем не менее поджечт что-то можно и парой ваттов - если к тому условия есть. А если нету то и киловатта маловато будет. Ну вон плита 2 киловатта жрет, однако чтобы там что-то загорелось это надо еще откуда-то притащить и насыпать сверху. А кусок стеклокерамики гореть не может принципиально.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Атон , 04-Июн-23 20:15 
> линии мощного питальника 12 вольт в ATX специально делят на несколько подветок, с индивидуальными защитами. Чтобы опасность снизить, лимит кажется 240W на ветку, т.е. 20 ампер.

только потому, что оборудование не может мотать больше в одну обмотку трансформатора.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 05-Июн-23 00:47 
> только потому, что оборудование не может мотать больше в одну обмотку трансформатора.

Обмотка 12 вольт у транса БП обычно 1 на всю толпу как раз. На такие токи разумеется пучком параллельных проводов (1 жирным на такие частоты не катит). И выпрямитель 1 на всю толпу. В хороших современных - синхронный. В современных БП из тех же 12V остальное потом делается DCDC.

А на защиты 1 мощный 12V рельс уже потом разветвляется, стоят несколько отдельных шунтов на мониторинг токов в "своих" подветках, лимитируя то что наружи идет. До этих шунтов все вместе идет. Там пользователь не копается же, а на этикетке честно написано "hazardous area".


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено n00by , 04-Июн-23 19:20 
Поздравляю, Вы вызвали пожар у эксперта по отмотке электросчётчиков и накрутке минусов.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 05-Июн-23 00:48 
> Поздравляю, Вы вызвали пожар у эксперта по отмотке электросчётчиков и накрутке минусов.

При том горит кажется немного ниже спины. Куда и дорога.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Котофалк , 06-Июн-23 19:14 
> Я уже молчу про стационарные ПК в которых сотни ампер гуляют.

Не молчите, гуляют. А в подсветке экрана ноута тысячи вольт. При этом ни в ноуте без аккумулятора, ни в стационарном компе поддерживать горение нечему.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 07-Июн-23 05:10 
> Не молчите, гуляют. А в подсветке экрана ноута тысячи вольт.

Они там с весьма серьезным ограничением мощности (и тока) и только пока лампы не зажгутся. Поэтому не такие уж и убийственные и тем более не склонны что либо поджигать. Даже если закоротило. Микроволновки намного страшнее, там 1-2 киловольта без лимита мощности, вот под это попасть - абзац почти неизбежен.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Котофалк , 13-Июн-23 19:57 
> Поэтому не такие уж и убийственные и тем более не склонны что либо поджигать. Даже если закоротило.

Мне про это рассказывать не нужно ) Я вот выше написал своё отношение. Современная компьютерная техника как причина пожара не канает. Не в последнюю очередь потому, что это результат вполне себе целенаправленных мер.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено soarin , 04-Июн-23 07:20 
> Всё это страшилки из совка

Нет. На YouTube можно найти видео с камер наблюдения, как бабахает ноутбук оставленный на зарядке.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 05-Июн-23 01:34 
>Всё это страшилки из совка.

У меня зарядка для тинкпада с какого время начала греться при включении в сеть, и еще чере какое-то время стала тупо вызывать замыкание при включении ее в сеть.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 05-Июн-23 21:07 
> У меня зарядка для тинкпада с какого время начала греться при включении в сеть,

Что-то пошло не так и силовым компонентам стало душно. В этот момент оно еще вполне фиксабельно обычно. Мало ли, например сетевой электролит после выпрямителя в старых "кирпичах" иногда мрет, потому что электролиты - не вечные. Или электролиты на выходе, у них режим тяжелый, но это глюки у ноута в процессе обычно вызывает.

> и еще чере какое-то время стала тупо вызывать замыкание
> при включении ее в сеть.

А это видимо от перегрева, или чего там, уже силовой полевик скопытился и ушел в КЗ. И там в лучшем случае недешевый силовой полевик дохлый, а если не повезло то и все что вокруг, от контроллера до кучи обвеса, и там проще перечислить что живое осталось :)


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Котофалк , 06-Июн-23 19:19 
> У меня зарядка для тинкпада с какого время начала греться при включении
> в сеть, и еще чере какое-то время стала тупо вызывать замыкание
> при включении ее в сеть.

Ну да. И тут возникает возможность получить пожар, если у вас будут настоящие причины: неисправная проводка и неверно смонтированные предохранители и УЗО. Ваша с(т)ранная зарядка максимум потечёт пластиком и сработает защита розетки.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Neon , 05-Июн-23 04:43 
Прям страшилки. Горят и взрываются еще как те же мосфеты, электролиты, вообще, бомба

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Doc , 13-Июн-23 10:41 
Вот только что мосветы что электролиты вызываются от нагрева, и открытого огня там нет. Просто идет перегерев и выделение газа который разрывает корпус , вот и все

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 03-Июн-23 22:52 
Уж не знаю из чего делали аккумы в старых ноутах, но у меня есть Pentium MMX 166 ноут из 90-х, и если его зарядить, он держит до получаса. Современные ноуты с огромными объемами банок деградируют за 2-3 года, и то даже при условии что почти всё время подключены к розетке стоя на столе. Есть ультрабук dell latitude 2018 года, весьма дорогой и качественный, тогда стоил как макбук, используется крайне редко, может часа 2 в неделю, так он уже половину ёмкости потерял.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Jorik , 04-Июн-23 01:47 
Так Литиевые акумы и мрут от бездействия, их гонять надо немного.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 05:44 
> Так Литиевые акумы и мрут от бездействия, их гонять надо немного.

Это пассивация, их просто надо разрядить-зарядить после долгой неактивности 2-3 раза, чтобы слой пассивации разрушился. Слой пассивации кстати тормозит порчу химии, так что иногда можно набрести на относительно живую литиевую батарейку возрастом 10-15 лет, как ни странно. Правда совсем это старение не отменит и ее внутреннее сопротивление и емкость конечно уже не те что у свежака были.

И еще этот слой тормозит саморазряд. Так что акум может проваляться несколько лет и оказаться с приличным запасом электричества.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Бывалый смузихлёб , 04-Июн-23 08:18 
Это же не свинцовый аккум чтобы там с пассивацией проблемы были и как-то решались

Подобное вроде если и работает то на конечных сборках литий-ионных аккумов и обычно применяется для коррекции параметров некоторых контроллеров заряда, мол, чтобы поняли сколько в банки реально можно энергии загнать
Хотя и не сказал бы чтобы сильно помогало


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 08:44 
> Это же не свинцовый аккум чтобы там с пассивацией проблемы были и
> как-то решались

RTFM какой-нибудь продвинутый ресурс по акумам и их заряду и эксплуатации. Если заряд в литии не гонять туда сюда, там вполне себе образуется слой пассивации у электродов, внутреннее сопротивление лития растет. Очень "доставляет" например в автономных датчиках с GSM, когда те пытаются свои пару ампер в импульсе отожрать от банки, которую до этого долго не трогали. А там упс - напряжение в плинтус, модуль модема в ребут/poweroff, а может и не только он. Хотя электричества в банке море, и банка нормальная в общем то. Если б не вот это вот. После пары циклов эффект разумеется уходит. Но паттерны поведения датчика могут и не соответствовать оптимальным в этом плане, его задача в холостом режиме жрать как можно меньше, тут то пассивация и случается, если интересного события долго не было.

Зато с другой стороны саморазряд, вот, уменьшает. Если литий свежий, с фабы - он в зависимости от может довольно заметно терять заряд. Но если его подзарядить и не циклировать, потом он держит заряд намного лучше, годами, потому что пассивирующий слой нарос. Это обратимое изменение, через пару циклов с приличной скоростью - слой разрушится и станет как было без него. По этой причине поверье что для полной емкости лития надо пару циклов в новом девайсе сделать имеет определенный смысл. Но только если девайс долго валялся, свежепроизведенному нафиг не надо.

И кстати с чего вы взяли что разные химии не могут показывать в чем-то похожих свойств? У свинца даже метод заряда в чем-то похож, по сути тот же CC/CV - только в литий нельзя trickle charge в отличие от свинца, он от этого быстро портится и становится опасен.

> Подобное вроде если и работает то на конечных сборках литий-ионных аккумов и
> обычно применяется для коррекции параметров некоторых контроллеров заряда,

Я это для единичных банок проверял. Лично. "RAW" банок - даже без платы защиты. Ну вот есть их у меня, в виде "18650 unprotected" в основном, хотя есть и призматические индустриальные, тоже без защит, только сама банка. Специально такое бралось чтобы нонейм защиты не гадили лишний раз, где надо я более предсказуемые платы размещаю.

> мол, чтобы поняли сколько в банки реально можно энергии загнать
> Хотя и не сказал бы чтобы сильно помогало

Это тоже имеет под собой определенную почву: контроллеры банок с мозгами отказываются считать цикл валидным если изменение очень большое, они лимитируют объем изменений статистик банки с которыми согласны и чтобы они актуализовались до нового фактического состояния банки может потребоваться несколько полных циклов. Еще актуально если в батарее банки сменили, там характеристики точно отъехали, а контроллер не в курсе так сразу.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Бывалый смузихлёб , 04-Июн-23 08:09 
Там могут быть какие-нибудь металлогидридные - вообще почти неубиваемые, тяжёлые только
А старые литий-ионные - вполне опасны. В первых поколениях( 80/90-е ) один из электродов был с с металлическим литием и в ходе разрядок-зарядок постепенно прорастал к другому электроду( дендритообразование ), в итоге получалось внутреннее КЗ разной степени тяжести от просто нагрева и гибели аккума и вплоть до смачного пожара, ведь помимо перегрева внутри ещё и литий металлический был

Литий-ионные вроде как нельзя постоянно держать подключенными к заряднику - то ли сами банки помирают, то ли - с контроллером что-то происходит( неправильно насчитывает циклы и переток энергии )
Если ноут постоянно на зарядке - надо аккум зарядить и снять


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 09:17 
> то ли сами банки помирают, то ли - с контроллером что-то происходит

Да вообще можно, и с современными банками и контроллерами заряда ничего такого не будет, по крайней мере в ноутах для которых это обычный сценарий. НО литий в полностью заряженном состоянии деградирует ощутимо быстрее чем чем полуразряженный.

Минимальная скорость деградации - при заряде процентов на 60-70, но контроллер разумеется не держит настолько низкий уровень, обычно болтается между 4.1 и 4.2 вольтами, как подразрядится до порога так и врубает новый цикл до верху. У новых химий топ не 4.2 а 4.3, 4.35 или даже 4.4 вольта бывает, потому что они прокачаны лучше переживать "оверкилл" перезаряда, набирая еще больше энергии в банку без деградации ее химии - но идея остается. Тем не менее, без деградации оно так то условно и те кому долгая жизнь банок важна их до 3.9V заряжают вместо вон того. Правда и емкость при этом лишь 70% номинала. Это для всяких военных, космоса, автономных систем и проч практикуется, где обслуживать акумы будет некому или не в тему.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Бывалый смузихлёб , 04-Июн-23 10:42 
> 3.9V заряжают вместо вон того. Правда и емкость при этом лишь 70% номинала

И это ещё не самый плохой вариант. По сути выходит, что литий-ионные аккумы толком и не развивались последние годы - просто совершенствовались алгоритмы и условия их перезарядки чтобы сразу не бахнули

> Да вообще можно, и с современными банками и контроллерами заряда ничего такого не будет

Смутно помню, с той темой немного разгребал. Там получалось, что блоки могут некорректно учитывать количество циклов заряда-разряда и объёмы перетока энергии, поскольку оно идёт постоянно но понемногу и по мнению некоторых контроллеров аккум был в гораздо худшем состоянии чем оказывался по факту. Это отчасти и мобильников касалось


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 20:28 
>> 3.9V заряжают вместо вон того. Правда и емкость при этом лишь 70% номинала
> И это ещё не самый плохой вариант. По сути выходит, что литий-ионные
> аккумы толком и не развивались последние годы -
> просто совершенствовались алгоритмы и условия их перезарядки чтобы сразу не бахнули

И еще химия. Чем больше финальное напряжение тем больше в батарее заряда. Но увы, выше энного порога циклы очень сильно рушат банку. Обычную банку на 4.2 вольта можно и до 4.3-4.4 догнать. Сразу не #$%нет. И энергии отдаст больше. Может все 120% номинала даже. Но банка в таком режиме "овердрафта" за десяток циклов убьется в хлам, емкость деградирует, банка будет опаснее. Всякие продвинутые присадки эффект заруливают и в результате многочисленных потуг появились банки которые ОК сперва с 4.3, потом 4.35, а сейчас вроде до 4.45 вольт специфицированы некоторые. И конечно при прочих равных в банке на 4.45 больше энергии чем на 4.2, а благодаря улучшениям химии банка по циклам не проседает.

Кстати некоторые старые гаджеты кажется целенаправленно продляли литию жизнь. Скажем старые нокии целенаправленно до 4.1 .. 4.15 с копейками, а не полные 4.2 заряжали, стоило им 5-10% заряда, зато сильно добавляет жизни батарейке. Оказывается бывает и так что производитель заботится о сроке службы расходника.

> Там получалось, что блоки могут некорректно учитывать количество циклов заряда-разряда

Могут, потому что много мини-циклов и как их вообще надо учитывать с точки зрения прикидок жизни батареи - большой вопрос. Батареи выдерживают сильно больше циклов если они неполные. А некоторые контроллеры даже реализуют режим работы от сети когда они как раз не заряжают батарею на 100% а скорее на 70% - так батарея сильно меньше деградирует, полностью заряженная батарея стареет быстрее, так нежелательные побочные процессы активнее.

> и объёмы перетока энергии, поскольку оно идёт постоянно но понемногу

Ну не постоянно, постоянно литий нельзя, там обычно гистерезис есть: дают подразрядиться на пару десятых вольта, потом заново алгоритм заряда пускают. Но заметный процент цикла на слаботочной части CC/CV, в CV части, там точность измерения токов (и зарядов) никакая, контроллер что-то выколупывает из шумов и младших разрядов ADC. Изредка и горе от ума случается, но обычно для ноутов такой кейс все же тестируют т.к. иначе с г-ном замесят в отзывах.

> и по мнению некоторых контроллеров аккум был в гораздо худшем состоянии чем
> оказывался по факту. Это отчасти и мобильников касалось

Как один из вариантов - он возможно принимает цикл пассивированого акума за чистую монету, апдейтит статистики в минус, а когда после нескольких активных циклов пассивация слетает начинает недооценивать батарейку, что логично. В лучшем случае через несколько циклов отапдейтит обратно в плюс. В хучшем будет подвирать, в минус параметры батарейки они апдейтят охотнее чем в плюс, ожидая деградацию.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 06-Июн-23 15:34 
Металлогидридные это новьё, их в 90х не было. Скорее всего там никель-кадмий.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено ano , 03-Июн-23 23:29 
то байка. чтоб в деревне за 12 лет не вырубили свет хотя бы пару раз на подольше чем батарея живёт - такого не бывает.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 10:28 
Да и ноутбуки во времена виндовс 3.11 были слишком редким и дорогим удовольствием, что бы их забывать на деревне у дедушки.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Zenitur , 05-Июн-23 11:58 
Скорее всего, это уже времена Windows XP, а ноут к этому времен был устаревший.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 08-Июн-23 03:50 
Скорее всего, это просто интернет-байка.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 05-Июн-23 20:31 
> то байка. чтоб в деревне за 12 лет не вырубили свет хотя
> бы пару раз на подольше чем батарея живёт - такого не бывает.

Представляешь, в европах и штатах свет в сельской местности заметно стабильнее. Потому что там не воруют электричество всякие "гении" скручивающие счетчик и у энергокомпаний есть деньги на обслуживание своего хозяйства и замену оборудования. А вон там гражданин скручивающий счетчик думает что всех наел. А потом из-за таких вся толпа и сидит днями без электричества, поскольку древняя инфраструктура давно прогнила и ей место уже давно в металлоломе, но заменить ее энергетикам просто не на что.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено n00by , 06-Июн-23 07:30 
С США свет настолько стабилен, что они об этом сняли боевик с Джоном Траволтой и Шерон Стоун в роли спившейся жены погибшего электрика. Life on the Line называется.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 06-Июн-23 10:01 
> С США свет настолько стабилен, что они об этом сняли боевик с
> Джоном Траволтой и Шерон Стоун в роли спившейся жены погибшего электрика.
> Life on the Line называется.

Если по боевикам изучать окружающий мир, можно сделать вывод что по улицам бегают исключительно толпы динозавров вперемешку с злобными, почти неуничтожимыми, роботами, а население городов, если оно вдруг есть, целиком состоит из агентов хрен знает каких организаций, делящихся на супергероев и суперзлодеев, вероятно, распределяясь по утрам методом камень-ножницы-бумага, на орбите болтаются супермены пополам с межзвездными крейсерами, из океанов постоянно лезет какая-то дичь размером с небоскреб, а если вам надоест и вы решите сныкаться в горах, то познакомитесь с йети и прочей неведомой фигней, в которой нет недостатка т.к. желающих порвать на части человечесвтво известно более 9000 и они выстроились в очередь за право убить всех человеков. Но как мне кажется, хотя в мире набитом камерами и дронами, всяким хайтеком, вундервафлями и проч в это не так уж и сложно поверить, боевики все же несколько преувеличивают, для красного словца, красивых эффектов, и главное зрителей и кассовых/прокатных/прочих сборов.

А капиталисты жадные. Если свет не идет, денежка не капает. Жаба душит. И драпают чинить в темпе вальса, настоящий капитализм - это так. Это побуждает капиталистов на дофига всяких ухищрений. Вон придумали как 12-13kV линии датчиками облепить, питаемыми оттуда же. Датчики мигом просекают аномалии - так что они в курсе какого-нибудь подкорачивающего дерева еще до того как все срубится - и убирают его нафиг. А заодно любопытные вопросы "а что это на проводах?" и "а как оно от 12kV питаться может?!". Или вот такое - https://en.wikipedia.org/wiki/Live-line_working - на что только не пойдешь чтобы линию не вырубать. А, да, у россиян даже статьи такой нет. Почувствуйте разницу, в РФ никто не полезет под 10-35kV без их отклюка. Да, электрикам более стремно. Зато свет срубают в итоге меньше.

...но как вы понимаете, все это не получится с бухарем Васькой работающим за бутылку, он мигом обуглится работая на живых ...цати киловольтах. И датчики такие россияне вроде не умеют делать совсем. Да и откуда денег на это взять, если электричество дешевое но даже так - крадут?! Там даже транс взамен помершего или денег на него искать целое действо. Да и линия в каких-нибудь дебрях которые давно заросли выше всякой критики, окультурить некому, нет людей и техники. Ну вот и сидит деревня после какого-нибудь неудачного факапа 2 дня без света, а драные энергетики без денег. И половина деревни не платило и/или это не было выгодно, то и особого стимула быстро чинить нет. А нахрена?


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено n00by , 06-Июн-23 17:00 
> Или вот такое - https://en.wikipedia.org/wiki/Live-line_working

Да-да, вот такие деревянные столбы как по ссылке и падали в том фильме на головы, поскольку корпорации экономят. Такая же чернуха как при закате СССР, но со спецэффектами. Пока снимали фильм, погибло 112 электромонтёров (ц)


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 07-Июн-23 05:41 
> Да-да, вот такие деревянные столбы как по ссылке и падали в том фильме на головы,

Бывает и хуже. Если по интернету поискать, в русскоязычном сегменте и без фильмов предостаточно страшилок связанных с электричеством на все вкусы. Ну и если на то пошло, lineman'ы совершенно добровольно на работу нанимаются и знают на что идут. Никто не запрещает безопасно сидеть в уютном офисе или даже дома, если мозгов хватает, или орать "свободная касса" заворачивая бургеры в пакет. А то что платят в разы меньше, ну так это ж не на столбе с 12kV висеть, желающих как раз больше.

> поскольку корпорации экономят.

Они экономят лишь до тех пор пока это сервис не нагибает. Потому что если электричество вырубилось, счетчик не тикает и они получают фигу. Это очень вредно. И да, lineman'ы опять же в курсе что от скорости их работы их зарплата зависит.

> Такая же чернуха как при закате СССР, но со спецэффектами.

Да вот видите ли, денег на трезво выглядящих монтеров, недешевые датчики состояния линий, новые трансформаторы и проч - у штатовских компаний как-то находится. И кстати они еще 60Гц любят вместо 50, видимо и чтобы меньше медяки на трансы тратить.

> Пока снимали фильм, погибло 112 электромонтёров (ц)

Пока мы трындели тут, даже в одной только РФ умерло сильно больше. В том числе и не своей смертью. И даже не пытаясь принести свет людям. Такая ерунда.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 10:13 
О том сколько тВт нагорело электроэнергии анекдот не уточняет? Не разорился ли дедушка?

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 05-Июн-23 00:55 
> О том сколько тВт нагорело электроэнергии анекдот не уточняет? Не разорился ли дедушка?

Что такое тВт? Если тераватты то там Т большое. И вообще-то калькулятор можно было взять до того как умничать. Ну сколько ноут может жрать, особенно в спячке или холостом режиме? Десяток ваттов? Ну вот и считайте. Пусть даже он 10 киловаттов за месяц сожрет - а вы вообще заметите это в счете?


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Криптоханыга , 04-Июн-23 18:30 
Сказочники никогда не жили в деревне? Чтобы за 12 лет ни разу не вырубили электричество на несколько часов - такого даже в городе-милионнике не бывает.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено ыы , 05-Июн-23 05:22 
он знал на что шел.. сразу поставил там солнечную батарею + термобатарею + ветростанцию + проточный генератор работающий на капельках дождя... а может просто запитал от ядерного реактора по типу как на спутниках стоят...

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено ыы , 03-Июн-23 21:37 
21:34:55 up 2440 days,  6:27,

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 03-Июн-23 21:55 
Нет, дольше 400-500 дней аптайма не рисковали, апдейтов набегает вагон даже для гипервизора.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 11:44 
uptime
11:41:48 up 1878 days, 17:37,  2 users,  load average: 0.11, 0.24, 0.28

cat /proc/cpuinfo | grep model
model           : 6
model name      : AMD Turion(tm) II Neo N41H Dual-Core Processor
model           : 6
model name      : AMD Turion(tm) II Neo N41H Dual-Core Processor

P.S. Это не ноутбук и вообще не персональный комп.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 12:06 
Это т.н. control plane, Fedora Linux, systemd присутствует :)

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Мяут , 10-Июн-23 12:12 
В SPARC'ах эту фичу позднее добавили:
https://support.oracle.com/knowledge/Sun%20Microsystems...
Solaris sun4v domains may panic after 1101 days of uptime (Doc ID 2245358.1

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Kuromi , 03-Июн-23 19:49 
"Исправление ошибки публиковать не планируется. Проблема долгое время оставалась не замеченной так как многолетние uptime не типичны для серверов, которые для поддержания в актуальном состоянии периодически приходится перезапускать для установки обновлений ядра или для перехода на новый выпуск операционной системы."

С одной стороны это логично, с другой стороны сразу становится понятно почему условнае NASA использует совсем другое железо и другого качества. Представьте себе космический зонд зависший через 3 года. Вояджер сколько уже там летит, 50 лет?


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 03-Июн-23 20:03 
7 бед один ресет. У вояджера на этот случай два процессора. Даже если процессор с багом они попеременно могут работать. Сложные системы проектируют с расчетом что в проце точно есть баг, возможно из-за старения, но никто не знает какой.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Kuromi , 03-Июн-23 20:13 
> 7 бед один ресет. У вояджера на этот случай два процессора. Даже
> если процессор с багом они попеременно могут работать. Сложные системы проектируют
> с расчетом что в проце точно есть баг, возможно из-за старения,
> но никто не знает какой.

И тем не менее были случаи когда не помогало. Из относительно недавнего вспоминается наш спутник который вышел на орбиту, но так и не смог заработать и сгорел впоследствии.
Да и не только у нас такое было.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 04:58 
ваш это чей? куроми не гуглится

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 03-Июн-23 20:14 
И все процессоры одновременно зависнут... Резервирование - это защита от высокоэнергетичных частиц, а не от программных и аппаратных багов.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 03-Июн-23 20:59 
И будут сброшены по таймеру

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 03-Июн-23 21:21 
По watchdogу можно и один процессор перезагрузить.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 00:51 
Ерунда. И от программных, и от аппаратных багов вполне себе резервирование защищает.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 04-Июн-23 20:43 
На этот случай там есть watchdog. Ребутнётся, и порядок.
В таких аппаратах вероятность нештатной работы процессоров однозначно учитывается.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 00:28 
Шесть процессоров. Не два а шесть. Трех разных типов.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Neon , 05-Июн-23 04:45 
А как определить, кто из пары глючит ? Нужен еще третий. А кто контролирует контролера ?

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 05-Июн-23 20:43 
> А как определить, кто из пары глючит ? Нужен еще третий.

Даже это частично решаемо, скажем тестовыми контрольными точками с заранее известными результатами. Не панацея но глючную систему отловить можно.

> А кто контролирует контролера ?

Это может быть хардварная логика вообще, в которой ломаться не так уж много чему и есть. Впрочем, даже с софтом проверки можно закольцевать и системы будут проверять друг друга. Если есть несколько полных закольцованых веток, при обнаружении в 1 из них таких вещей уповать на другие, пока эта например полностью перезагружается, возможно даже целиком, по питанию, и если оно еще способно работать - оно подхватит после восстановления состояния. А если померла так померла, что уж делать, система продолжит работу с меньшим запасом надежности.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено username , 03-Июн-23 21:42 
Ну, сервер это не вояджер. Мало того, что иногда приходится перезагружать, скажем, для обновлений, так еще и энергосбережение чаще всего отключают в первую очередь

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено www2 , 03-Июн-23 21:57 
Перезагружать лучше по плану, когда минимум ущерба будет, а не среди бела дня из-за перепрлнения какого-то счётчика в процессоре. На работе достался в наследство сервер, который 9 лет не перезагружали. Пришёл я и всю малину обгадил - начал всякие обновления ставить :D

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 03-Июн-23 22:44 
Зачем? До тебя этот сервер никому не был нужен, уже и уязвимости, к нему применимые, все забыли, а теперь точно сломают...

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 04-Июн-23 20:44 
На аптаймодрочерство давно можно забить, кластеры решают.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 05-Июн-23 20:37 
> Перезагружать лучше по плану, когда минимум ущерба будет, а не среди бела
> дня из-за перепрлнения какого-то счётчика в процессоре.

Обычно так и получается - большую часть серверов апдейтят чаще чем раз в 2 года. Так что ограниечние забавное но реального вреда от него не так уж много.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Бывалый смузихлёб , 04-Июн-23 09:06 
Под космос совсем другие и требования и технологии. Хотя посмотришь сейчас на такой проц или память - даже до бюджетного смартфона как до луны, а стОит - как вся китайская провинция, делающая те смартфоны

По процам иногда в забугорной военщине забавней бывает. Порой разработка какого-то комплекса настолько растягивается, а на что-то новое настолько лень переделывать, что проще затолкать целые шкафы старых процов.
Например, у новейшей версии американского Пэтриота стоит несколько ящиков Intel Paragon i860 по производительности примерно уровня Эльбурс-2


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 09:49 
> Под космос совсем другие и требования и технологии.

Когда как. Масковский корабль летает на обычном x86. Или вон вертолетик на марсе из ширпотреба деланый. Там же резервирование да и дополнительные проверки и мк на исполниловку.
> Например, у новейшей версии американского Пэтриота стоит несколько ящиков
> Intel Paragon i860 по производительности примерно уровня Эльбурс-2

Думается у них электричества немеряно, производительность у встраиваемой техники - "достаточная", т.е. либо решает свои задачи в реальном времени, либо нет, апгрейдить смысла мало. А радикально перепахивать древний проект... оно точно надо, если он работает и запас комплектухи есть?


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Kuromi , 04-Июн-23 19:12 
>> Под космос совсем другие и требования и технологии.
> Когда как. Масковский корабль летает на обычном x86. Или вон вертолетик на
> марсе из ширпотреба деланый. Там же резервирование да и дополнительные проверки
> и мк на исполниловку.
>> Например, у новейшей версии американского Пэтриота стоит несколько ящиков
>> Intel Paragon i860 по производительности примерно уровня Эльбурс-2
> Думается у них электричества немеряно, производительность у встраиваемой техники - "достаточная",
> т.е. либо решает свои задачи в реальном времени, либо нет, апгрейдить
> смысла мало. А радикально перепахивать древний проект... оно точно надо, если
> он работает и запас комплектухи есть?

Ну, вертолетик на Марсе не показатель, там условия пожестче чем на Земле, само собой, но не настолько жесткие как в открытом космосе. Да и возможно вертолетик не был рассчитан на ОЧЕНЬ долгий срок службы, зато отработал как proof of concept.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 20:40 
> Ну, вертолетик на Марсе не показатель, там условия пожестче чем на Земле,
> само собой, но не настолько жесткие как в открытом космосе.

Как я понимаю самые неприятные для спутников условия - в некоторых местах орбит Земли где супердофига заряженных частиц. И спутники которые проходят эти регионы периодически - должны быть RAD HARD практически без вариантов. У кого-то (NASA?) есть забавная карта числа upset vs расположение на орбите. Она мягко говоря неоднородная. Есть хорошие места, есть по сути проклятые.

> Да и возможно вертолетик не был рассчитан на ОЧЕНЬ долгий срок службы,

Ну да. Это нахальный эксперимент, у него батарейка от жестких и экзотичных режимов наверное скиснет, да и заряжать от солнечной батареи при том что ее даже от пыли почистить некому -

> зато отработал как proof of concept.

Ну да. И ведь работает же. Вполне себе приличное время. Хоть и из ширпотреба собран. Марсоход конечно покапитальнее собран.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 14:21 
SpaceX:
https://www.opennet.me/opennews/art.shtml?num=53083

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 03-Июн-23 20:33 
Амд такой амд. То гцц сегфолтит, то вот это. Теперь уже перезагрузки делать заставляют, хотя они нужны только после изменения некоторых настроек биоса. Точнее не перезагрузки, а выключение-включение, потому что перезагрузка стейты не сбрасывает и параметры процессора не меняет.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 03-Июн-23 21:56 
Ну, с сегфолтами разобрались тогда, выключение uopcache проблему решало на ура, производительность сильно не роняло, в пределах 1-3%.

[и это вы ещё Intel Errata не видели - на самом деле у обоих вендоров там задницы хватит надолго]


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 05:37 
> Амд такой амд. То гцц сегфолтит, то вот это.

А у интела вообще какие-нибудь шины отгореть норовят, или данные утекают хрен знает кому и куда. И просто перазагрузкой от этого не отделаешься. Ребут раз в 2 года не такое уж страшное требование для большинства современых серверов. Хоть и забавная таймбомба конечно. Вы купили триальную версию процессора. Заплатите $100 и получите лицензию на ребут раз в 5 лет.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Заноним , 05-Июн-23 12:43 
Не зуди. Нормальные люди не включают CC6 на серверах, бикоз изменение напряжения в рилтайме в принципе может приводить не пойми к чему. А gcc у тебя сегфолтится потому-что под архитектуру CPU надо задавать параметры.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 06-Июн-23 10:06 
Не, проблема с сегфолтами в GCC у первой версии первых райзенов действительно была.
Рылась в uopcache - любознательный японец даже нарыл деталей. Отключение проблему решало полностью.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 06-Июн-23 10:07 
К чести AMD, они даже RMA по этому кейсу делали. Я правда не стал, хотя RMA# получил, успел найти решение, слать туда-сюда проц неделями стало лень.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 06-Июн-23 21:49 
И даже пруфлинк
https://satoru-takeuchi.hatenablog.com/entry/2017/04/24/135914

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 06-Июн-23 21:52 
И ещё один
http://www.e-hdk.com/diary/d201706c.html#20-2
Для любителей технического мясца.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Заноним , 07-Июн-23 20:16 
> Не, проблема с сегфолтами в GCC у первой версии первых райзенов действительно
> была.
> Рылась в uopcache - любознательный японец даже нарыл деталей. Отключение проблему решало
> полностью.

Топик о EPYC 7002, а это не первый Ryzen и вообще не Ryzen.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 08-Июн-23 07:13 
При чём тут топик, родной. Тут вон за историю с gcc выше задвинули.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Заноним , 25-Ноя-23 02:01 
> При чём тут топик, родной. Тут вон за историю с gcc выше
> задвинули.

При том, что с таким же успехом тащить в топит истории про ошибки на AMD K5, Сyrix, Pentium или другого олдстафа.

А так, по поводу описанной ошибки c segv - ryzen 1800X вышел в марте 2017, чел нашел баги в апреле, в августе проблемы были закрыты. Бежать с домашним процессором в RMA не зачем было, просто обновить BIOS и/или подгрузить microcode достаточно.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 25-Ноя-23 09:23 
Не достаточно. Этот баг, о котором ты говоришь, не был закрыт никогда, и решался либо заменой, либо у тех, кто решил не менять - отключением uopcache. Я как раз счастливый обладатель такого 1800X, сначала пошёл в RMA прямо к AMD, получил номер отправки и замены, но потом нашёл это самое "наколенное" решение, и отменил. Потеря производительности там - ~1-3% в зависимости от задачи, можно пренебречь.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 25-Ноя-23 09:24 
Теперь у меня этот 1800X пылится на полочке вместе с прочей комплектухой, потому что в основной системе 5950X - и я таки из него вторую тачку соберу, но uopcache опять придётся отключать :D

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Заноним , 07-Дек-23 03:04 
> Не достаточно. Этот баг, о котором ты говоришь, не был закрыт никогда,
> и решался либо заменой, либо у тех, кто решил не менять
> - отключением uopcache. Я как раз счастливый обладатель такого 1800X, сначала
> пошёл в RMA прямо к AMD, получил номер отправки и замены,
> но потом нашёл это самое "наколенное" решение, и отменил. Потеря производительности
> там - ~1-3% в зависимости от задачи, можно пренебречь.

О баге говоришь ты, а не я. Я же говорю что это хня, тем более решалось выключением в BIOS и почти не сказывалось на производительности. Таких мелких фокусов с любой системой можно нагрести, то там какой-нибудь xeon e5 после года работы может обсыпаться в EDAC и вообще перестать отдавать состояние модулей DIMM или пока не выключишь какую-нибудь загогулину в BIOS не будет загружаться зависая при проходе POST и т.д. и т.п.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 07-Дек-23 09:46 
> хня, тем более решалось выключением в BIOS и почти не сказывалось

Не хня, потому что выстреливало в ногу железно. Тем, кто юзал GCC - почти 100%, виндузятники же мучались спорадическими самопроизвольными ребутами.

И да. Угу. Решалось. Вот только в CBS это параметр появился полгода спустя с выхода процов, а в ряде биосов доступа к параметрам CBS вообще не было.



"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Заноним , 08-Дек-23 03:38 
Да хня, потому-что это первый выпуск нового ядра и судя по всяким редитам ошибка возникала крайне редко, виндузятники почти не сталкивались, да и с gcc она тоже проявлялась не часто и в основном на тяжелых компиляциях.
И полгода для BIOS для нового продукта, который только вышел на рынок нормально, но для конкретно отключения opcache опция появилась через месяц-два, но производители MB, тогда, только начали осваивать выпуск плат для ryzen и только освоились с BIOS, да и многие не торопились активно поддерживать новую линейку AMD. И в общем-то никто не заставляет за новинками гнаться. Лично я год-полтора жду, прежде чем менять платформу, а в случае с ryzen вообще пока серия 3xxx не прожила год, оставался на FX-8320.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 08-Дек-23 09:33 
Zlib - это тяжёлая компиляция? Серьёзно?

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Заноним , 10-Дек-23 22:44 
> Zlib - это тяжёлая компиляция? Серьёзно?

Не разводи демагогию. Проблема была связана с параллельной компиляцией, которая очевидно является тяжелой и прямо завязана на opcache и которая как раз хорошо проявлялась если распараллелить сборку, но ограничить компиляцию одним ядром.
В общем случае хня ещё и потому, что всё нытьё, спустя 6 лет после повода, т.е. бага имевшая место проявляться в чипах произведённых в первые 25 недель выпуска абсолютно нового процессора и причём возможно бага была связанна с ошибками производства (TSMC), а не архитектуры.  


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 11-Дек-23 00:28 
Не хня потому, что даже такая хня, как злиб - отказывалась собираться.
Причём что под виндой, что под линухами - воспроизводилось 100%.
Ну и плюс внезапные остановы с MCE тоже присутствовали.
Я хз, сколько там процов успели произвести за 25 недель и до выпуска, но явно не маленький объём под замену, даже если и не все меняли.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 07-Дек-23 09:47 
И да, AMD признала баг основанием для RMA. Просто по первому запросу с указанием серийника. Вот такая вот хня.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено YetAnotherOnanym , 03-Июн-23 20:58 
> многолетние uptime не типичны для серверов

До чего же тонко АМД троллит своих потребителей...


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено ыы , 03-Июн-23 21:47 
современная архитектура предполагает непрерывность аптайма сервиса а не железного устройства. сервис живет в кластере виртуализованной среды и его аптайм вечен. а железки ребутяться регулярно.  возбуждение от длительного аптайма сложилось в ту эпоху когда сервис к железу был прибит гвоздями... уже давно все по другому...

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 05:00 
не современная, а тяпляпная эникейная

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено ыы , 04-Июн-23 19:53 
21:34:55 up 2440 days,  6:27,

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено YetAnotherOnanym , 04-Июн-23 14:36 
> его аптайм вечен

Да фиг там. Даже без перезагрузки ваши "сервисы" живут порядка дней-недель - столько, сколько занимает у команды макак выпуск очередной версии с фиксом (некоторых) старых багов и добавлением новых.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено ыы , 04-Июн-23 19:53 
21:34:55 up 2440 days,  6:27,

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Ананас4к , 05-Июн-23 21:05 
Говори ip, сейчас положим

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 06-Июн-23 21:35 
127.0.0.1

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 06:40 
> АМД тонко троллит

Нет, им просто ***. Фейл с отгоревшими контактами сокета АМ5 не забудем, не простим.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 23:56 
Фейл вендоров, в основном Asus, которые завышали напряжение soc и vcore выше рекомендуемых AMD значений, AMD после этого пришлось жёстко ограничить пороговые значения в agesa, что бы вендорам не повадно было.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 07-Дек-23 09:53 
Ну, це только оверцлоцеров и любителей оверспекной памяти касается. ССЗБ.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 03-Июн-23 20:59 
Правильно я понял, что десктопные системы на базе Zen2 тоже этому багу подвержены?

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 03-Июн-23 22:21 
А фиг их знает, десктопы так долго обычно никто не гоняет без выключения.
Да и с серверами нарваться не так просто - то обновления, то просто CC6 не актуален.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 23:58 
Винда не даст компьютеру стол ео проработать, так что мало кто может проверить это на практике.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Бульдох , 03-Июн-23 21:16 
Линукс перезагружать ни в коем случае нельзя, иначе появляются глюки и фрагментация!

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 03-Июн-23 21:22 
В эпике даже баги эпические. Не исправлять их ещё более эпично!

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 03-Июн-23 22:48 
А говорили тайм-бомб в компьютерном оборудовании не бывает.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 03-Июн-23 23:09 
AMD EPYC FAIL

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Ivan_83 , 04-Июн-23 00:15 
У меня 1300x странно сломался - через 2-4 суток аптайма вешался или ребутался.
Смена материнки и настроек биоса ничего не меняла, смена проца - решила проблему.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 00:26 
Проблема скорее в материнке или её биосе. У меня тоже такое было, что проц на одной материнке глючил, вешался и ребутился. Дугой проц в эту же материнку - работает. Но самое интересное, когда вставляю якобы нерабочий проц для проверки в ещё одну другую материнку - тоже работает вообще идеально.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Ivan_83 , 04-Июн-23 13:01 
Я его переставлял в 3 или 4 разных материнки, везде результат был один и тот же.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено dalco , 04-Июн-23 04:34 
На одной из моих прошлых работ фирменные интеловские мамки интересно из строя выходили - они прекрасно включались, работали, но ровно через час после запуска перезагружались (или висли?). Можно было часы сверять :)

Но, надо отдать должное - мамки эти отпахали лет по 10+. Им так и так дорога на помойку была.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено n00by , 04-Июн-23 11:21 
Точно час, а не 30 минут? Intel ME обычно через столько перегружает, когда ему что-либо не нравится.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено dalco , 04-Июн-23 17:14 
Не могу утверждать с точностью 100%, но мне так помнится, что именно час. Юзер комп включит, попьёт кофе, втянется в работу и...
Сначала так одна машина хулиганила (ну, мало ли), потом две (хм, забавное совпадение), потом ещё несколько (о, да тут закономерность!). Мамки были или на 845 или на 865 чипсете, одна конкретная модель, именно производства Intel.
Благо, это были уже времена, когда этот хлам, даже исправный, массово начали заменять в конторе на что-то более современное на 8x/9x-чипсетах.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено n00by , 04-Июн-23 19:15 
На тех старых чипсетах может и час, не знаю. По симптомам очень похоже, зачетная фича. :)

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 05:41 
> У меня 1300x странно сломался - через 2-4 суток аптайма вешался или
> ребутался. Смена материнки и настроек биоса ничего не меняла,
> смена проца - решила проблему.

А вот так воткнешь файлуху с чексумами и узнаешь много нового о своем железе, потому что "вешался через 2-4 суток" случается при достаточно частых сбоях. А если сбои реже - может и 2-4 месяца работать. Или года. И поди там разбери чего оно раз в год ребутнулось...


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Ivan_83 , 04-Июн-23 13:08 
Там не было ZFS, но была ECC память.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 04-Июн-23 20:48 
Вот здесь скорее всего и причина подвиса. Разгона по памяти не было часом? Возможно говённая плата память не вытаскивала, и она глючила, в результате - вставание раком.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 05-Июн-23 01:13 
В случае ECC памяти - ее сбои достаточно заметны мягко говоря. Хрен знает как в фре а в линухе точно есть драйвер который видит факапы ECC на амдшках (EDAC).

Бывают и более странные вещи. Никогда не видели сбой ECC в кеше проца? А так тоже бывает. Я правда видел это лишь 1 раз в жизни и это был transient. Видимо космическая частица в проц попала. Просто необычный лог с MCE.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 08-Июн-23 07:20 
> Никогда не видели сбой ECC в кеше проца?

Why not? Ничего необычного в этих логах нет, кста.

И в самих кешах, в основном это как ни странно L1 был, видимо потому, что наиболее высокочастотный и хрупкий, хотя чессгря площадь у него микронная, т.е. это скорее даже не комическая частица, а просто где-то с питальника пульсация проскочила, кочерга раз в жизни тоже стреляет. И в ассоциативных линейках uopcache (tag parity error) на раннем первом райзене, опять неладно помянутом, видел - там это штатная, к сожалению, ситуация, ибо uopcache упорот. И полудохлые процы, стреляющие совершенно разными MCE, тоже видел.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 08-Июн-23 16:13 
> Why not? Ничего необычного в этих логах нет, кста.

Да просто редкая фигня. Мне по моему только 1 раз в жизни и попадался. При том откровенный transient: больше на той железке не было никаких намеков на повтор этого.

> И в самих кешах, в основном это как ни странно L1 был,
> видимо потому, что наиболее высокочастотный и хрупкий, хотя чессгря площадь у
> него микронная, т.е. это скорее даже не комическая частица,

Кеши это SRAM, еще и с специфичными требованиями, и площадь у них ни в раз не микронная. И у проца кеши занимают чуть ли не большую часть кристалла.

> а просто где-то с питальника пульсация проскочила, кочерга раз в жизни тоже стреляет.

Это кажется маловероятным. Проц жрет короткими мощными импульсами и на это расчитано. Для покрытия быстрых вещей сотни керамики, более медленных - дофига емких полимеров или сильноточных электролитов. Что там в основном питальнике оно и близко не видит - из 12 вольт делает Vcore многофазным, шустрым DCDC который очень резво реагирует на любые изменения. Если там что-то не так - глюков будет сразу и много. Раз в эн лет? Не, так не бывает. Если оно близко к margins, глюки будут достаточно регулярно повторяться в силу характера потребления проца.

> полудохлые процы, стреляющие совершенно разными MCE, тоже видел.

Я вот видел даже проц который ничем не стреляет. Но иногда считает, цуко, неправильно. Очень изредка. Пойман btrfs'ом, "csum failed" лезущими без особых причин. При том только после прогрева. Вот это кстати совсем не удивительно - не все чипы созданы одинаковыми. И не всегда фабричные тесты отлавливают все косяки.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 08-Июн-23 21:04 
> Кеши это SRAM, еще и с специфичными требованиями, и площадь у них ни в раз не микронная

L3-да, здоровый. А L1 так себе (у того же Zen2 - ~20-25% от ядра L1I/L1D вместе).
Плюс эта шляпа (L1) в тех же зенах например использует не типовое питание SRAM, а питание самого ядра, и посему к нему приделан хитрый многоуровневый буст при записи, именно таковой в принципе может выдавать сюрпризы, и отчасти поэтому там и приляпан ECC.

> Это кажется маловероятным. Проц жрет короткими мощными импульсами

Именно в этом и фигня. VRM не осилил, проскочила отрицательная пульсация. Буст свалился при записи, битик флипнулсо. Могут быть и другие причины, но эта совершенно не исключена.



"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 08-Июн-23 21:05 
(особенно вероятно в около-idle, при низких вольтажах, или при спрыгивании с таковых)

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 09-Июн-23 08:57 
> L3-да, здоровый. А L1 так себе (у того же Zen2 - ~20-25%
> от ядра L1I/L1D вместе).

Вселенная умеет прикалываться, так что даже маловероятные вещи сильно отличаются от невозможных. Если шанс что вон та штука сегодня сломается 1 на миллион, если у нас только 1 девайс, мы можем не дожить до его кончины. Но может и помереть, буквально завтра, столь же валидно. А если поставить парк из миллиона, в среднем каждый день будет что-то ломаться. А иногда и пару в день.

> Плюс эта шляпа (L1) в тех же зенах например использует не типовое
> питание SRAM, а питание самого ядра,

Что есть "типовое питание SRAM"? Системный SDRAM? Он не SRAM, он DRAM. И питание у него свое, регламентированое стандартом. А кеш почти часть ядра проца, он близко к нему и логично что питается от того же Vcore с общем случае. А то что совсем наружу чипа - через трансляторы уровней, конечно. Даже современные микроконтроллеры норовят Vcore сильно ниже IO делать, просто потому что работать на высоком Vcore крайне неэффективно по энергии.

> может выдавать сюрпризы, и отчасти поэтому там и приляпан ECC.

ECC в процовых кешах не новая тема и точно появился задолго до рязаней и эпиков. Я так понимаю что это частично помогает детектить бракованые чипы заодно еще производителю.

> Именно в этом и фигня. VRM не осилил, проскочила отрицательная пульсация.

Там конденсаторов немеряно, как она проскочит? И на мамке, и даже на самом проце по Vcore. Настолько по детски сейчас производители мамок имхо не лажаются. Да и раньше не лажали. И единственный способ что-то такое увидеть который я знаю это опухшие электролиты, когда они свою функцию перестают выполнять. При этом глюки быстро прогрессируют - проблемные электролиты греются еще сильнее и процесс кончины самоускоряется. Но в современных мамках с полимерами и нормальным охлаждением вокруг сокетов оно сильно менее актуально.

> но эта совершенно не исключена.

Хызы, ни разу не видел факапы такого плана именно раз в эн лет. И если что-то работало на грани, оно обычно ппри прогреве начинает весьма заметно и относитель но часто глюкать.

Скажем упомянутый проц пойманый btrfs на холодную считал ок но если минут 10 прогрузить в полку, достаточно часто флипал биты, btrfs раз в несколько минут орал csum failed. А при менее полной нагрузке системы - нагрева могло и не хватить для дестабилизации.

Там на самом деле фокус в том что электрические параметры чипов не совсем одинаковые. Повторяемость не 100% 1 в 1. Оттуда же и разблюддовка по частотам, самые отборные кристаллы идут как самые топовые и высокочастотные, у них изначально margins самые большие. Остальнму скидывают частоты и повторяют тесты еще раз, и так несколько раз, получая разные модели. Иногда могут отключать дефектные блоки еще, чтобы не выкидывать чип совсем а продать как более скромный по ядрам/кешу/частотам/etc. А китайцы этим вообще не парятся, вот вам RAW выхлоп фабы и в мане "до 2.5ГГц" - а сколько конкретный чип потянет без дестабилизации сами и замеряйте :)


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 09-Июн-23 14:18 
> Что есть "типовое питание SRAM"?

Линия питания SRAM внутри проца. Она отдельная внезапно. А вот L1 у зенов сидят на линии питания ядра.

По следующим пунктам не поясняю, потому что.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 09-Июн-23 14:19 
[независимость линии отчасти связана это с тем, что ядро можно в "простое" по вольтажу уронить, а вот с SRAM такой фокус не катит]

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 09-Июн-23 15:23 
> Линия питания SRAM внутри проца. Она отдельная внезапно.

Будем честны, я не смотрел для этих процов пинаут от и до, поэтому интересно кого в этом контексте SRAM называют? Системный кеш? Что-то из регионов какого-нибудь PSP? Что-то еще?

> А вот L1 у зенов сидят на линии питания ядра. По следующим пунктам не поясняю, потому что.

Ну как бы L1 логично там сидеть. Он там наверное у много кого. Чтобы вольтажи между core и кешом не транслировать. Скоростные трансляторы уровней способные на тех частотах стабильно с полной скоростью работать - это такой сильно отдельный гимор.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 09-Июн-23 22:19 
> Будем честны, я не смотрел для этих процов пинаут от и до, поэтому интересно кого в этом контексте SRAM называют?

Вся SRAM, кроме ядра (L1 в последней). И кеши, и не только. И там не только пинаут, а ещё и внутренняя организация.

> Ну как бы L1 логично там сидеть. Он там наверное у много кого. Чтобы вольтажи между core и кешом не транслировать.

Дело не только в уровнях, ещё в тайминге (нагрузка импульсная) и наличии помех.
У такого дизайна есть один большой минус - для SRAM в режимах энергосбережения ядра необходимо большее напряжение, нежели для самого ядра. Поэтому там хитровыделанный буст.



"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 13-Июн-23 12:04 
> Вся SRAM, кроме ядра (L1 в последней).

Сколько я себя помню - кеши обычно всегда жили рядом с core и было бы странно если бы уж как минимум L1 питался чем-то отличным от Vcore. Так вообще делали?

В более простых SoC - структурально обычно большая часть чипа живет на Vcore в районе 1 .. 1.5 вольт, кроме аналоговых блоков (включая тактовые генераторы/PLL/adc/dac/etc) у которых есть специальные требования где они хотят вольтаж выше вон того - и IO. GPIO обычно выходит наружу через группу трансляторов уровня известную как "IO ring". У скоростных интерфейсов типа sata/pcie/DRAM/usb/... бывают свои кастомные "phy" - и кастомное питание, потребное для вот именно их структуры IO. И это даже не столько для развязки от пульсаций сколько потому что им нужны разные напряжения. Хотя как минимум аналог обычно пытаются отвязать от остального, цифра шумит.

> И кеши, и не только. И там не только пинаут, а ещё и внутренняя организация.

Просто по логике кеш живет рядом с core, работает на полной скорости, и трансляторы уровней на эти скорости - отдельная прожорливая и проблемная штука, их ставят как last resort, если иначе не получилось. Ну да, если Vcore 1.2 вольта максимум а IO должно на 1.8 если не 3 вольтах работать, там без вариантов. А логика на 1.2 вольта не то чтобы распостранена, да и DVFS может менять его, остальной логике меняющееся напряжение Vcore никто не вывешивает.

> Дело не только в уровнях, ещё в тайминге (нагрузка импульсная) и наличии помех.

Нагрузка импульсная. Поэтому подается через кучу лапок и развязано кондерами от души. Так что в нормальном дизайне не особо разлетается дальше, покрываясь "локальной" керамикой. А на более медленные изменения есть вон те емкие электролиты (на частоте гигагерц они бесполезны из-за ESL но это от них и не требуется).

> У такого дизайна есть один большой минус - для SRAM в режимах
> энергосбережения ядра необходимо большее напряжение, нежели для самого ядра.

А чего там все же SRAM называют в этом контексте? L2/L3/PSP SRAM? Более того - а у PSP там нету каких-нибудь приватных I/D кешей, как это обычно у ARMов бывает?

> Поэтому там хитровыделанный буст.

Именно буст? Просто вокруг ядра полно более высоких напряжений и DCDC, и это было бы очень странным решением. Нельзя ли какой-то линк на все это описывающий технологию?


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 13-Июн-23 23:18 
> чем-то отличным от Vcore. Так вообще делали?

L2 и L3 в зенах живут отдельно от питания ядра.
Ну и ядро - это не совсем Vcore, кстати. Там внутри множество разных схем питания. Часть сидит на Vcore, часть нет.

> Именно буст?

Да, именно буст :) Ламповый, тьфу, то есть конденсаторный.

> Нельзя ли какой-то линк на все это описывающий технологию?

Можно. Смотрите на викичипах (wikichip.org), там много всего. Даже кое-какие грабли отмечены.



"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 13-Июн-23 23:27 
> Более того - а у PSP там нету каких-нибудь приватных I/D кешей

SP вообще отдельный CPU (Cortex A?), его можно в контексте собственно x86 проца не рассматривать.
У него своё всё. И кеши, и много чего ещё.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 14-Июн-23 00:02 
> SP вообще отдельный CPU (Cortex A?),

Насколько я помню, да.

> его можно в контексте собственно x86 проца не рассматривать.

Ага, лол, не рассматривать его - учитывая что он DRAM training делает и x86 запускает :)

> У него своё всё. И кеши, и много чего ещё.

Однако вот именно совсем отдельные вольтажи и проч врядли ему сделают. А зачем? Техпроцессы же те же самые.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 14-Июн-23 09:52 
> Ага, лол, не рассматривать его - учитывая что он DRAM training делает и x86 запускает :)

Не ссуть. Оно всё равно оторвано, и общается c x86 по шинам, без интеграции.

>> У него своё всё. И кеши, и много чего ещё.
> Однако вот именно совсем отдельные вольтажи и проч врядли ему сделают.

В смысле. Оно отдельный набор совершенно. У которого всё своё.



"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Ivan_83 , 06-Июн-23 02:19 
Перечитайте ещё раз: материнки менял, 3-4 разных пробовал.
ЕЦЦ показывает ошибки если они есть, сразу.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 06-Июн-23 08:20 
"Типичный" ЕЦЦ показывает ошибки в 1 бит, при ошибке в 2 бита ставит систему колом, более серьёзные может и не заметить. Судя по тому, что решилось заменой проца - какая-то фигня в комбинации, возможно связка VRM + контроллер памяти. Может и проц битый попался, да.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 06-Июн-23 10:05 
Ну и опять же - какие материнки.
Я обычно беру топовый чипсет и пристойный VRM, как раз чтобы избежать вот этого всего.
Вы ж не берёте на серверы супермокро, в самом деле. Или берёте?

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 05-Июн-23 01:08 
> Там не было ZFS, но была ECC память.

Ну я вот btrfs'ом нашел вот именно сбоящий ПРОЦ. ECC память на это не реагирует ни как, именно сам проц иногда считает неправильно, флипает где-то в недрах битик-другой. Да еще не сразу. Сперва прогреть хорошенько надо. По другому его б и не заметил никто. А тут, вот, редкие писки про CSUM ERROR - намекали.

Вот так изначально система с такого не падает. Просто под нагрузкой появляются какие-то мелкие странные аномалии. Ну и данные изредка подзасир@ются. Если месяцок погонять то может и повиснет или ребутнется, или очень активно работающая программа может упасть, но это настолько редко что только btrfs его такого и вычислил в результате. Да, сторажи и оперативка оказались там исправными.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Доктор Лиза , 04-Июн-23 08:32 
Надо было просто кэш УО-псов отключить!
А когда ВДРУГ не поможет, тогда уже можно и другое плацебо прописать... и так до тех пор, пока пока гарантия не закончится.

https://youtu.be/WutowgJBTvs


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Ivan_83 , 04-Июн-23 13:05 
Так он до этого пару лет отработал без проблем.
Я его просто подарил другу с предупреждением об особенностях работы а себе взял другой проц, один фиг этот 1300х покупался как временное решение на старте продаж райзенов.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 00:29 
Длительный аптайм не есть хорошо. Системам свойственны утечки памяти и всякого рода проблемы на аппаратном уровне, от ошибок на самом кристале до флуктуаций магнитного поля земли. Не знаю что там про сервера, не сисадмин, но для рабочего компа и прочей техники держу за правило перезагружать систему не реже чем раз в 3 суток.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 00:56 
Тоже ребучу свой локалхост с арчеком по крону раз в неделю иначе тормозит и глючит и даже ингда бывает kde падает

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Бульдох , 04-Июн-23 11:22 
У меня Puppy на ноуте полтора года в ОЗУ без ребута работал, так как не было харда, флешку с щенком я кстати тоже вытащил, впрочем арчешкольники обычно не большого ума.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено 123 , 05-Июн-23 15:42 
Спешите видеть, человек насилующий некро-бук юзерфрендли-линуксом обвиняет кого-то в недостаточном уме))

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 03:24 
Длительный аптайм и есть показатель что всё хорошо. А если твои тараканы выползают раз в 3 дня, продолжай держать их при себе.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 05:03 
длительный аптайм и есть хорошо, а утечки бывают только на джаве с растом

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено ыы , 04-Июн-23 20:04 
Это вам ктото рассказал или сами придумали? Серверное оборудование делается так, чтобы не перезагружаться никогда... Если в вашей системе происходит утечка памяти и вы не знаете как ее решить иначе чем перезагрузкой- вы вероятно менеджер или уборщик.. но вы ни разу не инженер...

21:34:55 up 2440 days,  6:27,


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 04-Июн-23 20:47 
> Серверное оборудование делается так, чтобы не перезагружаться никогда

Это вам кто-то рассказал или сами придумали?


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено ыы , 04-Июн-23 21:08 
Это опыт работы с оным. Вы вероятно никогда с таким не работали?

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 04-Июн-23 21:54 
Конечно нет. Только арифмометры, только хардкор.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 05-Июн-23 00:12 
Дайте угадаю, вы из тех кто считает работает не трогай и не ставит обновления? Потому что обновления ядра без перезагрузки не поставить, только kexec, но из-за него оборудование часто глючить начинает.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено ыы , 05-Июн-23 05:12 
Я из тех кто решает задачи а не бегает с бубном.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 05-Июн-23 16:21 
Вы не обновляете системый софт серверов? уязвимости в BIOS/BMC? прошивки рейд контроллеров/сетевых адаптеров?

да вы я смотрю профессионал? бекапы тоже для трусов?


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено ыы , 05-Июн-23 22:42 
сверические уязвимости в сверических биосах? такае есть только у анонимных клоунов и админов локалхостов узнавших что биос можно обновлять.  в реальности  векторы атак с рисками крайне редко требуют обновления требующего перехагрузки чего бы то ни было.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 06-Июн-23 10:18 
Благодаря таким людям, этот мир намного интереснее чем могло бы быть.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 06-Июн-23 10:04 
Зойчем? Для локалхоста и так сойдёт.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено ыы , 06-Июн-23 11:47 
ну, хозяину арифмометра виднее :)

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено пох. , 07-Июн-23 00:04 
> Вы не обновляете системый софт серверов? уязвимости в BIOS/BMC? прошивки рейд
> контроллеров/сетевых адаптеров?
> да вы я смотрю профессионал? бекапы тоже для трусов?

обновления _работающих_ серверов, их рейдов и сетевых адаптеров (а не при первичной настройке или после смены владельцев, или при наличии явных проблем) - это как раз для очень смелых и отважных.

Мы вот тут надысь обновились - до сих пор икаем и чешемся (но необновляться было нельзя - неудобненько без консоли. А она у этого делла виснет и не имеет фичи ребута отдельно от всего лезвия. Двадцатилетней давности хлам умел, а это вот - нет.)


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 04-Июн-23 22:05 
Ды всё проще. Есть план апдейта и окна, за год апдейты таки набегают. У меня весь прод например как раз на вторых эпиках, но я этой проблемы не увижу никогда, потому что раз в год гипервизоры железно ребутятся.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Олег , 05-Июн-23 10:45 
Ну да, расскажи это мой базе данных в 5tb с 24*7  с аптаймами не меньше года

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 06-Июн-23 00:09 
Для таких детских объёмов любое COTS решение подходит.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено ыы , 06-Июн-23 11:56 
продавец лапши в тренде...

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено пох. , 06-Июн-23 23:59 
> Ну да, расскажи это мой базе данных в 5tb с 24*7  
> с аптаймами не меньше года

э... у нее нет фэйловерящегося кластера и ты никогда (больше года) не проверял работает ли он? Надеюсь,у тебя есть план-Б (ну там - хорошее предложение в конкурирующей конторе, например)?

А то пять терабайт восстанавливаются уже достаточно долго чтоб покинуть рабочее место "при помощи ноги". (Хотя что-то подсказывает что восстановление ты тоже не проверял)



"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 04:02 
Вспоминаю: сервер на Windows NT 4.0 работал на АТС два года. Вот просто брали работал онлайн. К чему я это вспоминаю? Эх, были времена…

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено 123 , 05-Июн-23 15:40 
Современный WinServer, по самой своей концепции не предназначен для подобной работы. Разве что Core версия, в железе, которое не светит в сеть или заблочено по максимуму. Но железо на которое ставят Core версии это или одноплатники на ARM или "пром-коробочки" со "зрелым" железом.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Doc , 13-Июн-23 10:56 
Что правда?

Имя узла:                       ITG-KEY
Название ОС:                    Microsoft(R) Windows(R) Server 2003, Enterprise
Edition
Версия ОС:                      5.2.3790 Service Pack 2 сборка 3790
Изготовитель ОС:                Microsoft Corporation
Параметры ОС:                   Рядовой сервер
Сборка ОС:                      Multiprocessor Free
Зарегистрированный владелец:    KEY
Зарегистрированная организация: ITG
Код продукта:                   69889-650-0025644-45629
Дата установки:                 20.04.2015, 12:48:24
Время работы системы:           484 дн., 11 час., 43 мин, 13 сек.
Изготовитель системы:           Arbyte
Модель системы:                 Arbyte Tempo T4PD3-15G
Тип системы:                    X86-based PC
Процессор(ы):                   Число процессоров - 2.
                                [01]: x86 Family 15 Model 4 Stepping 1 GenuineIn
tel ~3000 МГц
                                [02]: x86 Family 15 Model 4 Stepping 1 GenuineIn
tel ~3000 МГц
Версия BIOS:                    INTEL  - 20060222
Папка Windows:                  C:\WINDOWS
Системная папка:                C:\WINDOWS\system32
Устройство загрузки:            \Device\HarddiskVolume1
Язык системы:                   ru;Русский
Язык ввода:                     Н/Д

https://disk.yandex.ru/i/XGU0eNqZ_-aIvg
и это только потому что серверную "город" обесточили на двое суток


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено пох. , 05-Июн-23 22:10 
ping of death патчить ты ведь конечно в нем не стал, потому что кроме как к той АТС ком-портом он ни к каким сетям подключен не был?

Так-то бы современные и побольше работали, но увы, если не обновлять - то кто-нибудь им работать помешает.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 08-Июн-23 07:07 
Может и был. Рискну предположить водопроводную, для охлаждения.

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 09:33 
Разве CPU AMD EPYC 7002 опенсорс?

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 09:53 
> Разве CPU AMD EPYC 7002 опенсорс?

Нет но это может спасти опенсорсников от энного головняка с попытками ловить баги которых нет в своем софте (например ядре Linux).


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 04-Июн-23 19:33 
Офигенно. Баги затрагивающие их покупателей они чинить не собираются, но как только находится очередная дырка в их аппаратном DRM (TPM/Pluton) так они быстро-быстро выкатывают обязательное обновление микрокода. Кто же на самом деле их клиенты?

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 04-Июн-23 21:56 
Так там уже третий эпик на ходу, смысл затыкать второе поколение от проблемы, с которой столкнутся полтора землекопа?

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено пох. , 05-Июн-23 22:12 
> Офигенно. Баги затрагивающие их покупателей они чинить не собираются

"Вы же уже купили!" - чего ради вас суетиться-то?


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 06-Июн-23 08:22 
> "Вы же уже купили!" - чего ради вас суетиться-то?

Ну мы на проблему и не налетели - полёт пару лет нормальный, и не налетим - ребут делается для обновления гипервизоров минимум раз в год. Можно из мухи слона раздуть, но смысл? Нас больше упорол Dell с хюниксом вместо самсунга - куча модулей спустя полтора года начала ловить битовые ошибки периодически. К счастью, ECC справляется, но всё равно phaseout и замена.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено пох. , 06-Июн-23 23:56 
> К счастью, ECC справляется

но алерт в ср-ной вмвари не гасится. Поэтому только ребут. И так у них всьо.

(да, такая же херня с деллами)


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено анон , 06-Июн-23 13:57 
Закладки от скайнета, найс.
Че интерфейсом, ИИ?

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 06-Июн-23 18:22 
Скайнет в человеческом исполнении не выживет.
Зависнет через очередные 1700 или сколько там с хреном дней...

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 08-Июн-23 10:13 
> Скайнет в человеческом исполнении не выживет.
> Зависнет через очередные 1700 или сколько там с хреном дней...

У тебя клетки постоянно умирают, но ты в целом - почему-то не умираешь от этого. По крайней мере, вот так сразу. А скайнет чем хуже? У гугли уже если сервак зависнет ты даже и не заметишь.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Tron is Whistling , 08-Июн-23 12:00 
You're no fun, dude

"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено Аноним , 09-Июн-23 08:59 
> You're no fun, dude

А прикинь, был бы ты одноклеточным - жил бы сильно меньше. Цифровых систем это все тоже касается.


"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено анон , 08-Июн-23 19:53 
> У гугли уже если сервак зависнет ты даже и
> не заметишь.

Главное, чтобы сорм не завис на магистрали.



"Ошибка в CPU AMD EPYC 7002 приводит к зависанию после 1044 д..."
Отправлено серверы не серверы , 10-Июн-23 14:48 
Какой позор

Кому-то в серверах нужны такие вот дешевые китайские подделки?