URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID1
Нить номер: 94360
[ Назад ]

Исходное сообщение
"MCA в dmesg"

Отправлено dile , 11-Фев-13 11:17 
Всем привет. Есть сервер на PC под freebsd 8.2 i386. В messags каждый час с точность до секунды сыпятся сообщения такого типа:

Feb 11 08:12:01 gamma kernel: MCA: Vendor "GenuineIntel", ID 0xf29, APIC ID 0
Feb 11 08:12:01 gamma kernel: MCA: CPU 0 COR OVER ICACHE LG IRD error
Feb 11 09:12:01 gamma kernel: MCA: Bank 1, Status 0xf200000000000105
Feb 11 09:12:01 gamma kernel: MCA: Global Cap 0x00000000000c0204, Status 0x0000000000000000
Feb 11 09:12:01 gamma kernel: MCA: Vendor "GenuineIntel", ID 0xf29, APIC ID 0
Feb 11 09:12:01 gamma kernel: MCA: CPU 0 UNCOR PCC OVER DCACHE L1 ERR error
Feb 11 09:12:01 gamma kernel: MCA: Bank 0, Status 0xcc0002ff20040145
Feb 11 09:12:01 gamma kernel: MCA: Global Cap 0x00000000000c0204, Status 0x0000000000000000
Feb 11 09:12:01 gamma kernel: MCA: Vendor "GenuineIntel", ID 0xf29, APIC ID 0
Feb 11 09:12:01 gamma kernel: MCA: CPU 0 COR OVER DCACHE L1 DWR error
Feb 11 09:12:01 gamma kernel: MCA: Address 0x2a768844
Feb 11 09:12:01 gamma kernel: MCA: Misc 0x20000000364000
Feb 11 09:12:01 gamma kernel: MCA: Bank 1, Status 0xf200000000000105
Feb 11 09:12:01 gamma kernel: MCA: Global Cap 0x00000000000c0204, Status 0x0000000000000000
Feb 11 09:12:01 gamma kernel: MCA: Vendor "GenuineIntel", ID 0xf29, APIC ID 0
Feb 11 09:12:01 gamma kernel: MCA: CPU 0 UNCOR PCC OVER DCACHE L1 ERR error
Feb 11 09:12:01 gamma kernel: MCA: Bank 2, Status 0xd000000000000153
Feb 11 09:12:01 gamma kernel: MCA: Global Cap 0x00000000000c0204, Status 0x0000000000000000
Feb 11 09:12:01 gamma kernel: MCA: Vendor "GenuineIntel", ID 0xf29, APIC ID 0
Feb 11 09:12:01 gamma kernel: MCA: CPU 0 COR OVER ICACHE LG IRD error
Feb 11 10:12:01 gamma kernel: MCA: Bank 1, Status 0xf200000000000105
Feb 11 10:12:01 gamma kernel: MCA: Global Cap 0x00000000000c0204, Status 0x0000000000000000
Feb 11 10:12:01 gamma kernel: MCA: Vendor "GenuineIntel", ID 0xf29, APIC ID 0
Feb 11 10:12:01 gamma kernel: MCA: CPU 0 UNCOR PCC OVER DCACHE L1 ERR error
Feb 11 10:12:01 gamma kernel: MCA: Bank 0, Status 0xcc0000ff20040189
Feb 11 10:12:01 gamma kernel: MCA: Global Cap 0x00000000000c0204, Status 0x0000000000000000
Feb 11 10:12:01 gamma kernel: MCA: Vendor "GenuineIntel", ID 0xf29, APIC ID 0
Feb 11 10:12:01 gamma kernel: MCA: CPU 0 COR OVER GCACHE L1 SNOOP error
Feb 11 10:12:01 gamma kernel: MCA: Address 0xedc8840
Feb 11 10:12:01 gamma kernel: MCA: Misc 0x1400002a812a4
Feb 11 10:12:01 gamma kernel: MCA: Bank 1, Status 0xf200000000000105
Feb 11 10:12:01 gamma kernel: MCA: Global Cap 0x00000000000c0204, Status 0x0000000000000000
Feb 11 10:12:01 gamma kernel: MCA: Vendor "GenuineIntel", ID 0xf29, APIC ID 0
Feb 11 10:12:01 gamma kernel: MCA: CPU 0 UNCOR PCC OVER DCACHE L1 ERR error
Feb 11 10:12:01 gamma kernel: MCA: Bank 2, Status 0xd000000000000153
Feb 11 10:12:01 gamma kernel: MCA: Global Cap 0x00000000000c0204, Status 0x0000000000000000
Feb 11 10:12:01 gamma kernel: MCA: Vendor "GenuineIntel", ID 0xf29, APIC ID 0
Feb 11 10:12:01 gamma kernel: MCA: CPU 0 COR OVER ICACHE LG IRD error

Расшифруйте пожалуйста с чем имею дело.


Содержание

Сообщения в этом обсуждении
"MCA в dmesg"
Отправлено ipmanyak , 11-Фев-13 14:43 
Почитай
http://freebsd.1045724.n5.nabble.com/Interpreting-MCA-error-...
Может ты поймешь в чем дело, я не понял, но особо и не вникал. Судя по последним постам, проблема с памятью. Память с ЕСС ?



"MCA в dmesg"
Отправлено natr , 11-Фев-13 17:28 
> Почитай
> http://freebsd.1045724.n5.nabble.com/Interpreting-MCA-error-...
> Может ты поймешь в чем дело, я не понял, но особо и
> не вникал. Судя по последним постам, проблема с памятью. Память с
> ЕСС ?

Все проще, запустить тест кешей проца и выкинуть его на свалку.


"MCA в dmesg"
Отправлено dile , 12-Фев-13 12:05 
>> Почитай
>> http://freebsd.1045724.n5.nabble.com/Interpreting-MCA-error-...
>> Может ты поймешь в чем дело, я не понял, но особо и
>> не вникал. Судя по последним постам, проблема с памятью. Память с
>> ЕСС ?
> Все проще, запустить тест кешей проца и выкинуть его на свалку.

ECC нет, это простой celeron из офисных "отходов". По тому форуму видно, что ядро может паниковать, а может и продолжать работать, зависит от количества ошибок\сообщений, если записывает в messages значит по ходу может обработать и работает дальше. На счет теста железа, там сообщают что memtest проходит в течении дня без ошибок, и еще у них вроде не часто появляются такие исключительные ситуации в машине, что-то около один раз в год, хотя на моей машине более 1200 строк за 8 дней работы. В целом это считается глубокой диагностикой и отладкой ядра, в Linux для этого есть mclog, в freebsd какие-то патчи кто-то делает, опять же по если по ветке форума смотреть.