неделю назад начало валить в системный лог вот такое:
Jul 4 15:20:19 donkey SUNW,UltraSPARC-II: [ID 501844 kern.info] [AFT0] Corrected Memory Error detected by CPU0, errID 0x00010078.8dba6c8d
Jul 4 15:20:19 donkey AFSR 0x00000000.00100000<CE> AFAR 0x00000000.4040a008
Jul 4 15:20:19 donkey AFSR.PSYND 0x0000(Score 05) AFSR.ETS 0x00 Fault_PC 0xff2563c0
Jul 4 15:20:19 donkey UDBL Syndrome 0x43 Memory Module U1301
Jul 4 15:20:19 donkey unix: [ID 596940 kern.warning] WARNING: [AFT0] 3 soft errors in less than 24:00 (hh:mm) detected from Memory Module U1301
Jul 4 15:20:19 donkey SUNW,UltraSPARC-II: [ID 188733 kern.info] [AFT0] errID 0x00010078.8dba6c8d Corrected Memory Error on U1301 is Persistent
Jul 4 15:20:19 donkey SUNW,UltraSPARC-II: [ID 422338 kern.info] [AFT0] errID 0x00010078.8dba6c8d ECC Data Bit 42 was in error and corrected
по нескольку раз в день и почти каждый день (кроме выходных, наверное только когда работа "кипит")
errID меняется, а Memory Module U1301 один и тот же.
Ясно, что глючит модуль памяти.
Вопрос в том, как его физически вычислить?
Система Enterprise 420R