Доброе время суток.Прошу помочь. Есть сервер(SuSE 11.1+samba 3.2.4-5.2+squid+dhcp+dns) вообщем ничего необычного.
Во время работы случайным образом (раз в 3 дня или раз в 1.5 недели) зависаел:
перестают работать все сервисы,
войти в систему не получается, так как не вводится даже логин, при этом нажимается Ctrl+Alt+Del,
в /var/log/messages с момента зависания перестают писаться сообщения.
грешил на HDD, заменил его. И вот сервер снова завис (на следующий день после настройки формирования отчетов sarg).
Предполагаю что снова проблемы с диском (не смотря на то, что новый), так как smartctl по критичной позиции Seek_Error_Rate выдает значение 529016 (за 7 дней работы) которое постоянно увеличивается.
Вот остальные значения показателей:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 100 253 006 Pre-fail Always - 0
3 Spin_Up_Time 0x0003 099 099 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 6
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 100 253 030 Pre-fail Always - 529016
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 207
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 6
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 052 049 045 Old_age Always - 48 (Lifetime Min/Max 19/51)
194 Temperature_Celsius 0x0022 048 051 000 Old_age Always - 48 (0 19 0 0)
195 Hardware_ECC_Recovered 0x001a 095 068 000 Old_age Always - 202043904
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0
202 TA_Increase_Count 0x0032 100 253 000 Old_age Always - 0
Подскажите, критично ли увеличение этого параметра?
В чем ещё может быть причина, и как её выявить, если в логах нет сообщений об ошибке в момент зависания.
PS: сейчас на сервере диск Seagete ST3250410AS (для системы, данные крутяться на зеркале).