На сервере(3 года безпроблемной работы) ЛА неожиданно стало зашкаливать за 200 иногда.
Первая мысль-диски.
Смарт есть, смотрю.ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 239 238 021 Pre-fail Always - 1050
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 53
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0
9 Power_On_Hours 0x0032 064 064 000 Old_age Always - 26888
10 Spin_Retry_Count 0x0033 100 253 051 Pre-fail Always - 0
11 Calibration_Retry_Count 0x0033 100 253 051 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 51
184 End-to-End_Error 0x0033 100 100 097 Pre-fail Always - 0
187 Reported_Uncorrect 0x0032 100 094 000 Old_age Always - 32
188 Command_Timeout 0x0032 100 053 000 Old_age Always - 144
190 Airflow_Temperature_Cel 0x0022 067 063 045 Old_age Always - 33
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 50
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 53
194 Temperature_Celsius 0x0022 114 110 000 Old_age Always - 33
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 1
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 3
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 0
Менять? End-to-End_Error и Reallocated Sectors Count печальны.
Что тут печального?
Журналы на винте чистые?
В системных логах есть сообщения об ошибках обращения к винту?
Винт в райде?
> Что тут печального?
> Журналы на винте чистые?
> В системных логах есть сообщения об ошибках обращения к винту?
> Винт в райде?Программный рейд.
а печально THRESH=097 при VALUE=100 для End-to-End_Error
Это много, параметр-то Pre-fail. Или нет?ошибки типа
May 21 08:15:06 localhost kernel: [5718389.425497] Pid: 21540, comm: httpd Not tainted (2.6.26-2-686 #1)
May 21 08:15:06 localhost kernel: [5718389.425548] EIP: 0073:[<b6a8d7f0>] EFLAGS: 00210286 CPU: 3
May 21 08:15:06 localhost kernel: [5718389.425603] EIP is at 0xb6a8d7f0
May 21 08:15:06 localhost kernel: [5718389.425645] EAX: 00000008 EBX: 00000003 ECX: 00000000 EDX: bfe533f4
May 21 08:15:06 localhost kernel: [5718389.425697] ESI: bfe555e8 EDI: 00000001 EBP: bfe533d8 ESP: bfe5338c
May 21 08:15:06 localhost kernel: [5718389.425748] DS: 007b ES: 007b FS: 0000 GS: 0033 SS: 007b
May 21 08:15:06 localhost kernel: [5718389.425797] CR0: 8005003b CR2: b6a8d7f0 CR3: 3371e000 CR4: 000006d0
May 21 08:15:06 localhost kernel: [5718389.425849] DR0: 00000000 DR1: 00000000 DR2: 00000000 DR3: 00000000
May 21 08:15:06 localhost kernel: [5718389.425902] DR6: ffff0ff0 DR7: 00000400
May 21 08:15:06 localhost kernel: [5718389.425948] =======================
>ошибки типаа причем тут винчестер?
>Программный рейд.
винты стоят одинаковые? round-robin? заюзывание и/о одинаковое?
> Что тут печального?
> Журналы на винте чистые?
> В системных логах есть сообщения об ошибках обращения к винту?
> Винт в райде?Ну и глянул сейчас статью. Про Атрибут: 05 Reallocated Sector Count
там написано, что 10 из 100 уже херово, а у меня 140 из 200.http://www.ixbt.com/storage/hdd-smart-testing.shtml#05
> На счёт этого атрибута мнения разнятся. Лично я считаю, что если он достиг 10, диск нужно > обязательно менять — ведь это означает прогрессирующий процесс деградации состояния
> поверхности либо блинов, либо головок, либо чего-то ещё аппаратного, и остановить этот
> процесс возможности уже нет. Кстати, по сведениям лиц, приближенных к Hitachi, сама >Hitachi считает диск подлежащим замене, когда на нём находится уже 5 переназначенных >секторов. > Другой вопрос, официальная ли эта информация, и следуют ли этому мнению сервис->центры. Что-то мне подсказывает, что нет :)
> Ну и глянул сейчас статью. Про Атрибут: 05 Reallocated Sector Count
> там написано, что 10 из 100 уже херово, а у меня 140
> из 200.
> http://www.ixbt.com/storage/hdd-smart-testing.shtml#05вот и читайте эту статью до просветления, у вас переназначенных секторов 0, не больше и не меньше.
>> Ну и глянул сейчас статью. Про Атрибут: 05 Reallocated Sector Count
>> там написано, что 10 из 100 уже херово, а у меня 140
>> из 200.
>> http://www.ixbt.com/storage/hdd-smart-testing.shtml#05
> вот и читайте эту статью до просветления, у вас переназначенных секторов 0,
> не больше и не меньше.что-то да, я конкретно затупил. Не тот параметр смотрю.
>>> Ну и глянул сейчас статью. Про Атрибут: 05 Reallocated Sector Count
>>> там написано, что 10 из 100 уже херово, а у меня 140
>>> из 200.
>>> http://www.ixbt.com/storage/hdd-smart-testing.shtml#05
>> вот и читайте эту статью до просветления, у вас переназначенных секторов 0,
>> не больше и не меньше.
> что-то да, я конкретно затупил. Не тот параметр смотрю.эт бывает...