URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID1
Нить номер: 70290
[ Назад ]

Исходное сообщение
"Проблемы с HDD(?)"

Отправлено Alexei , 16-Ноя-06 00:42 
С недавнего времени в /var/log/messages стали появляться таке сообщения:
kernel: ad0: FAILURE - unknown CMD (0xb0) status=51<READY,DSC,ERROR> error=4<ABORTED>

Что это значи и чем оно грозит?
FreeBSD 6.1-RELEASE-p10
ad0: 157066MB <HDT722516DLAT80 V43OA70A> at ata0-master UDMA100


Содержание

Сообщения в этом обсуждении
"Проблемы с HDD(?)"
Отправлено timmy , 16-Ноя-06 10:26 
>С недавнего времени в /var/log/messages стали появляться таке сообщения:
>kernel: ad0: FAILURE - unknown CMD (0xb0) status=51<READY,DSC,ERROR> error=4<ABORTED>
>
>Что это значи и чем оно грозит?
>FreeBSD 6.1-RELEASE-p10
>ad0: 157066MB <HDT722516DLAT80 V43OA70A> at ata0-master UDMA100


раз ничего нового (libs/kernels) не устанавливалось, можно попробовать поставить smartd
мож он чего покажет...


"Проблемы с HDD(?)"
Отправлено Alexei , 16-Ноя-06 19:30 
>раз ничего нового (libs/kernels) не устанавливалось, можно попробовать поставить smartd
>мож он чего покажет...

Есть smartmontools

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   099   099   016    Pre-fail  Always       -       131073
  2 Throughput_Performance  0x0005   100   100   050    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0007   145   145   024    Pre-fail  Always       -       188 (Average 293)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       57
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   100   100   020    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0012   099   099   000    Old_age   Always       -       8005
10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       57
192 Power-Off_Retract_Count 0x0032   100   100   050    Old_age   Always       -       390
193 Load_Cycle_Count        0x0012   100   100   050    Old_age   Always       -       390
194 Temperature_Celsius     0x0002   220   220   000    Old_age   Always       -       25 (Lifetime Min/Max 17/40)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0


"Проблемы с HDD(?)"
Отправлено Devil_kot , 16-Ноя-06 19:45 
>>раз ничего нового (libs/kernels) не устанавливалось, можно попробовать поставить smartd
>>мож он чего покажет...
>
>Есть smartmontools
>
>ID# ATTRIBUTE_NAME          FLAG
>    VALUE WORST THRESH TYPE    
>  UPDATED  WHEN_FAILED RAW_VALUE
>  1 Raw_Read_Error_Rate     0x000b   099
>  099   016    Pre-fail  
>Always       -    
>   131073
>  2 Throughput_Performance  0x0005   100   100
>  050    Pre-fail  Offline  
>   -       0
>
>  3 Spin_Up_Time        
>   0x0007   145   145  
> 024    Pre-fail  Always    
>   -       188
>(Average 293)
>  4 Start_Stop_Count        0x0012
>  100   100   000  
> Old_age   Always      
>-       57
>  5 Reallocated_Sector_Ct   0x0033   100  
>100   005    Pre-fail  Always  
>     -      
> 0
>  7 Seek_Error_Rate        
>0x000b   100   100   067  
>  Pre-fail  Always      
>-       0
>  8 Seek_Time_Performance   0x0005   100  
>100   020    Pre-fail  Offline  
>    -      
>0
>  9 Power_On_Hours        
> 0x0012   099   099   000
>   Old_age   Always    
>  -       8005
> 10 Spin_Retry_Count        0x0013  
> 100   100   060    
>Pre-fail  Always       -  
>     0
> 12 Power_Cycle_Count       0x0032  
>100   100   000    Old_age
>  Always       -  
>     57
>192 Power-Off_Retract_Count 0x0032   100   100   050
>   Old_age   Always    
>  -       390
>193 Load_Cycle_Count        0x0012  
>100   100   050    Old_age
>  Always       -  
>     390
>194 Temperature_Celsius     0x0002   220  
>220   000    Old_age   Always
>      -    
>  25 (Lifetime Min/Max 17/40)
>196 Reallocated_Event_Count 0x0032   100   100   000
>   Old_age   Always    
>  -       0
>197 Current_Pending_Sector  0x0022   100   100  
>000    Old_age   Always    
>   -       0
>
>198 Offline_Uncorrectable   0x0008   100   100  
> 000    Old_age   Offline  
>   -       0
>
>199 UDMA_CRC_Error_Count    0x000a   200   200
>  000    Old_age   Always  
>     -      
> 0
а диск прочекать? посматреть может чего найдет!



"Проблемы с HDD(?)"
Отправлено Alexei , 16-Ноя-06 20:43 
>а диск прочекать? посматреть может чего найдет!

fsck ничего не находит.


"Проблемы с HDD(?)"
Отправлено Devil_kot , 16-Ноя-06 20:56 
>>а диск прочекать? посматреть может чего найдет!
>
>fsck ничего не находит.
тогда может винтовая электроника, с другими винтами на этой же тачке есть такие проблемы?


"Проблемы с HDD(?)"
Отправлено Alexei , 16-Ноя-06 20:58 
>тогда может винтовая электроника, с другими винтами на этой же тачке есть
>такие проблемы?

Однократно было. Сейчас, кстати, сообщения не лезут больше..


"Проблемы с HDD(?)"
Отправлено Devil_kot , 16-Ноя-06 21:03 
>>тогда может винтовая электроника, с другими винтами на этой же тачке есть
>>такие проблемы?
>
>Однократно было. Сейчас, кстати, сообщения не лезут больше..


тогда может что с контроллером... у меня было вообще на тачке он полетел.. биос винт видит.. а машика грузится с него не хочет, на другой машине грузится. это случилось после его 2-х дневной работе в 40-ко градусной жаре(кандюк сдох) и видать перегрелся оч сильно.


"Проблемы с HDD(?)"
Отправлено Alekseyka , 08-Июл-09 16:57 
Здраствуйте! Тут проблемка, подскажите как мне восстановить убитый винт!
Симптомы у пациента таковы: много BED секторов!
Предпологаемая причина заболевания: блок питания невыдержал скачка в сети (были проблемы с материнкой и видео на обоих повздувались кондеры но после их замены знакомым мастером все заработало)и полетело много чево!
Первые проявления болезни после попадания в мои руки: На нем оказался раздел объемом 40 с чемто ггб (хотя такова раздела там и отродясь небыло, раздел был без меток), удалось избавиться от него! Просто так не хотел форматироваться! Как уже говарил очень много битых секторов (ручаюсь что не вследствии механических повреждений).
Да и ещё самое главное HDD WesternDigital 250 ггб!
Сейчас проходит процедура записи нуля радной софтиной от производителя!
Пожалуйста высказывайти мнения и выдвигайте теории! Но к сожалению сейчас пока винт очень сильно занят процедурай описанной выше подсчитал около 100 часов на это дело!!!!
Мож у каво такое было или просто знает как бороться!!!!


"Проблемы с HDD(?)"
Отправлено lavr , 16-Ноя-06 19:48 
>С недавнего времени в /var/log/messages стали появляться таке сообщения:
>kernel: ad0: FAILURE - unknown CMD (0xb0) status=51<READY,DSC,ERROR> error=4<ABORTED>
>
>Что это значи и чем оно грозит?
>FreeBSD 6.1-RELEASE-p10
>ad0: 157066MB <HDT722516DLAT80 V43OA70A> at ata0-master UDMA100

# dd if=/dev/ad0 of=/dev/null bs=1m
если до конца не дойдет и вылетит (плюс см логи) - значит BAD'ы, значит
срочно backup если нету и замена диска, если это на боевом сервере, если
обычная WKS, то несколько раз dd на запись, возможно внутренний механизм
за'rem'апит BAD'ы

Поиск по форуму однако


"Проблемы с HDD(?)"
Отправлено Alexei , 16-Ноя-06 21:44 
># dd if=/dev/ad0 of=/dev/null bs=1m
>если до конца не дойдет и вылетит (плюс см логи) - значит
>BAD'ы, значит
>срочно backup если нету и замена диска, если это на боевом сервере,
>если
>обычная WKS, то несколько раз dd на запись, возможно внутренний механизм
>за'rem'апит BAD'ы
>
>Поиск по форуму однако


# dd if=/dev/ad0 of=/dev/null bs=1m
157066+1 records in
157066+1 records out
164696555520 bytes transferred in 3297.084043 secs (49952186 bytes/sec)
Сообщений не было. Мистика..


"Проблемы с HDD(?)"
Отправлено lavr , 16-Ноя-06 21:52 
>># dd if=/dev/ad0 of=/dev/null bs=1m
>>если до конца не дойдет и вылетит (плюс см логи) - значит
>>BAD'ы, значит
>>срочно backup если нету и замена диска, если это на боевом сервере,
>>если
>>обычная WKS, то несколько раз dd на запись, возможно внутренний механизм
>>за'rem'апит BAD'ы
>>
>>Поиск по форуму однако
>
>
># dd if=/dev/ad0 of=/dev/null bs=1m
>157066+1 records in
>157066+1 records out
>164696555520 bytes transferred in 3297.084043 secs (49952186 bytes/sec)
>Сообщений не было. Мистика..

значит надо смотреть в сторону нагрева, разъемов, какой контроллер, диск,
какая нагрузка на блок питание (много ли устройств в машинке?), если много
UDMA дисков и слабый CPU, может и DMA затыкаться.

PS. fsck НЕ ПРОВЕРЯЕТ диск, а проверяет ЦЕЛОСТНОСТЬ UFS! В Linux'е для ext2/3fs
можно использовать fsck для проверки bad'ов, в xBSD нет.