URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID1
Нить номер: 88668
[ Назад ]

Исходное сообщение
"Зависание при установке любого порта, и при обновлении дерева?"

Отправлено sasha73 , 09-Апр-10 09:44 
   Добрый день, господа Специалисты!

   Подскажите, пожалуйста, куда копать?

   Есть один из удаленных серверов под FreeBSD еще 6.1-RELEASE #0 .
   Пока нет возможности до него добраться и переустановить.
   При попытке установки любого порта, происходит полное зависание машины. Файловая система вроде бы в норме, на сколько могу понять удаленно.

   Зависание на этапе регистрации, вроде бы. Например:
...
===>   Registering installation for p5-Digest-SHA1-2.11
и все, зависли, "Press Reset to continue..." :-)

   Попытался поправить дерево pkgdb -F  :

cd: can't cd to /usr/ports/sysutils/portupgrade
--->  Checking the package registry database
Stale origin: 'emulators/linux_base-8': perhaps moved or obsoleted.
-> The port 'emulators/linux_base-8' was removed on 2006-10-02 because:
        "Has expired: unsupported by upstream, no security support anymore"
-> Hint: linux_base-8-8.0_14 is not required by any other package
-> Hint: checking for overwritten files...
-> No files installed by linux_base-8-8.0_14 have been overwritten by other packages.
Deinstall linux_base-8-8.0_14 ? [no] yes
cd: can't cd to /usr/ports/sysutils/portupgrade
cd: can't cd to /usr/ports/sysutils/portupgrade
--->  Deinstalling 'linux_base-8-8.0_14'

и зависание.

   Проба pkg_deinstall linux_base-8

--->  Deinstalling 'linux_base-8-8.0_14'

зависание

   Еще проба pkg_delete linux_base-8-8.0_14   - тоже висяк.

   Как быть в этой ситуации, если пока есть только удаленый контроль?

P.S.: Если сервер не трогать - работает вполне стабильно.


Содержание

Сообщения в этом обсуждении
"Зависание при установке любого порта, и при обновлении дерев..."
Отправлено Ingoa , 09-Апр-10 11:13 
Для начала надо обновить дерево портов, а потом делать все остальное

"Зависание при установке любого порта, и при обновлении дерев..."
Отправлено sasha73 , 09-Апр-10 12:08 
>Для начала надо обновить дерево портов, а потом делать все остальное

  Я же написал, что при обновлении дерева тоже зависает! (прямо в теме сообщения)
  Понятное дело, я с этого и начинал!
  
  Но при "cvsup -g -L 2 /usr/local/etc/supfile && make fetchindex"

зависание в средине процесса.


"Зависание при установке любого порта, и при обновлении дерев..."
Отправлено cuad0 , 09-Апр-10 12:16 
>Файловая система вроде бы в норме, на сколько могу понять удаленно.

Ох, неужто дождались? Телепат вышел из отпуска? Ура, на форуме снова есть телепат! :)

Сколько времени по вашим меркам должно пройти, чтобы это можно было назвать "висяком"?

portsnap есть?


"Зависание при установке любого порта, и при обновлении дерев..."
Отправлено sasha73 , 09-Апр-10 16:13 
>Ох, неужто дождались? Телепат вышел из отпуска? Ура, на форуме снова есть
>телепат! :)

   Спасибо, что поиздевались, вместо помощи. :)
   Вывод был сделан на основе: fsck

   Все разделы проходят проверку в стиле:

** /dev/ad0s1f (NO WRITE)
** Last Mounted on /usr
** Phase 1 - Check Blocks and Sizes
** Phase 2 - Check Pathnames
** Phase 3 - Check Connectivity
** Phase 4 - Check Reference Counts
** Phase 5 - Check Cyl groups
227050 files, 831064 used, 1707455 free (30495 frags, 209620 blocks, 1.2% fragmentation)

   Т.е. проблем нет!
   Кстати:

background_fsck="NO"
fsck_y_enable="YES"    

   тоже вписаны!


>
>Сколько времени по вашим меркам должно пройти, чтобы это можно было назвать
>"висяком"?
>

   Полное зависание, я считаю - это когда ПК зависает полностью, перестают пинговаться все сетевые карты и системый блок не реагирует даже на кратковременное нажатие клавиши "POWER". А вот RESET, как не удивительно :), помогает!
   Времени? Да так будет продолжаться до бесконечности, если не перегрузить. Надеюсь для Вас достаточно этого времени? :)

>portsnap есть?

   Есть! Намек понял.

   Запустил "portsnap fetch"

...
Extracting snapshot... done.
Verifying snapshot integrity... done.
Fetching snapshot tag... done.
Fetching snapshot metadata... done.
Updating from пятница,  9 апреля 2010 г. 03:11:06 (EEST) to пятница,  9 апреля 2010 г. 13:16:40 (EEST).
Fetching 4 metadata patches... done.
Applying metadata patches...

  и снова зависание!

  Может еще на предмет BAD-блоков проверить раздел /dev/ad0s1f (/usr)
  Чем это лучше всего сделать удаленно?


"Зависание при установке любого порта, и при обновлении дерев..."
Отправлено бусик , 09-Апр-10 16:37 
>[оверквотинг удален]
>Fetching snapshot metadata... done.
>Updating from пятница,  9 апреля 2010 г. 03:11:06 (EEST) to пятница,
> 9 апреля 2010 г. 13:16:40 (EEST).
>Fetching 4 metadata patches... done.
>Applying metadata patches...
>
>  и снова зависание!
>
>  Может еще на предмет BAD-блоков проверить раздел /dev/ad0s1f (/usr)
>  Чем это лучше всего сделать удаленно?

а какая температура процессора? уж больно на перегрев похоже... могу и ошибаться


"Зависание при установке любого порта, и при обновлении дерев..."
Отправлено sasha73 , 09-Апр-10 17:17 
>
>а какая температура процессора? уж больно на перегрев похоже... могу и ошибаться
>

   За температурой следить нет возможности, т.к. для этого нужно что-то поставить, а поставить ничего не удается! Виснет тут же!

   Не очень похоже на перегрев, т.к. сервер без затрагивания портов, работает вполне стабильно. Правда на него нагрузки большой нет, но почтой занимается, не виснет. Да и распаковка небольшого порта, разве это нагрузка то???
   Можно попробовать какой-то немаленький архив разархивировать/сжать но на другом разделе. При перегреве должен и тогда повиснуть.

   Может проблемы с памятью? Можно во Фре как-то удаленно потестировать?

   Пока запустил "dd if=/dev/ad0s1f of=/dev/null conv=noerror,sync bs=512" - уже пол часика работает и не виснет - жду результатов.

   И так, если нет других вариантов и подозреваете железо? То как удаленно лучше проверить раздел на BAD-ы, память и на перегрев? (учитывая, что поставить ничего не получается)

P.S.: Полгода назад на сервере была проблема с железом. Повздувались конденсаторы - он вис сам по себе. Конденсаторы перепаял - все стало стабильно. Зависать начал при моем вмешательстве в обновление портов или установку пакета.


"Зависание при установке любого порта, и при обновлении дерев..."
Отправлено lavr , 09-Апр-10 17:47 
>>
>>а какая температура процессора? уж больно на перегрев похоже... могу и ошибаться
>>
>
>   За температурой следить нет возможности, т.к. для этого нужно
>что-то поставить, а поставить ничего не удается! Виснет тут же!

печально

>   Не очень похоже на перегрев, т.к. сервер без затрагивания
>портов, работает вполне стабильно. Правда на него нагрузки большой нет, но
>почтой занимается, не виснет. Да и распаковка небольшого порта, разве это
>нагрузка то???

в мире все относительно

>   Можно попробовать какой-то немаленький архив разархивировать/сжать но на другом
>разделе. При перегреве должен и тогда повиснуть.
>
>   Может проблемы с памятью? Можно во Фре как-то удаленно
>потестировать?
>
>   Пока запустил "dd if=/dev/ad0s1f of=/dev/null conv=noerror,sync bs=512" - уже
>пол часика работает и не виснет - жду результатов.

зачем в таком случае conv? при наличии проблем у диска - dd просто вылетит и
сообщит об ошибке IN/OUT

>   И так, если нет других вариантов и подозреваете железо?
>То как удаленно лучше проверить раздел на BAD-ы, память и на
>перегрев? (учитывая, что поставить ничего не получается)

память - нагрузить по полной, несколько make buildworld или kernel с разным
MAKEOBJDIRPREFIX и с -jX (X = 4), посмотреть в сторону forkbomb или еще чего
из портов, ну или из пакетов их развернуть

>P.S.: Полгода назад на сервере была проблема с железом. Повздувались конденсаторы -
>он вис сам по себе. Конденсаторы перепаял - все стало стабильно.
>Зависать начал при моем вмешательстве в обновление портов или установку пакета.

нагрузка маленькая, чуть побольше получил и вылезли железячные проблемы:

- греется что угодно, cpu, мосты и тд и тп
- проблема памяти, cpu (для cpu - cpuburn или что подобное из портов-пакетов)
- проблема БП
- проблемы статического эл-ва из-за пыли (обычно пробивает память и reboot без
всяких coredump)
и тд и тп

настроить расширенные логи и изучать, если есть возможность в удаленном помещении
посадить слейва чтобы записал сообщения от panic на консоли, тоже хорошо

ps. пора озаботиться backup'ом...


"Зависание при установке любого порта, и при обновлении дерев..."
Отправлено sasha73 , 09-Апр-10 18:23 
>
>в мире все относительно
>

   Да уж... :)

>
>зачем в таком случае conv? при наличии проблем у диска - dd
>просто вылетит и
>сообщит об ошибке IN/OUT
>

    Как бы там нибыло - тест прошел успешно "dd if=/dev/ad0s1f of=/dev/null conv=noerror,sync bs=512" :
10485760+0 records in
10485760+0 records out
5368709120 bytes transferred in 2810.173697 secs (1910455 bytes/sec)
>
>память - нагрузить по полной, несколько make buildworld или kernel с разным
>MAKEOBJDIRPREFIX и с -jX (X = 4), посмотреть в сторону forkbomb или
>еще чего
>из портов, ну или из пакетов их развернуть

    Опасно запускать, т.к. виснет как-раз при установке/сборке приложений.


>
>нагрузка маленькая, чуть побольше получил и вылезли железячные проблемы:
>

   Да это все понятно! Я не плохо в ремонте железа разбираюсь.
   Тут вопрос больше, может это все же программная ошибка ФРИ? (или по крайней мере программно можно обойти)

>
>ps. пора озаботиться backup'ом...

   Вот как раз из-за него и начал разбираться. Видел и раньше проблему, но как-то руки не доходили. Ведь, если не трогать - работает. А тут начал ставить fsbackup - снова повис и меня задело. Решил разобраться! :)

P.S.:   Только что в разделе /var заархивировал 130 МБ в tar.bz2. И распаковал в тот же раздел - ничего не повисло. На перегрев не похоже, по-моему. Сборка из портов, например, fsbackup того же - должна быть еще менее трудозатратная процедура!


"Зависание при установке любого порта, и при обновлении дерев..."
Отправлено lavr , 09-Апр-10 21:58 
>    Как бы там нибыло - тест прошел успешно
>"dd if=/dev/ad0s1f of=/dev/null conv=noerror,sync bs=512" :
>10485760+0 records in
>10485760+0 records out
>5368709120 bytes transferred in 2810.173697 secs (1910455 bytes/sec)

хм, а вы что ожидали, запустили же dd с conv=noerror,sync
об этом уже расписано: man dd

с conv=noerror dd не будет прерываться по ошибке, а сбойные блоки будут
дописываться нулями == sync

обычно проверка на чтение:

# dd if=/dev/disk of=/dev/null bs=1M

быстро и сердито.

Если мы проверяем диски, то после dd с conv=noerror - следует смотреть логи
на наличие ошибок или smartmontools

>   Тут вопрос больше, может это все же программная ошибка
>ФРИ? (или по крайней мере программно можно обойти)

для этого нужно видеть что на консоль сыпется и выпадение в panic,
для этого настроить лог консоли и чтобы slave записал что вывалилось на
консоль при panic'е, получить coredump и посмотреть на чем валится


"Зависание при установке любого порта, и при обновлении дерев..."
Отправлено sasha73 , 10-Апр-10 03:34 
>
>обычно проверка на чтение:
>
># dd if=/dev/disk of=/dev/null bs=1M
>

Результат выполения такой команды тоже без ошибок:
dd if=/dev/ad0s1f of=/dev/null bs=1M                  

5120+0 records in
5120+0 records out
5368709120 bytes transferred in 185.477754 secs (28945299 bytes/sec)


"Зависание при установке любого порта, и при обновлении дерев..."
Отправлено lavr , 10-Апр-10 10:54 
>[оверквотинг удален]
>>
>># dd if=/dev/disk of=/dev/null bs=1M
>>
>
>Результат выполения такой команды тоже без ошибок:
>dd if=/dev/ad0s1f of=/dev/null bs=1M
>
>5120+0 records in
>5120+0 records out
>5368709120 bytes transferred in 185.477754 secs (28945299 bytes/sec)

90% что проблем с диском нет


"Зависание при установке любого порта, и при обновлении дерев..."
Отправлено sasha73 , 10-Апр-10 14:05 
>
>90% что проблем с диском нет

   Ну, и судя по нормальному разархивирования/сжатию большого файла - на проблемы с перегревом тоже не похоже. Тут именно проблемы с базой портов или что-то в таком духе.
В понедельник нужно еще попробовать поставить вообще просто что-то из исходников.

   Так что это может быть, Господа? И как лечить?


"Зависание при установке любого порта, и при обновлении дерев..."
Отправлено sasha73 , 12-Апр-10 15:44 
Похоже идей больше нет?

"Зависание при установке любого порта, и при обновлении дерев..."
Отправлено lavr , 12-Апр-10 17:18 
>Похоже идей больше нет?

из-за базы портов компьютер не зависнет и не перезагрузится
далее смотреть pkg_add -v
в портах - смотреть step by step: make fetch/extract/configure/build/install
на какой фазе начнет валиться
вы сборку пробовали:

# rm -rf /usr/obj/*
# cd /usr/src
# make buildworld
- работает? если да, а на портах валится - мб что-то напортили в дереве портов

собственно вы ничего толком не написали ЧТО у вас происходит, ни одного кусочка лога
или сообщения при проблеме