URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID1
Нить номер: 86374
[ Назад ]

Исходное сообщение
"Помогите разобраться, что нужно, а что нет"

Отправлено rocknroll , 23-Авг-09 23:51 
Здравствуйте уважаемые знатоки операционной системы freebsd. Спрашиваю у вас совет. Сервер начал часто перезагружаться самопроизвольно. Жалуется на отсутствие свободного места на диске. (раньше такого не было).

Aug 23 20:50:28 server savecore: reboot after panic: page fault
Aug 23 20:50:28 server savecore: no dump, not enough free space on device (24286 available, need 53442)
Aug 23 20:50:28 server savecore: unsaved dumps found but not saved
Aug 23 20:51:36 server fsck: /dev/ad0s1e: 13 files, 793 used, 253022 free (38 frags, 31623 blocks, 0.0% fragmentation)
Aug 23 20:55:14 server fsck: /dev/ad0s1f: INCORRECT BLOCK COUNT I=2753 (11424 should be 11360) (CORRECTED)
Aug 23 20:55:14 server fsck: /dev/ad0s1f: UNREF FILE I=2753  OWNER=root MODE=100400
Aug 23 20:55:14 server fsck: /dev/ad0s1f: SIZE=9961275848 MTIME=Aug 23 20:47 2009  (CLEARED)
Aug 23 20:55:14 server fsck: /dev/ad0s1f: Reclaimed: 0 directories, 2 files, 2432 fragments
Aug 23 20:55:14 server fsck: /dev/ad0s1f: 229623 files, 1166590 used, 3540917 free (55797 frags, 435640 blocks, 1.2% fragmentation)
Aug 23 20:55:38 server fsck: /dev/ad0s1d: INCORRECT BLOCK COUNT I=117793 (352 should be 336) (CORRECTED)
Aug 23 20:55:38 server fsck: /dev/ad0s1d: UNREF FILE I=1627  OWNER=root MODE=100400
Aug 23 20:55:38 server fsck: /dev/ad0s1d: SIZE=1591738480 MTIME=Aug 23 20:43 2009  (CLEARED)
Aug 23 20:55:38 server fsck: /dev/ad0s1d: Reclaimed: 0 directories, 1 files, -12 fragments
Aug 23 20:55:38 server fsck: /dev/ad0s1d: 24096 files, 678455 used, 72092 free (516 frags, 8947 blocks, 0.1% fragmentation)

Итак состояние свободного пространства:

server# df -h
Filesystem     Size    Used   Avail Capacity  Mounted on
/dev/ad0s1a    496M    260M    196M    57%    /
devfs          1.0K    1.0K      0B   100%    /dev
/dev/ad0s1e    496M    1.5M    455M     0%    /tmp
/dev/ad0s1f    9.0G    2.2G    6.0G    27%    /usr
/dev/ad0s1d    1.4G    1.3G     24M    98%    /var

Проблема в том, что я не очень то разбираюсь какие файлы занимают слишком много места, а какие нет. Итак мною была найдена папка /var/crash

server# pwd
/var/crash
server# du -h
1.2G    .

содержимое папки crash:

server# ls
bounds          info.16         info.24         info.32         info.9          vmcore.15       vmcore.23       vmcore.31       vmcore.8
info.0          info.17         info.25         info.33         minfree         vmcore.16       vmcore.24       vmcore.32       vmcore.9
info.1          info.18         info.26         info.34         vmcore.0        vmcore.17       vmcore.25       vmcore.33
info.10         info.19         info.27         info.35         vmcore.1        vmcore.18       vmcore.26       vmcore.34
info.11         info.2          info.28         info.4          vmcore.10       vmcore.19       vmcore.27       vmcore.35
info.12         info.20         info.29         info.5          vmcore.11       vmcore.2        vmcore.28       vmcore.4
info.13         info.21         info.3          info.6          vmcore.12       vmcore.20       vmcore.29       vmcore.5
info.14         info.22         info.30         info.7          vmcore.13       vmcore.21       vmcore.3        vmcore.6
info.15         info.23         info.31         info.8          vmcore.14       vmcore.22       vmcore.30       vmcore.7

Так вот, выяснилось что файлов vmcore 34 штуки и весят каждый по 30-40 Мбайт. Так вот, спрашиваю совета что это за файлы и можно ли их удалять?


Содержание

Сообщения в этом обсуждении
"Помогите разобраться, что нужно, а что нет"
Отправлено Michael , 24-Авг-09 00:20 

>Так вот, выяснилось что файлов vmcore 34 штуки и весят каждый по
>30-40 Мбайт. Так вот, спрашиваю совета что это за файлы и
>можно ли их удалять?

это crash дампы, создаются автоматически при падении ядра. если не умеете с ними работать, можете удалять


"Помогите разобраться, что нужно, а что нет"
Отправлено Pahanivo , 24-Авг-09 08:41 
>[оверквотинг удален]
>info.15         info.23  
>      info.31    
>    info.8      
>   vmcore.14       vmcore.22
>      vmcore.30    
>  vmcore.7
>
>Так вот, выяснилось что файлов vmcore 34 штуки и весят каждый по
>30-40 Мбайт. Так вот, спрашиваю совета что это за файлы и
>можно ли их удалять?

скорей всего валится изза переполнения /var
df -h
du -d1 -h
в помощь
хотя странно что перегружается
скорей всего это /var/tmp или что то еще куда идет активная запись
перенеси некоторые диры в другое место например в /usr создав соотв линки


"Помогите разобраться, что нужно, а что нет"
Отправлено rocknroll , 24-Авг-09 23:18 
Вы знаете, я удалил те файлы vmcore, освободилось место:

Filesystem     Size    Used   Avail Capacity  Mounted on
/dev/ad0s1a    496M    260M    196M    57%    /
devfs          1.0K    1.0K      0B   100%    /dev
/dev/ad0s1e    496M    1.5M    455M     0%    /tmp
/dev/ad0s1f    9.0G    2.2G    6.0G    27%    /usr
/dev/ad0s1d    1.4G    185M    1.1G    14%    /var

Но это не помогло, сервер так же перезагружается когда захочет

Aug 24 21:07:55 server savecore: reboot after panic: page fault
Aug 24 21:07:55 server savecore: writing core to vmcore.37
Aug 24 21:08:17 server su: timur to root on /dev/ttyp0
Aug 24 21:09:11 server fsck: /dev/ad0s1e: 13 files, 793 used, 253022 free (38 frags, 31623 blocks, 0.0% fragmentation)

Оперативку я проверил мемтестом, ошибок нет. Кто-нибудь знает в чем проблема? что же на самом деле означает "reboot after panic: page fault"? (перевод дословный я знаю)



"Помогите разобраться, что нужно, а что нет"
Отправлено аноним , 25-Авг-09 00:06 
Переполнение файловой системы не может быть причиной паники - это вообще-то, ее следствие, потому что /var забился дампами. В /var/log/messages должна быть информация о причине панике, смотрите сразу над сообщениям от последней загрузки системы. Либо kgdb /boot/kernel/kernel vmcore.<последний_номер> и там набрать bt full.

"Помогите разобраться, что нужно, а что нет"
Отправлено rocknroll , 25-Авг-09 07:29 
>Переполнение файловой системы не может быть причиной паники - это вообще-то, ее следствие, потому что /var забился дампами. В /var/log/messages должна быть информация о причине панике, смотрите сразу над сообщениям от последней загрузки системы. Либо kgdb /boot/kernel/kernel vmcore.<последний_номер> и там набрать bt full.

Так вот что находится в /var/log/messages:

Aug 24 21:07:55 server savecore: reboot after panic: page fault
Aug 24 21:07:55 server savecore: writing core to vmcore.37
Aug 24 21:08:17 server su: timur to root on /dev/ttyp0
Aug 24 21:09:11 server fsck: /dev/ad0s1e: 13 files, 793 used, 253022 free (38 frags, 31623 blocks, 0.0% fragmentation)

А я как раз не понимаю что он написал про причину паники


"Помогите разобраться, что нужно, а что нет"
Отправлено аноним , 26-Авг-09 20:30 
>А я как раз не понимаю что он написал про причину паники

про kgdb я написал


"Помогите разобраться, что нужно, а что нет"
Отправлено Anatoliy , 25-Авг-09 02:23 
>[оверквотинг удален]
>
>Aug 24 21:07:55 server savecore: reboot after panic: page fault
>Aug 24 21:07:55 server savecore: writing core to vmcore.37
>Aug 24 21:08:17 server su: timur to root on /dev/ttyp0
>Aug 24 21:09:11 server fsck: /dev/ad0s1e: 13 files, 793 used, 253022 free
>(38 frags, 31623 blocks, 0.0% fragmentation)
>
>Оперативку я проверил мемтестом, ошибок нет. Кто-нибудь знает в чем проблема? что
>же на самом деле означает "reboot after panic: page fault"? (перевод
>дословный я знаю)

У Вас часом фоновым процессом fsck не работает?
Было такое... Пока в single mode fsck не сделаешь, система тоже периодически перегружалась... Правда такое поведение было или на 4.х или 5.х релизах, щас уже не помню. Понимаю, что это гадание на кофейной гуще, но может поможет.
    


"Помогите разобраться, что нужно, а что нет"
Отправлено napTu , 21-Сен-09 23:46 
помогите советом, что делать, вдруг начало падать
похоже проблема в softupdates -> handle_allocindir_partdone

This GDB was configured as "i386-marcel-freebsd"...(no debugging symbols found)...
Attempt to extract a component of a value that is not a structure pointer.
Attempt to extract a component of a value that is not a structure pointer.
Attempt to extract a component of a value that is not a structure pointer.
Attempt to extract a component of a value that is not a structure pointer.
#0  0xc080569b in doadump ()
(kgdb) bt full
#0  0xc080569b in doadump ()
No symbol table info available.
#1  0xc0805bfd in boot ()
No symbol table info available.
#2  0xc080604d in panic ()
No symbol table info available.
#3  0xc0b25efd in trap_fatal ()
No symbol table info available.
#4  0xc0b2627a in trap_pfault ()
No symbol table info available.
#5  0xc0b26c6c in trap ()
No symbol table info available.
#6  0xc0b0ad4b in calltrap ()
No symbol table info available.
#7  0xc0a2b022 in add_to_worklist ()
No symbol table info available.
#8  0xc0a2b6db in handle_allocindir_partdone ()
No symbol table info available.
#9  0xc0a31955 in softdep_disk_write_complete ()
No symbol table info available.
#10 0xc0a38202 in ffs_backgroundwritedone ()
No symbol table info available.
#11 0xc08748a2 in bufdone ()
No symbol table info available.
#12 0xc07a7fcf in g_io_schedule_up ()
No symbol table info available.
#13 0xc07a8310 in g_up_procbody ()
No symbol table info available.
#14 0xc07de79d in fork_exit ()
No symbol table info available.
#15 0xc0b0adc0 in fork_trampoline ()
No symbol table info available.
(kgdb)