Привет всем. Вот столкнулся с траблой. ASP 7.3 подвисает стабильно раз в 2-3-4 дня.. Приходится жать ресет.. А там еще и fsck приходицца запускать имхо поврждения.. Ну я прям не знаю че делать.. На новое ядро еще не собрался с духом переходить...
Юзается тачка как сервер, юзвери через него из локалки в нет лезут, идет туда почта. Маршрутизация и маскарадинг по НАТу через IPTABLES..
И еще.
У меня предположения два:
1. Либо IPTABLES конфликтует с ядрышком, и после чего то там вешает машину
2. Либо глючное ядро попалось..
Я как то запустил yum ( автоматическая обновлялка в АСП типа up2date )
так после того када начала инсталлить обновления, написала что
conflict iptables with kernel..
вот я и сижу и думаю.. чеж делать??
Мож кто подскажет??
Заранее спасибо всем!
попробуй ядрышко 2.4.20 в rpm(для ASP 7.3) слить и ручками поставить
>Привет всем. Вот столкнулся с траблой. ASP 7.3 подвисает стабильно раз в
>2-3-4 дня.. Приходится жать ресет.. А там еще и fsck приходицца
>запускать имхо поврждения.. Ну я прям не знаю че делать.. На
>новое ядро еще не собрался с духом переходить...
>Юзается тачка как сервер, юзвери через него из локалки в нет лезут,
>идет туда почта. Маршрутизация и маскарадинг по НАТу через IPTABLES..
>И еще.
>У меня предположения два:
>1. Либо IPTABLES конфликтует с ядрышком, и после чего то там вешает
>машину
>2. Либо глючное ядро попалось..
>Я как то запустил yum ( автоматическая обновлялка в АСП типа up2date
>)
>так после того када начала инсталлить обновления, написала что
>conflict iptables with kernel..
>вот я и сижу и думаю.. чеж делать??
>Мож кто подскажет??
>Заранее спасибо всем!я тут уже писал, у меня такая же штука была, оказывалось что не только у меня. У меня был ASP 7.3, на нём крутилось sendmail, samba. ФС была ext3. Так и не понял в чём проблема была. Когда линуху ставил выбирал только нужные пакеты, после меня же чел ставил так кажется поставил чут ли не полную установку, так как бы не было смешно не разу не повисло. С тех пор я юзаю только FreeBSD :)
Надо слишком много знать о системе, чтоб можно было рассуждать что именно виснет, особенно если /var/log/messages ничего интересного из последних записей не содержит. А то, что он пишет про конфликт Iptables с ядром, так я тебе точно могу сказать, дело не в этом :)P.S. Есть всего две причины вынуждающие поставить freebsd вместо linux - личные предпочтения или кривые руки.
wbr, akeeper.
>Надо слишком много знать о системе, чтоб можно было рассуждать что именно
>виснет, особенно если /var/log/messages ничего интересного из последних записей не содержит.
>А то, что он пишет про конфликт Iptables с ядром, так
>я тебе точно могу сказать, дело не в этом :)
>
>P.S. Есть всего две причины вынуждающие поставить freebsd вместо linux - личные
>предпочтения или кривые руки.
>10 ящиков виртуального пива to akeeper!!
По поводу стабильности дистрибутива.
Товарисч! Если руки кривые то fbsd чпукс или саплярис тебя не спасет. к гадалке не ходи.
У меня как серверная платформа личное предпочтение - debian.
А не кривая поделка на тему редхата от отечественного производителя. (к счастью знакомство с asp закончилось на rc3.)
Имхо это проблему не решает. Так как невозможно допустить чтоб тачка не пахала хоть час... Пару десяток минут дауна, и весь коллектив дружно **** в одно место...
Так вот кидаю лог: /var/log/messagesAug 4 10:54:55 mail kernel: Unable to handle kernel paging request at virtual address 19b182c5
Aug 4 10:54:55 mail kernel: printing eip:
Aug 4 10:54:55 mail kernel: c012ea09
Aug 4 10:54:55 mail kernel: *pde = 00000000
Aug 4 10:54:55 mail kernel: Oops: 0000
Aug 4 10:54:55 mail kernel: 8139too mii ipt_MASQUERADE iptable_nat ip_conntrack iptable_filter ip_tables u
Aug 4 10:54:55 mail kernel: CPU: 0
Aug 4 10:54:55 mail kernel: EIP: 0010:[<c012ea09>] Not tainted
Aug 4 10:54:55 mail kernel: EFLAGS: 00010046
Aug 4 10:54:55 mail kernel:
Aug 4 10:54:55 mail kernel: EIP is at kfree [kernel] 0x39 (2.4.18-5asp)
Aug 4 10:54:55 mail kernel: eax: 00e00000 ebx: 71238439 ecx: 19b182b9 edx: 00000000
Aug 4 10:54:55 mail kernel: esi: 00000100 edi: 00000206 ebp: 0000001a esp: cffe1f54
Aug 4 10:54:55 mail kernel: ds: 0018 es: 0018 ss: 0018
Aug 4 10:54:55 mail kernel: Process kswapd (pid: 5, stackpage=cffe1000)
Aug 4 10:54:55 mail kernel: Stack: c8852da0 c18966e0 cdbfad40 c8852da0 c014aca1 00000100 cffe0000 00000000
Aug 4 10:54:55 mail kernel: 00000000 ffffffff c02c9888 00000000 00000000 000002d9 c01305c3 000001d0
Aug 4 10:54:55 mail kernel: 000002d9 00000000 00000000 c014afd0 00000d0b c0130d9c 00000006 000001d0
Aug 4 10:54:55 mail kernel: Call Trace: [<c014aca1>] prune_dcache [kernel] 0x141
Aug 4 10:54:55 mail kernel: [<c01305c3>] page_launder [kernel] 0x2b3
Aug 4 10:54:55 mail kernel: [<c014afd0>] shrink_dcache_memory [kernel] 0x20
Aug 4 10:54:55 mail kernel: [<c0130d9c>] do_try_to_free_pages [kernel] 0x1c
Aug 4 10:54:55 mail kernel: [<c0131091>] kswapd [kernel] 0x101
Aug 4 10:54:55 mail kernel: [<c0105000>] stext [kernel] 0x0
Aug 4 10:54:55 mail kernel: [<c0107136>] kernel_thread [kernel] 0x26
Aug 4 10:54:55 mail kernel: [<c0130f90>] kswapd [kernel] 0x0
Aug 4 10:54:55 mail kernel:
Aug 4 10:54:55 mail kernel:
Aug 4 10:54:55 mail kernel: Code: 8b 41 0c 29 c6 89 f0 f7 73 18 89 c6 8b 41 14 89 44 b1 18 89
Aug 4 11:03:32 mail sshd(pam_unix)[6417]: session closed for user root
Aug 4 11:04:30 mail sshd(pam_unix)[16581]: session opened for user root by (uid=0)
Aug 4 11:08:48 mail sshd(pam_unix)[16581]: session closed for user root
А вот тут нажали ресет.
Aug 4 11:24:55 mail syslogd 1.4.1: restart.Я тут начал расспрашивать, рекомендовали отключить USB и поменять сетевуху. Так как при пинге выдает вот такую байду: ICMP
wrong data byte #0 should be 0xa9 but was 0xa8a8
Слил 2.4.20 ядро
устанавливаю
rpm -Uvh kernel
failed dependencies
iptables < 1.2.7-1 conflicts with kernel-2.4.20
вот тебе и раз.
>Слил 2.4.20 ядро
>устанавливаю
>rpm -Uvh kernel
>failed dependencies
> iptables < 1.2.7-1 conflicts with kernel-2.4.20
>вот тебе и раз.а посмотреть - вдруг у асп есть апдейт до нужной версии - вот тебе и два :-)
Какого спрашивается x.......... ты ставил ASP ???
Глючная поделка наших - на RedHat !!!
Вот и ломай теперь глову и пересобирай для компиляции ядро !
Ну зачем себе такой геморой-то устраивать я не могу понять ?
>Какого спрашивается x.......... ты ставил ASP ???
>Глючная поделка наших - на RedHat !!!
>Вот и ломай теперь глову и пересобирай для компиляции ядро !
>Ну зачем себе такой геморой-то устраивать я не могу понять ?Бредовое ничем не аргументированное утверждение.
wbr, akeeper.
>>Какого спрашивается x.......... ты ставил ASP ???
>>Глючная поделка наших - на RedHat !!!
>>Вот и ломай теперь глову и пересобирай для компиляции ядро !
>>Ну зачем себе такой геморой-то устраивать я не могу понять ?
>
>Бредовое ничем не аргументированное утверждение.
>
>wbr, akeeper.А чего тут аргументировать ?!
Достаточно поставить ASP на сервак и "наслаждайся" аргументами :)
t@rri.
>>Какого спрашивается x.......... ты ставил ASP ???
>>Глючная поделка наших - на RedHat !!!
>>Вот и ломай теперь глову и пересобирай для компиляции ядро !
>>Ну зачем себе такой геморой-то устраивать я не могу понять ?
>
>Бредовое ничем не аргументированное утверждение.
>
>wbr, akeeper.
На самом деле дистрибутив то, действительно глюкавенький...
Все сделал. Пересобрал ядро новой версии, проапдейтил IPTABLES. Ждемс..
Пока все работает
Впринципе, первый раз у меня вообще ни с того ни с сего партиция сдохла... Думал железо - оказалось винт нормальный. Но так как на тот момент другого дистриба не было, пришлось ставить АСП..
У меня на другом серванте Слакварь стоит, так тот я месяцами не перегружаю....
>Aug 4 10:54:55 mail kernel: 8139too mii ipt_MASQUERADE iptable_nat ip_conntrack iptable_filter>Я тут начал расспрашивать, рекомендовали отключить USB и поменять сетевуху. Так как
>при пинге выдает вот такую байду: ICMP
>wrong data byte #0 should be 0xa9 but was 0xa8a8У меня подобное происходило с RH 6.0
Ядро было 2.4.19 с kernel.org, и вснуть стало после добавления четвертой сетевухи. Мама на виавском чипсете на USB и два нижних слота PCI отдает оно прерывание, и при любой попытке поспользоваться USB начиналось нечто подобное, но машина продолжала работать. Пришлость отказаться от USB.ЗЫ. На USB висел модем подключенный через PL2303 (USB -> COM).
Ну у меня ничего не висит на USB. Но как доберусь физически до тачки - тут же отключу USB к чертям. Меня смущает вот это:
ICMP
>wrong data byte #0 should be 0xa9 but was 0xa8a8если сетевушка бьет ИЦМП... то значит и с ней что то не то...
Я прову звонил, они роутинг и физику проверяли, так что канал чист..
у тебя в явном виде он пишет, что kswapd нагибает.
Или я ошибаюсь? (вопрос к гуру).
У тебя недостастатка памяти не возникает?
Может swap раздел проверить на бэд сектора?WBR, Dvorkin
>у тебя в явном виде он пишет, что kswapd нагибает.
>Или я ошибаюсь? (вопрос к гуру).
>У тебя недостастатка памяти не возникает?
>Может swap раздел проверить на бэд сектора?
>
>WBR, Dvorkinпростите, я не дочитал доконца.
приятно, что предположения оправдались :)WBR, Dvorkin
Подобная вещь (я имею в виду записи в messages) была у меня на RH6.2. После перекомпиляции ядра на некоторое время стало спокойнее... А потом все вернулось на круги своя (в смысле, продолжило виснуть). Поменял HDD (благо, было время на переустановку системы) - эффект тот же. Однако, когда повнимателнее посмотрел на записи в messages, понял, что ругается в основном процесс kswapd, а он связан с одной стороны с HDD, а с другой - с _RAM_ !!!
Так оно и оказалось. Выдернул битую линейку памяти, и теперь у меня не 256, а всего 192 М :( - зато все работает.
Удачи.
Хм.. Спасибо! Дельный совет..
Потому как у мя стоит две PC133 и одна 100..
Дело в том когда я проводил профилактику, ну там пыль сдувал и все такое, я снял планки, потом поставил всего-лишь одну, но вот на одной PC133 он даже не разговаривал, я это мимо ушей пропустил и расставил так что все заработало... Память как надо определилась...
Чтож поглядим...
Еще раз спасибо
Применительно к Линуху следует расшифровывать значение "виснет". Предположим, имеется в виду "kernel panic", что индицируется миганием светодиодов на клаве. На собственном опыте пришёл к выводу, что внезапный panic без возможности выяснить причину возникает в случаях.
1) Недостаточное охлаждение CPU.
2) Следует избегать, по возможности, использования высокоскоростными устройствами (RAID, FastEthernet) одного и того же прерывания. Избегать также совместного использования irq высокоскоростным и низкоскоростым устройством, например FastEthernet и карты SBNI. Видно в коде ядра, расшаривающем прерывания, ещё есть проблемы.Для примера, с выполненными выше условиями сервак под ASP 7.1 с ядром 2.4.19 работает многие месяцы без reset.