Здравствуте господа!
Есть проблема, хотел узнать ваше мнение. Трабл такова:
В сети куча девайсов, все шлют логи на специально созданный для этого сервер логов, используется обычный syslogd. Так вот логи теряются, причём конкретно так, если на оригинальном девайсе в минуты их пишется, например 1000 строк, то на сервере логов их 100.
Думал что максимально загружен сетевой интерфейс (хоть и гибитная медь), ан нет.
"ip -s -s link" говорит что dropped = 0, на сколько я понял это значит что пакеты не режутся...
Ниже выводы команд "ip -s -s link" , "top | grep syslogd" , "sar".=============================================
[root@server]# ip -s -s link
2: eth0: <BROADCAST,MULTICAST,UP> mtu 1500 qdisc pfifo_fast qlen 1000
link/ether 00:11:25:8c:76:68 brd ff:ff:ff:ff:ff:ff
RX: bytes packets errors dropped overrun mcast
1819487455 112078522 0 0 0 0
RX errors: length crc frame fifo missed
0 0 0 0 0
TX: bytes packets errors dropped carrier collsns
2405680220 14781201 0 0 0 0
TX errors: aborted fifo window heartbeat
0 0 0 0
============================================
[root@server]# top | grep syslogd
top - 14:48:21 up 12 days, 23:53, 1 user, load average: 2.02, 2.03, 1.95
Tasks: 78 total, 1 running, 75 sleeping, 2 stopped, 0 zombie
Cpu(s): 0.2% us, 0.3% sy, 0.0% ni, 51.7% id, 47.7% wa, 0.2% hi, 0.0% si
Mem: 1034436k total, 1004536k used, 29900k free, 53756k buffers
Swap: 4192956k total, 208k used, 4192748k free, 847664k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
3012 root 15 0 2080 704 568 D 0 0.1 23:29.35 syslogd
3012 root 15 0 2080 704 568 D 0 0.1 23:29.35 syslogd
3012 root 15 0 2080 704 568 D 0 0.1 23:29.36 syslogd
3012 root 15 0 2080 704 568 D 0 0.1 23:29.37 syslogd
3012 root 15 0 2080 704 568 D 0 0.1 23:29.37 syslogd
=============================================
[root@logwatch ~]# sar
Linux 2.6.9-55.0.12.ELsmp (logwatch) 12/21/2007
12:00:01 AM CPU %user %nice %system %iowait %idle
12:10:01 AM all 0.09 0.00 0.17 48.16 51.58
12:20:01 AM all 0.08 0.00 0.16 48.19 51.57
12:30:01 AM all 0.09 0.00 0.17 48.16 51.58
12:40:01 AM all 0.09 0.00 0.18 48.19 51.55
12:50:01 AM all 0.09 0.00 0.19 48.18 51.55
01:00:01 AM all 0.09 0.00 0.18 48.16 51.56
01:10:01 AM all 0.09 0.00 0.17 48.19 51.55
01:20:02 AM all 0.08 0.00 0.16 48.19 51.57
01:30:01 AM all 0.09 0.00 0.18 48.17 51.55
01:40:01 AM all 0.09 0.00 0.18 48.18 51.55
01:50:01 AM all 0.09 0.00 0.17 48.17 51.57
02:00:01 AM all 0.09 0.00 0.18 48.16 51.58
02:10:01 AM all 0.08 0.00 0.16 48.17 51.58
02:20:01 AM all 0.08 0.00 0.17 48.16 51.59
02:30:01 AM all 0.08 0.00 0.17 48.17 51.57
02:40:01 AM all 0.08 0.00 0.17 48.19 51.56
=============================================
Есть подозрение что жёсткий диск тупо не успевает писать логи...
Попробовал его грузонуть (задачкой объеденения нескольких тысяч файлов в один на perl`e), так вот логи апче перестали писаться пока работал скрипт.
В пользу этой версии и то что логи теряются давольно равномерно (по времени). поэтому долгое время даже не знал об этом.
А минусы то что логи теряются ровно построчно, нет разрывов посередине строки например.
И если не ошибаюсь то скорость I/O современных серверных дисков не менее 100 Мбайт/c.
С таким успехом он мне весь диск бы похерил за день...
Мозг болит уже... подскажите чё-нить....
заранее спасибо !
З.Ы. ось Linux CentOS