在定期检查防火墙的mem和cpu的使用期间,我发现一些Checkpoint UTM272 R77.10网关正在使用大量内存,有时ssh / snmp访问似乎很慢。使用TOP命令,我可以对mem / cpu的使用情况进行排序,并查看谁在浪费资源。

查找的结果是受监视的服务。受监视的服务器由设备传感器用来监视硬件,并将数据保存到本地存储的DB文件中。在R76之前,它将在DB中保留一年的数据。在R76之后,它仅保留3个月的历史记录以在处理数据期间节省设备资源。在我的情况下,数据库文件超过350M,这导致受监视的服务消耗大量内存来处理数据库文件。尽管我们使用的是R77.10,但似乎是升级到R771.10,而不是全新安装, 不会重置您的数据库文件结构。

SK93587提供了解决方法。这是我为解决此问题而记录的所有步骤。

1.在应用变通办法之前,使用42.5%MEM进行监视。


顶部– 10:56:37最多10天, 1:08,  1 user,  平均负载:0.00、0.06、0.43
任务: 83 total,   3 running,  80 sleeping,   0 stopped,   0 zombie
处理器: 1.2%us,  1.1%sy,  0.0%ni, 97.3%id,  0.2%wa,  0.1%hi,  0.1%si,  0.0%st
记忆:   957272k total,   947392k used,     9880k free,     2772k buffers
交换: 2096472k total,    43292k used,  2053180k free,   209280k cached

%MEM  PID USER      PR  NI  VIRT  RES  SHR S %CPU    TIME+  COMMAND             

 5.0  4226 admin     15   0  263m  47m  11m S  0.4  59:12.98 cpd                 
 0.1  2782 admin     15   0  2172 1084  836 R  0.2   0:00.05 最佳                 
 0.8  3988 admin     15  0 24344 7956 5780小 0.2  22:38.83 snmpd               
 1.4  3947 admin     16   0 33796  13m 7964 S  0.1   2947:10 confd               
42.5  3952 admin     15   0  400m 397m 2332 S  0.1 119:05.53 受监控            
 0.1  3545 admin     18   0  1708  688  584 S  0.1   2:38.13 syslogd             
 0.1     1 admin     15   0  2040  580  548 S  0.0   0:01.47 init                
 0.0     2 admin     RT  -5     0    0    0 S  0.0  0:00.00迁移/ 0        
 0.0     3 admin     15   0     0    0    0 S  0.0  0:00.67 ksoftirqd / 0        
 0.0     4 admin     RT  -5     0    0    0 S  0.0   0:00.00 watchdog/0          
 0.0     5 admin     10  -5     0    0    0 S  0.0   0:01.56 events/0                                                                                             接下来是按%MEM排序的顶部输出:              
顶– 10:58:15最多10天, 1:10,  1 user,  平均负载:0.00、0.04、0.38
任务: 83 total,   3 running,  80 sleeping,   0 stopped,   0 zombie
处理器: 0.3%us,  0.3%sy,  0.0%ni, 99.0%id,  0.3%wa,  0.0%hi,  0.0%si,  0.0%st
记忆:   957272k total,   947972k used,     9300k free,     3036k buffers
交换: 2096472k total,    43292k used,  2053180k free,   209708k cached

%MEM  PID USER      PR  NI  VIRT  RES  SHR S %CPU    TIME+  COMMAND             
42.5  3952 admin     15   0  400m 397m 2332 S  0.3 119:05.63 受监控            
 6.9  6938 admin     19   0  122m  64m 3836 S  0.0  19:09.09 DAService           
 5.0  4226 admin     15   0  263m  47m  11m S  0.0  59:13.25 cpd                 
 2.0  4386 admin     15   0  284m  18m  10m S  0.0   1:23.18 fw_full             
 1.5  3948 admin     15   0 38032  13m 1704 S  0.0  70:42.63 searchd             
 1.4  3947 admin     15   0 33796  13m 7964 S  0.0   2947:10 confd               
 1.4  6779 admin     15   0  163m  13m 7252 S  0.0   0:03.49 rtmd                
 0.8  3988 admin     15  0 24344 7956 5780小 0.0  22:39.07 snmpd                

2.重建受监视的数据库

[[电子邮件 protected]:0]#tellpm进程:受监视
[[电子邮件 protected]:0]# 
来自的讯息 [电子邮件 protected] 在2015年8月26日星期三10:59:39…
CP-DMZ-1被监视[3952]:被监视杀死 
[[电子邮件 protected]:0]#最佳  (按%MEM排序结果)
                 
顶– 11:00:09最多10天, 1:12,  1 user,  平均负载:0.00、0.02、0.33
任务: 82 total,   2 running,  80 sleeping,   0 stopped,   0 zombie
处理器: 2.3%us,  1.7%sy,  0.0%ni, 95.7%id,  0.3%wa,  0.0%hi,  0.0%si,  0.0%st
记忆:   957272k total,   542928k used,   414344k free,     3620k buffers
交换: 2096472k total,    42700k used,  2053772k free,   208824k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM   TIME+  COMMAND             
 6938 admin     19   0  122m  64m 3836 S  0.0  6.9  19:09.09 DAService           
 4226 admin     15   0  263m  47m  11m S  1.0  5.0  59:13.62 cpd                 
 4386 admin     15   0  284m  18m  10m S  0.0  2.0   1:23.18 fw_full             
 3948 admin     15   0 38032  13m 1704 S  0.0  1.5  70:42.63 searchd             
 3947 admin     15   0 33796  13m 7968 S  0.0  1.4   2947:10 confd               
 6779 admin     15   0  163m  13m 7252 S  0.0  1.4   0:03.49 rtmd                
 3930 admin     15  0 25300 7996 6340小 0.0  0.8   0:00.41 pm                  
 3988 admin     15  0 24344 7956 5780小 0.3  0.8  22:39.35 snmpd               
 4339 admin     15   0  149m 7352 5748 S  0.0  0.8   0:00.51 cphamcset           
 4367 admin     15  0 32944 7224 6472小 0.0  0.8   1:09.32 routed              
 4374 admin     16  0 33044 7168 6976小 0.0  0.7   0:13.16 routed              
 3951 admin     18  0 99768 7024 6620小号 0.0  0.7   0:06.79 rconfd              
 3983 admin     17  0 25272 6816 6136小号 0.0  0.7   0:00.34 cloningd            
 2228 admin     15  0 21000 5972 3324小号 0.0  0.6   0:00.52 clish               
 4240 admin     15   0  150m 5732 5592 S  0.0  0.6   0:00.75 mpdaemon                                                                                                                                                              
[[电子邮件 protected]:0]# cd / var / log
[[电子邮件 protected]:0]#ls -l db
-rw-r–r– 1个管理员根 356237312 8月26日10:45分贝
[[电子邮件 protected]:0]#cp / var / log / db /var/log/db_ORIGINAL
[[电子邮件 protected]:0]# sqlite3 / var / log / db 
SQLite版本3.6.20
输入“ .help”以获取说明
输入以“;”结尾的SQL语句
sqlite> 真空;
sqlite> 。出口 
[[电子邮件 protected]:0]#告诉过程:受监控
[[电子邮件 protected]:0]# 

3.应用解决方法后,检查内存使用情况

内存使用率已从步骤1中的42.5%降至仅4.9%

顶部– 11:15:24最多10天, 1:27,  1 user,  平均负载:0.00、0.05、0.18
任务: 83 total,   2 running,  81 sleeping,   0 stopped,   0 zombie
处理器: 0.7%us,  0.3%sy,  0.0%ni, 98.3%id,  0.0%wa,  0.3%hi,  0.3%si,  0.0%st
记忆:   957272k total,   446428k used,   510844k free,     4808k buffers
交换: 2096472k total,    42696k used,  2053776k free,    67228k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM   TIME+  COMMAND             
 6938 admin     17   0  122m  64m 3836 S  0.0  6.9  19:09.09 DAService           
 4226 admin     15   0  263m  47m  11m S  0.0  5.0  59:16.10 cpd                 
 3088 admin     15   0 49684  45m 2320 S  0.0  4.9   0:01.55 受监控            
 4386 admin     15   0  284m  18m  10m S  0.0  2.0   1:23.23 fw_full             
 3948 admin     15   0 38032  13m 1704 S  0.0  1.5  70:42.63 searchd             
 3947 admin     15   0 33796  13m 7968 S  0.0  1.4   2947:10 confd               
 6779 admin     15   0  163m  13m 7252 S  0.0  1.4   0:03.49 rtmd                
 3930 admin     16  0 25300 8012 6340小 0.0  0.8   0:00.41 pm                  
 3988 admin     15  0 24344 7956 5780小 0.0  0.8  22:41.56 snmpd               
 4339 admin     15   0  149m 7352 5748 S  0.0  0.8   0:00.51 cphamcset           
 4367 admin     15  0 32944 7224 6472小 0.0  0.8   1:09.33 routed              
 4374 admin     15  0 33044 7168 6976小 0.0  0.7   0:13.19 routed              
 3951 admin     18  0 99768 7024 6620小号 0.0  0.7   0:06.79 rconfd              
 3983 admin     17  0 25272 6816 6136小号 0.0  0.7   0:00.34 cloningd            
 2228 admin     15  0 21000 5972 3324小号 0.0  0.6   0:00.52 clish               
 4240 admin     15   0  150m 5732 5592 S  0.0  0.6   0:00.75 mpdaemon            
 4787 admin     18  0 20936 5512 5508 S 0.0  0.6   0:00.28 cpviewd             
 4347 nobody    17  0 18748 5108 5104小 0.0  0.5  0:00.21 ci_http_server       
并且数据库大小从大于350M减少到小于40M

[[电子邮件 protected]:0]#ls -l db
-rw-r–r– 1个管理员根目录37168128 Aug 26 11:32 db


参考: 

sk93587 – Gaia OS上的“ 最佳”命令输出显示“受监控”进程会消耗大量内存或CPU










通过 约翰

发表评论