ITM6 监控的数据采集机制问题讨论

[复制链接]
查看11 | 回复7 | 2007-10-21 01:05:40 | 显示全部楼层 |阅读模式
最近一直在考虑一个问题:ITM6监控的数据采集机制问题,在设定好situation去监控一个被监控对象时是怎么样的采集方法?这个采集方法和历史数据收集的机制是否一样呢?希望大家来讨论一下。
我们就那一个具体的例子来讨论一下:比如我设置了一个监控系统中CPU繁忙率的situation,
一方面报警监测:我设定的采集时间间隔是5分钟,设置的阀值是CPU_Busy>95%,若连续四次监测到的CPU资源使用率都大于95%才报Critical告警!
另一方面历史数据收集:我设置对Unxi的system属性组进行历史数据收集,每隔5分钟采集一次历史数据。
问题是:
当我的situation监测在监测到CPU_Busy>95%时,这个CPU_Busy值是这5分钟内的平均值了还是此刻探针轮训到的瞬时值?
每5分钟采集一次CPU资源的使用情况的值写入的短期历史数据的二进制文件中的是这5分钟内的平均值了还是探针运行的瞬时值?

请大家谈谈你的理解和想法!谢谢大家的共同讨论和学习
回复

使用道具 举报

千问 | 2007-10-21 01:05:40 | 显示全部楼层
这个问题在unix os guide中说的很含糊(或许是我的理解有问题)。对于CPU Busy这个属性值的定义大家都知道是System CPU和USer CPU占用的CPU时钟周期之和。
我们来看看user guide中的解释:
CPU Busy [CPUBUSY]: The sum of the System and User CPU attributes in percent. Valid entries are numeric values in the range 0 to 100, including the use of *AVG, *MAX, *MIN, *SUM, Count, and Value functions.
这是CPU Busy的解释
System CPU [UNIXSYSCPU]: The percentage of CPU time devoted to executing UNIX system kernel code. Valid entries are numeric values expressEd as a percentage in the range 1 to 100, including the use of *AVG, *MAX, *MIN, *SUM, Count, and Value functions.
这是SystemCPU的解释
User CPU [UNIXUSRCPU]: The percentage of processor time devoted to user processes. Valid entries are numeric values expressed as a percentage in the range 0 to 100, including the use of *AVG, *MAX, *MIN, *SUM, Count, and Value functions.
这是Uer CPU的解释

仔细看这些属性的解释好像是采集到的是计算后的值,而非瞬时值。那么在situation公式里面怎么就看不到有AVG,MAX,MIN等选项呢?那么默认的是那种概要值呢?
回复

使用道具 举报

千问 | 2007-10-21 01:05:40 | 显示全部楼层
非常有意思的讨论。
个人以为瞬时值是没有意义的,应该是计算之后的结果。
请做ITM的高手来参加一下吧。
回复

使用道具 举报

千问 | 2007-10-21 01:05:40 | 显示全部楼层
不知道有没有人知道ITM6监测的具体算法是什么啊?嘿嘿,我听说在AIX平台上对CPU资源的监控是使用mpstats命令,ITM6获取mpstats命令的输出结果而来的,就是不知道该命令的运行的时间参数和次数参数是多少?难道就使用默认的mpstats的输出结果了?
等待。。。。。。
回复

使用道具 举报

千问 | 2007-10-21 01:05:40 | 显示全部楼层
怎么就没有高手来指点一下了,失望。。。。。
还是我自己来研究吧
回复

使用道具 举报

千问 | 2007-10-21 01:05:40 | 显示全部楼层
帮你顶一下,我也想了解一下。
回复

使用道具 举报

千问 | 2007-10-21 01:05:40 | 显示全部楼层
没人给予解答?
回复

使用道具 举报

千问 | 2007-10-21 01:05:40 | 显示全部楼层
楼主这个问题弄清楚没有呀?
个人觉得,situation公式运算是基于历史数据收集的detail数据,这个历史数据是始终存在的,按默认周期收集,如果配置了历史数据数据仓库保存,则会保存到数据仓库中,否则可能过一定时间就清除掉。
5分钟采集一次的,应该是当时探针运行的瞬时值,如果是平均值,那不5分钟之内实际上收集了很多次来计算。
个人理解,但还没找到根据,期待高手解释呀。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

主题

0

回帖

4882万

积分

论坛元老

Rank: 8Rank: 8

积分
48824836
热门排行