hangcheck value past margin

[复制链接]
查看11 | 回复3 | 2011-5-7 01:45:08 | 显示全部楼层 |阅读模式
环境:两台linux服务器做的RAC节点负载均衡问题:最近发现其中一个节点主机系统日志老报kernel: Hangcheck: hangcheck value past margin! 但另一个节点并没有报这样的日志。
排障:已经排除心跳不通的影响(一直有PING包并没有丢包)
这个日志什么意思?对RAC或系统有没有影响?

回复

使用道具 举报

千问 | 2011-5-7 01:45:08 | 显示全部楼层
本帖最后由 jimmy2003007 于 2016-5-10 10:04 编辑
上网搜了一下,好像是由Hangcheck-timer触发的,只是刚好节点A服务器上的hangcheck-reboot参数没有设置为1。看了节点B的系统资源利用率,也不是很高。
引:
Hangcheck-timer有三个配置参数:
hangcheck_tick:定义了hangcheck-timer检查节点是否hang的频率,单位是秒,缺省是60秒
hangcheck_margin:定义期望的和真正的scheduling之间允许的误差,单位是秒,缺省值是180秒
hangcheck_reboot:定义了如果内核在hangcheck-tick和hangcheck-margin相加的时间内响应失败的话,hangcheck-timer是否重启节点。如果hangcheck_reboot的值大于等于1,hangcheck-timer模块将会重启系统;如果设置为0,则即使系统hang的时候hangcheck-timer也不会重启系统。在linux 2.4的内核中,这个缺省值是1;在2.6的内核中,缺省值是0。
当hangcheck_reboot=1并且满足下面的公式时,hangcheck-timer将reboot系统
system hang time > (hangcheck_tick + hangcheck_margin)
节点A:
vi /etc/modprobe.conf
options hangcheck-timer hangcheck_tick=30 hangcheck_margin=180
su - oracle
crsctl get css misscount
60


回复

使用道具 举报

千问 | 2011-5-7 01:45:08 | 显示全部楼层
为什么就是不说版本。。。。

用hangchecker来监控操作系统内核hang,是10g年的的事儿了

回复

使用道具 举报

千问 | 2011-5-7 01:45:08 | 显示全部楼层
zergduan 发表于 2016-5-10 10:05
为什么就是不说版本。。。。

10.2.0.3.0
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

主题

0

回帖

4882万

积分

论坛元老

Rank: 8Rank: 8

积分
48824836
热门排行