设为首页
收藏本站
开启辅助访问
切换到窄版
登录
立即注册
中问网首页
我的收藏
站长博客
搜索
搜索
本版
帖子
用户
第一问答网
»
论坛
›
中问网
›
问答
›
【Kevin小案例】Inode造成的生产库停止服务 ...
返回列表
发新帖
【Kevin小案例】Inode造成的生产库停止服务
[复制链接]
11
|
9
|
2011-8-31 15:27:58
|
显示全部楼层
|
阅读模式
一个三节点Rac,第三个节点,用户连接时,报告:
ORA-02002: error while writing to audit trail
ORA-09925: Unable to create audit trail file
Linux-x86_64 Error: 28: No space left on device
这个错误一看,太明显不过了,audit空间满了。生产库发生这么严重的问题,心立刻纠了起来。
因为所有的服务器都有Grid Control监控,如果mount point容量超过阀值的话,会触发警报邮件,我们收到邮件后,要第一时间清理。
难道我们从上万封邮件中miss了这封邮件?
第一时间登录上去检查,这个库audit的路径是:
/prod/product/corp_bac1/audit/trail
查看了下这个mount point:
node3[oracle]_corp_bac3> df -h|grep /prod/product
34G 27G5.1G84% /prod/product
奇怪,挂载点并没满
node3[oracle]_corp_bac3> df -h|grep /prod/product
34G 27G5.1G84% /prod/product
难怪Grid Control没有触发警报。
那为什么会报Linux-x86_64 Error: 28: No space left on device”? 很典型的数据库的错误,用户不会无中生有。
进入audit目录ls -ltr看一下,整个屏幕立刻开始刷:
06:54 corp_bac3_ora_20624_2e.aud
06:54 corp_bac3_ora_20621_38.aud
06:54 corp_bac3_ora_20618_32.aud
06:54 corp_bac3_ora_20615_38.aud
06:54 corp_bac3_ora_20612_33.aud
06:54 corp_bac3_ora_20688_3c.aud
06:54 corp_bac3_ora_20685_34.aud
06:54 corp_bac3_ora_20682_3e.aud
06:54 corp_bac3_ora_20679_3e.aud
06:54 corp_bac3_ora_20676_3e.aud
06:54 corp_bac3_ora_20673_34.aud
06:54 corp_bac3_ora_20669_37.aud
06:54 corp_bac3_ora_20666_33.aud
06:54 corp_bac3_ora_20663_3c.aud
06:54 corp_bac3_ora_20660_32.aud
.........
.........
整个屏幕刷了几页还只是一分钟内产生的aud文件。
赶紧cancel掉,想统计一下目录下audit文件数量:
[oracle@node3 trail]$ ls -F |grep /|wc
运行了10分钟还没结果,只能cancel掉。
到了这一步已经有了猜测,看来是由于太过大量的audit文件造成了Inode消耗殆尽。
$ df -h -i
Filesystem
Inodes IUsed IFree IUse% Mounted on
/dev/mapper/rootvg-rootvol
15M134K 15M1% /
/dev/cciss/c0d0p165K46 65K1% /boot
tmpfs
16M74 16M1% /dev/shm
/dev/mapper/rootvg-lv_data
5.6M4.4K5.6M1% /data
/dev/mapper/cihcispdb716_grid_vg-gridvol
2.2M473K1.7M 22% /prod/grid
/dev/mapper/cihcispdb716_product_vg-productvol
4.3M4.3M0K100% /prod/product
3.24.148.15:/vol/database_backup
31M 37K 31M1% /prod/backup
3.24.148.13:/vol/cis_orasoft
31M5.5M 25M 19% /cis_orasoft
果然如此。确定了问题,解决起来就简单了,清理audit文件。
每个服务器上都有purge的脚本,定时清理7天或3天前的日志文件,怎奈这个audit文件夹有点变态,每分钟都生成几百个audit file,purge脚本还没来得及清理,就产生了太多的细碎文件。
重新设置purge脚本清理包括当天产生的audit文件,运行了一会后再看:
[oracle@node3 11.2.0]$ df -h -i /prod/product
Filesystem
Inodes IUsed IFree IUse% Mounted on
/dev/mapper/cihcispdb716_product_vg-productvol
4.3M3.8M444K 90% /prod/product
已经释放了一部分Inode,尝试连接第三个节点OK,用户那也反映恢复正常。初步解决。
下面就是分析为什么会产生这么多audit file了。这个数据库已经运行了一年,所以这个问题肯定是这2天新产生的,而另外2个节点都很正常。所以问题肯定是出在这个节点上。到底是什么破程序反复登录造成了这个结果?
查看audit文件中的信息:
[oracle@node3 trail]$ cat corp_bac3_ora_10000_60.aud
Audit file /prod/product/corp_bac1/audit/trail/corp_bac3_ora_10000_60.aud
Oracle Database 11g Enterprise Edition Release 11.2.0.2.0 - 64bit Production
With the Partitioning, Real Application Clusters, Automatic Storage Management, OLAP,
Data Mining and Real Application Testing options
ORACLE_HOME = /prod/product/11.2.0/db
System name:Linux
Node name:node3
Release:2.6.18-164.el5
Version:#1 SMP Thu Sep 3 04:15:13 EDT 2009
Machine:x86_64
Instance name: corp_bac3
Redo thread mounted by this instance: 3
Oracle process number: 71
Unix process pid: 10000, image: [url=mailto
racle@cihcispdb716]oracle@cihcispdb716[/url] (TNS V1-V3)
Mon Mar5 03:47:01 2012 -05:00
LENGTH : '155'
ACTION :[7] 'CONNECT'
DATABASE USER:[1] '/'
PRIVILEGE :[6] 'SYSDBA'
CLIENT USER:[6] 'oracle'
CLIENT TERMINAL:[0] ''
STATUS:[1] '0'
DBID:[10] '2086602188'
通过提供的process pid: 10000去找,这个PID不存在:
[oracle@node3 11.2.0]$ ps -ef|grep 10000
oracle429360510 20:35 pts/17 00:00:00 grep 10000
不过也不算一无所获,起码可以通过SYSDBA确定是本地连接的了。
应该是本地的一些脚本和监视工具造成的。
剩下的检查过程就不写了,最后发现是一个收集统计信息的脚本造成的:
/data/oracle/admin/gather_part_stat.sh corp_bac3 AAPROFILE SM_RAWDATA_MEAS_30000
这个脚本入参分别是用户名和表名。而这个表最近删除掉了,结果脚本中的某一处取值得到了空值,从而造成了无线循环。
注释掉脚本。
解决。
回复
使用道具
举报
千问
|
2011-8-31 15:27:58
|
显示全部楼层
遇到过类似情况,单个文件夹下如果文件数过多,确实会引起极大的性能问题,就是ls都要很长时间。好像每种os都还有类似情况。
回复
使用道具
举报
千问
|
2011-8-31 15:27:58
|
显示全部楼层
ysping 发表于 2012-3-8 10:00
遇到过类似情况,单个文件夹下如果文件数过多,确实会引起极大的性能问题,就是ls都要很长时间。好像每种os ...
恩,这里更严重些,INODE消耗殆尽导致虽然还有很大空余容量,但是已经无法新建文件了,所以造成了停止服务。每种OS每种filesystem应该都有最大文件数的限制。
回复
使用道具
举报
千问
|
2011-8-31 15:27:58
|
显示全部楼层
幸好你产生的文件的句柄已经释放了,不然处理起来更加麻烦点
回复
使用道具
举报
千问
|
2011-8-31 15:27:58
|
显示全部楼层
xifenfei 发表于 2012-3-8 10:08
幸好你产生的文件的句柄已经释放了,不然处理起来更加麻烦点
audit文件的话文件句柄不释放那就是Oracle的bug了,这么多文件, 如果不释放, 不用等这个INODE出现问题,也早就到达:
oracle soft nfile
oracle hard nfile
的限制了. 然后就是其它的问题.更严重
回复
使用道具
举报
千问
|
2011-8-31 15:27:58
|
显示全部楼层
回复
使用道具
举报
千问
|
2011-8-31 15:27:58
|
显示全部楼层
up
得出的感触是,bug无处不在。就是这么一个简单的收集统计信息的小脚本,都能出这么严重的bug。
回复
使用道具
举报
千问
|
2011-8-31 15:27:58
|
显示全部楼层
本帖最后由 jieyancai 于 2012-3-8 16:08 编辑
solaris环境下遇到过inode耗尽,明明空间还有几十G,呵呵
原因是备份了太多地图小图片。
df -F ufs -oi
回复
使用道具
举报
千问
|
2011-8-31 15:27:58
|
显示全部楼层
这些都是OS的基本知识吧
回复
使用道具
举报
千问
|
2011-8-31 15:27:58
|
显示全部楼层
维护中什么问题都有
回复
使用道具
举报
返回列表
发新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
千问
主题
0
回帖
4882万
积分
论坛元老
论坛元老, 积分 48824836, 距离下一级还需 -38824837 积分
论坛元老, 积分 48824836, 距离下一级还需 -38824837 积分
积分
48824836
加好友
发消息
回复楼主
返回列表
问答
热门排行
1
5173上卖QQ三国41级HJ 卖个炫装钱 只卖20了 要的速度到5173上交易 商品编号:DB085-20101107-43186297 速
2
金山卫士的木马隔离在哪里?
3
办公室文员对办公软件,应该熟悉那些?
4
知道了QQ号码,怎样才能获取他的IP资料呢?有没有人知道的,请赐教!
5
怎么样能把字练好 字贴管用吗
6
欧美姐妹花头像
7
关于去外地住宿的问题
8
在桌面上打开word文档时出现Microsoft Office Professional Edition 2003设置是怎么回事
9
090606 STARKING 2pm 是哪一期的? 把视频连接发来!
10
佳能550d 拍摄视频问题(高分)
11
独生子女证补办
12
有什么店名 楼盘名 广告名
13
暴雪有没有搞错,7小时CDkey一个账号只能用一次
14
大家看看到我们有希望在一起吗??
15
跟据下面题目写一篇英语对话留言类的,仁爱初二的 急!!!
16
i,a,nice,would,notebook,my,like,for,brother怎么连成一句完整的句子
17
英语专业考研(文学方向)有经验者请进!
18
九岁的病榻中作者心里竟是一种近乎嫉妒的酸楚,如何理解?
19
黄甫圣华的三围
20
DNF驱魔法驱应该学什么技能.和刷图+点
21
用C# windows应用程序调用SQL存储过程对房屋,及客户进行添加、删除、修改及查询
22
找摩尔庄园级别120级以上的男生
23
网上哪有比较好的中级会计师考试辅导班报名?
24
大家都是怎样相亲的,如何找到相亲对象???
25
实验室制氯气的烧瓶底沾有二氧化锰固体,用什么洗涤
26
古剑奇谭官网的背景音乐,有箫又很宏伟的那段,有张女人图的官网哈。
[email protected]
27
学会计专业需要学历吗?
28
用PPTV看电视,看一段时间后,快进,就会出现死机,一切都没反应,需复位重启。请问是什么原因?是系统问
29
去网友空间时.在主页看到有显示:XX您的QQ号是XXXXXXXX.已经被记录,别想跑堂哦.快去留言.
30
杨登科是少儿英语的领军人物吗?
31
island什么时候上快乐大本营
32
请问()花()乱 ,这个成语应该怎么填
33
以纯以10101#结尾的全型号是什么
34
有一个建行的U盾,但是我会不用。证书已下载。比如我要付电话费,网上交易,怎么进行?什么时候插U盾?
35
我玩PSP实况足球2011,打出所有经典队了。为什么没有罗纳尔多,齐达内,马拉多纳他们啊?隐藏人物里没有。
36
谁有灼眼的夏娜全集 发邮件给我
[email protected]
37
工厂的工人师傅要做一个正方体,使他的体积为900立方米,现有边长为8米、9米、10米的三种正方形材料
38
难忘的一课第六自然段“老师脸色苍白,一字一顿地对我们说”,为什么是一字一顿地说?
39
请教QQ的IP怎么隐藏起来 详细步骤 谢谢哦
40
请问有人会玩职业自行车队经理2010 吗?会的话教下我玩,谢谢
41
Subsea Trees 什么意思
42
曹刿论战和王者何贵相近的思想观点
43
请大家在玩QQ游戏找茬时去手绘图房间一里注意这家族
44
韩小耐这个名字的英文名字是什么
45
在我心里,父母的地位排第一,事业次之,婚姻再次之。请问:我的婚姻会不会很失败?我现在越来越担心了。
46
看房交了2万定金给对方,次日发现价格高得多,就放弃不要了,可对方不退定金,收据写的是定金,我几年的积
47
如何自定义qq面板皮肤(QQ2009)
48
还有没有向G小调进行曲那一类的小说?。。。。呜。。我太迷那东东了
49
精神,情绪问题,急需~~~~~~~~~~~~~!!!!!!!!!!!!!!!!
50
诺基亚C5和5630比较!!
51
如何关闭笔记本的触摸板
52
此命福来果如何 僧道门中衣禄多 离家出家方为妙 终朝拜佛念弥陀 怎么解意思~
53
松原琪姐
54
女的 怎么回事
55
本人有一株。雍正通宝,和别的不一样,它的背面有几个兽型图案,其中一个是好像是鹤,望有知道的给回下,
56
三分春色一分愁让你自然联想到哪些诗句?
57
初一数学题,列方程做
58
渣豆腐怎么做
59
绯闻少女第四季07集里的歌叫什么名字
60
美国最后一次发射的航天飞机是什么时候,叫什么?
61
洛奇赚钱的所有方法
62
QQ空间图片违禁是怎么回事
63
我电脑的桌面右下角有块白色区域,应该怎么办?
64
初二物理 凸透镜
65
这个主机配置要多少
66
大大可以发给u99给我吗,谢谢!邮箱:
[email protected]
67
蓝香橙、红石榴汁各是什么味道
68
DG工会的 请你们退出极乐世界F好不好
69
亚运会的文章
70
谁推荐几首好听的歌。。别复制。
71
甲乙两个铁球,甲为实心,质量7.8千克,体积1立方分米,乙为空心,质量是甲的4倍,体积是甲的4.5倍
72
怎么写竞选学生会团支书演讲稿????急~~!!!!我在班级担任过团支书,
73
伪造靓号后网名怎么只能打4位
74
华为U8220刷机问题
75
泡妞问题
76
请求高人~最近想玩魔兽争霸~
77
我是肯德基 新进职员 明天要去工作 他们说要先让我学下岗位 不是知道会先叫我什么岗位额我戴眼镜的 我是女
78
七雄争霸中天命合璧的玩法,为什么我两个武将坐到一起了,但是却没有给奖励,过一会儿就让人抢走了?
79
地球帝国
80
acer 4741g怎么样
81
韩雅叶最近在干嘛?QQ多少?
82
980TD的输入/输出接口信号表
83
写一首描写兰花样子的诗 二年级的水平
84
关于反射物理题 求答
85
玉坠上面有两个猴子、松、日、云,是哪个年代的、价值?
86
我要唾弃的坟墓 这部电影传的我的QQ邮箱
[email protected]
87
Nvidia GeForce9500gt(128MB) 显卡玩 GTA4 可以吗?内存是2G.显示器是飞利浦(18.6英寸)
88
在淘宝上卖瓷砖的邮费怎么算
89
求几首 歌唱者声音很甜美,唱的歌却透着隐隐的悲伤的歌,就像《可惜不是你》一样的
90
有关家电下乡发送库存
91
民权到杭州的火车车次
92
这是我做的一个骶髁关节CT平扫,请问这能确定我的病情吗?
93
尚志龙这个名字在五行里缺什么
94
为什么股票有个很简单的逻辑大家却赚不到钱?1800点买,6000点抛不就行了吗?
95
性格内向的人适合做怎样的工作
96
这个人真有趣10篇,快
97
画框角钉枪打钉的效果好吗
98
求英语课堂课前小演讲的主题和英语稿
99
现在夫妻处于分居状态 之前结婚后老公向老婆接了30万 老公没有写借据 但银行单上还是有写借款30万的
100
车辆购置税档案袋不小心被孩子拆开了,而且是在中间拆的,怎么办呀