表分区的最佳选择

[复制链接]
查看11 | 回复3 | 2012-10-9 18:09:19 | 显示全部楼层 |阅读模式
业务系统中有一张类似于当日交易流水的表。这张表的每日数据量总的来说是比较大。 但是数据变化是:在特定的时间突然大批量插入 ,然后经过业务处理后又几乎全部被删除。 不过在白天的联机交易中还是有一些交易会从该表查询数据。以前这张表是按照日期是星期几分区 , 简单说就是: 分为七个分区,从星期1 到星期7然后,每个分区又按HASH 做分区。
针对这种分区, 个人觉得:没有什么实际效果,因为每太的业务数据基本全部在同一个分区存放。对系统起不到分区应有的数据均衡的效果。 本人曾将考虑过使用一些特定字段(这些字段取值范围相对固定,来进行LIST分区 ) 只是还有疑虑要不要使用嵌套的。

那么针对这种表: 我们应该选择什么样的分区 比较合理。另外本人还有一个比较疑惑的问题,分区的数量 和表中数据量的多少到底有没有一个比较合理的比列关系?就是说 比如 HASH 分区的数量的确定,有多少数据量的时候选择4 就可以了 ,那有多少数据量的时候选择8 或者16 比较合理呢?

回复

使用道具 举报

千问 | 2012-10-9 18:09:19 | 显示全部楼层

回复

使用道具 举报

千问 | 2012-10-9 18:09:19 | 显示全部楼层
建议按照时间建range分区,一天一个,或者一月一个,这个看数据量的大小,建复合分区不见得有好的效果。
回复

使用道具 举报

千问 | 2012-10-9 18:09:19 | 显示全部楼层
相当于就是一个中间表而已吗?
如果真是这样的话,你应该想办法把你的需求说清楚些,
也许可以借助GTT?当然,真的是要看你的业务需求的。数据生命周期是多长时间? 数据量,什么类型的计算 ? 等等。
你说业务处理完就删除,后面又说还要查询。这里不清楚你的表达。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

主题

0

回帖

4882万

积分

论坛元老

Rank: 8Rank: 8

积分
48824836
热门排行