大家好:在数据仓库挖掘处理中遇到这样的需求,一时没有好的办法,请大家提供些好的建议.
有大概30-50个业务,每个业务都有大量用户活跃(数据量在6千万级)
每月从数据仓库中抽取各业务的活跃用户(去重复),汇总到一张大表中(数据量3亿左右)
大表中必须标识一个用户所使用哪些业务和使用次数.
现在已有的方案:
假如,现有业务A0,A1,A2....An
大表设计时动态的增添标识业务的字段和标识使用量的字段.
随着业务的不断增添需要动态增添大表字段,对引用该表的存储过程重编译.如此扩展大表对程序来说健壮,扩展性不强.
后台ETL处理不够灵活.
不知道是否描述清楚了,大家给些好的建议和构思好吗?谢谢 |