最近读了一些关于数据挖掘中的Apriori的书!有些问题想请教各位大侠!

[复制链接]
查看11 | 回复9 | 2006-3-4 22:54:00 | 显示全部楼层 |阅读模式
可能有点白痴,但是希望大家劳神帮忙解答下:
1.实现DM的一个算法一定要需要海量的数据吗?
2.DM的算法一定要对数据仓库中的数据进行操作吗?数据库中的可以吗?(数据质量很好,也很简单)
3.实现Apriori的算法用到期望可信度,作用度和兴趣度吗?
4.Apriori算法是针对多层次的数据还是单层次的数据?还是都可以?
5,Apriori算法只是能够产生频繁集吧?不能产生关联规则?
问题虽然简单,但是是我多天来积攒的,希望大家重视,也希望大家的回答能能对所有和我一样的初学者有所帮助!谢谢!
回复

使用道具 举报

千问 | 2006-3-4 22:54:00 | 显示全部楼层
1.算法的实现不是一定需要海量的数据,可是数据挖掘算法设计的初衷就是用来解决海量数据的,就如同杀牛的刀同样也可以用来杀鸡。
2.只要是数据就可以
3.这个问题我觉得有点莫名其妙,关联规则需要用可信度支持度来约束。
4.Apriori算法理论上是对单层数据,不过可以对数据的维度进行规约,那么也就可以进行多层次的挖掘。Han Jiawei有这方面的论文,可以看看。
5.频繁集以及观念规则都可以产生!
献丑~~~~
回复

使用道具 举报

千问 | 2006-3-4 22:54:00 | 显示全部楼层
非常感谢!
关于我说的期望可信度,作用度和兴趣度是更能用来约束规则的,但是可信度和支持度是算法里一定要用的,那前3个就不一定用了吧?
恩,产生规则的算法也叫Apriori~是吧?
回复

使用道具 举报

千问 | 2006-3-4 22:54:00 | 显示全部楼层
还有一件是相求:哪里能下到Han Jiawei的视频或者书呢?
谢谢!!!
回复

使用道具 举报

千问 | 2006-3-4 22:54:00 | 显示全部楼层
希望大家能看见!!!
回复

使用道具 举报

千问 | 2006-3-4 22:54:00 | 显示全部楼层
一天当中什么时候人最多呢?
回复

使用道具 举报

千问 | 2006-3-4 22:54:00 | 显示全部楼层
关于你说的三个变量,我想那要看你要用算法干什么
计算出频繁项集,计算出关联规则,都是不一样的。
关于书,我建议还是到书店买Han Jiawei的《数据挖掘 概念与技术》吧
关于论文,这就需要你自己找找了,google下
回复

使用道具 举报

千问 | 2006-3-4 22:54:00 | 显示全部楼层
是啊,关键是要怎么能拿c语言实现出来呢?
我现在被卡在用vc连接数据库上了,没有数据,就不能往下进行,哪位高人指点下啊!
我参照vc的教材进行了建立数据库的工程,然后继续改怎么做呢?书上没有写啊
如果仅仅需要读取数据库的数据,需要在vc里建立工程吗?是不是还有简单的在程序里直接连接到数据库的方法呢?
回复

使用道具 举报

千问 | 2006-3-4 22:54:00 | 显示全部楼层
build up the algorithm for test first, then change to standard DB read codes.
回复

使用道具 举报

千问 | 2006-3-4 22:54:00 | 显示全部楼层
用数组可以吗?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

主题

0

回帖

4882万

积分

论坛元老

Rank: 8Rank: 8

积分
48824836
热门排行