懂Nutch和(或)Lucene的进来!急、、、、、

[复制链接]
查看11 | 回复2 | 2010-12-20 20:44:29 | 显示全部楼层 |阅读模式
我是大学本科的,哎。今天老师出了毕设题,感兴趣都被选走了,只剩下
题目1:基于Nutch的搜索引擎研究
内容:使用Nutch为网站提供一个有用的垂直的搜索引擎
题目2:局域网信息搜索
内容:使用Lucene为局域网内的文档文件(pdf,doc,txt)建立一个简单的索引,并通过网银进行信息检索
我有java基础,自学过SSH2框架,做过一些小项目。但从来没接触过这些专业搜索的。对于2个题目我都不是很了解,我暂时选定题目1,应该这2天还可以改为题目2的。请问大家这两个题目哪个更好做点?要做的话要从何学起?看什么书,什么资料。。。现在都不知道从何下手了。请大家给点意见吧,不胜感激!

回复

使用道具 举报

千问 | 2010-12-20 20:44:29 | 显示全部楼层
Nutch没接触过,这两个都差不多的,Lucene目前比较主流的有DotLucene和Lucene.Net两种吧,lucene是apache的开源项目,你去apache网站可以下到lucene的开发jar包的,然后就可以写Demo了,一般的思路就是写一个词分析器,然后把分析出来的词做成索引,可以放在本地也可以放在数据库,然后就可以根据索引来进行搜索了,当然我这个是大致的思路,细节都需要你自己去研究,祝你早日完成学业。
回复

使用道具 举报

千问 | 2010-12-20 20:44:29 | 显示全部楼层
Nutch不了解,Lucene使用过。使用Lucene给文档文件建立索引很简单,网上很多现成的代码,直接用就可以了。通过网银进行信息检索式什么意思?建好索引以后可以通过关键词进行检索,这个也很简单的,网上的代码也很多,希望能对你有帮助。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

主题

0

回帖

4882万

积分

论坛元老

Rank: 8Rank: 8

积分
48824836
热门排行