如何从一段文字中找出出现频率较高的词组?

[复制链接]
查看11 | 回复2 | 2009-5-4 20:57:00 | 显示全部楼层 |阅读模式
各位高手好,我想要实现一个程序,当我在其中输入一段文字之后,能自动提取出其中的高频词组,次高频词组等,并能对其进行排序,这个算法应该怎么实现?最好附上源码,谢谢了,小弟不胜感激!!!

其中词组的意思就是一个词。如在字符串“我们都是中国人,我们都热爱中国”中,我们,中国等就是一个词组。

回复

使用道具 举报

千问 | 2009-5-4 20:57:00 | 显示全部楼层
这个麼。。。。。。只要认真看,就可以找到,很多的。...
回复

使用道具 举报

千问 | 2009-5-4 20:57:00 | 显示全部楼层
计算机不认识词组,所以先得准备一个词库...
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

主题

0

回帖

4882万

积分

论坛元老

Rank: 8Rank: 8

积分
48824836
热门排行