中文分词

[复制链接]
查看11 | 回复1 | 2009-4-11 12:12:30 | 显示全部楼层 |阅读模式
急求关于国内关于“自适应中文分词和词性标注”的文章,有哪位知道,望告知一下谢了!分全送了!
一般的文章我都看过,我是想找几篇关于这方面的。国内对这方面研究的不是太多,

回复

使用道具 举报

千问 | 2009-4-11 12:12:30 | 显示全部楼层
你到万方 或者维普上找找应该有比较权威的。找了一圈只找到这些中文分词技术属于自然语言处理技术范畴,对于一句话,人可以通过自己的知识来明白哪些是词,哪些不是词,但如何让计算机也能理解?其处理过程就是分词算法。 现有的分词算法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。 1、基于字符串匹配的分词方法 这种方法又叫做机械分词方法,它是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。按照扫描方向的不同,串匹配分词方法可以分为正向匹配和逆向匹配;按照不同长度优先匹配的情况,可以分为最大(最长)匹配和最小(最短)匹配;按...
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

主题

0

回帖

4882万

积分

论坛元老

Rank: 8Rank: 8

积分
48824836
热门排行