根据语言学内容,什么是生语料库,熟语料库?

[复制链接]
查看11 | 回复3 | 2017-9-14 11:41:43 | 显示全部楼层 |阅读模式
关于语料库的三点基本认识:语料库中存放的是在语言的实际使用中真实出现过的语言材料;语料库是以电子计算机为载体承载语言知识的基础资源;真实语料需要经过加工(分析和处理),才能成为有用的资源; 生语料库是指收集之后未加工的预料库相对而言,熟语料库就是经过加工的...
回复

使用道具 举报

千问 | 2017-9-14 11:41:43 | 显示全部楼层
根据语料加工程度的不同,可分为:熟语料(指在自然语言单位上添加人工的标签标注,如经过分词、词性标注、命名实体识别、依存句法标注形成的语料)。生语料(指直接收集而未经加工形成的语言资源集,如常见的微博语料,新闻语料等。BCC是熟语料库,语料经过分词、词性标注,少量语料库还做了句法分析。CCL是生语料库(除了分类、题目、作者等元信息外),正文...
回复

使用道具 举报

千问 | 2017-9-14 11:41:43 | 显示全部楼层
生语料库是指收集之后未加工的预料库相对而言,熟语料库就是经过加工的...
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

主题

0

回帖

4882万

积分

论坛元老

Rank: 8Rank: 8

积分
48824836
热门排行