标注语料相关论文
知识图谱以结构化的形式描述客观世界中概念、实体及其之间的关系,提供了一种对海量数据的有效的组织和管理方式。在当前的大数据......
中文包含很多多义词,结合不同的语境可以表达截然不同的意思。词义消歧的概念是针对计算机在自然语言处理领域中的应用提出来的。期......
本文主要研究中文词性标注中异构数据问题。中文分词和词性标注是中文自然语言处理的基础任务,句法分析和语义分析建立在这些基础......
随着计算机技术及医学技术的进步,当前医学相关的数据正在呈“爆炸”式增长。大量的医学数据以文本的形式被记载在各种医学文献中......
在自然语言处理领域,高质量的标注语料在信息处理中有重要的应用价值,语料库质量的好坏直接影响到中文信息处理的各项后续工作的展......
所谓共指消解就是将对应同一实体的多个表述划分到一个等价类的过程。共指消解是信息抽取中的一个重要子任务,在自然语言处理和信息......
本文介绍了情感语料库构建方面的一些经验,讨论了在设计和建设情感语料库中的几个基本问题:制定标注规范、选择标注集、设计标注工具......
随着我国与柬埔寨的交流合作日益频繁,柬埔寨语的自然语言处理工作变得更为重要,针对柬埔寨语语料库资源有限、柬埔寨语组织机构名......
随着互联网的兴起,以论坛、博客等自然语言形式保存的知识以指数级的速度增长,对这些知识的挖掘和利用对自然语言处理技术提出了更高......
本研究运用语料库语言学的方法,以大学英语英汉翻译测试的译文语料及其正式人工评分为研究对象,通过语料标注和统计分析,揭示翻译......