基于语言模型验证的词义消歧语料获取

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:wac725725
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种稀缺资源,人工标注语料的匮乏限制了有指导词义消歧系统的大规模应用。有人提出了利用目标词的单义同义词在生语料中自动获取词义消歧语料的方法,然而,在某些上下文当中,用目标词替换这些单义的同义词并不合适,从而带来噪声。为此.笔者使用语言模型过滤这些噪声,达到净化训练数据,提高系统性能的目的。笔者在Senseval-3国际评测中文采样词词义消歧数据集上进行了实验,结果表明经过语言模型过滤的词义消歧系统性能明显高于耒经过滤的系统:
其他文献
一、考纲须知  世界洋流的分布规律及洋流对地理环境的影响。水循环的过程和主要环节及其地理意义。地壳物质循环。地表形态变化的内、外力因素。  二、知识网络建构  地球表面可分为陆地和海洋两大地理单元,并且由此分化出两种不同的自然环境。本专题内容紧扣人地关系这一主线,注重联系生产、生活实际,突出地理环境与人类生存和发展的主题。陆地是与人类关系最密切的人类家园,是人类的“第一环境”。浩瀚的海洋,被誉为生
药理学是医药院校重要的基础学科,在指导临床合理用药和新药研发中发挥重要作用。随着近年来线上教学的广泛应用与开展,优势和缺点逐渐显露。分析线上与线下教学的特点,设计