基于语言模型验证的词义消歧语料获取

来源 :中文信息学报 | 被引量 : 0次 | 上传用户：wac725725

【摘要】

：

作为一种稀缺资源，人工标注语料的匮乏限制了有指导词义消歧系统的大规模应用。有人提出了利用目标词的单义同义词在生语料中自动获取词义消歧语料的方法，然而，在某些上下文当中

【作者】

：

郭宇航车万翔刘挺

【机构】

：

哈尔滨工业大学计算机科学与技术学院信息检索研究室

【出处】

：

中文信息学报

【发表日期】

：

2008年6期

【关键词】

：

计算机应用中文信息处理词义消歧语言模型噪声过滤 computer application Chinese information processing

【基金项目】

：

基金项目：国家自然科学基金资助项目（60575042,60675034）,国家863计划资助项目（2006AA01Z145）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

作为一种稀缺资源，人工标注语料的匮乏限制了有指导词义消歧系统的大规模应用。有人提出了利用目标词的单义同义词在生语料中自动获取词义消歧语料的方法，然而，在某些上下文当中，用目标词替换这些单义的同义词并不合适，从而带来噪声。为此．笔者使用语言模型过滤这些噪声，达到净化训练数据，提高系统性能的目的。笔者在Senseval-3国际评测中文采样词词义消歧数据集上进行了实验，结果表明经过语言模型过滤的词义消歧系统性能明显高于耒经过滤的系统：

其他文献

“海洋与陆地”专题复习

一、考纲须知　　世界洋流的分布规律及洋流对地理环境的影响。水循环的过程和主要环节及其地理意义。地壳物质循环。地表形态变化的内、外力因素。　　二、知识网络建构　　地球表面可分为陆地和海洋两大地理单元，并且由此分化出两种不同的自然环境。本专题内容紧扣人地关系这一主线，注重联系生产、生活实际，突出地理环境与人类生存和发展的主题。陆地是与人类关系最密切的人类家园，是人类的“第一环境”。浩瀚的海洋，被誉为生

期刊

专题复习陆地海洋地理环境分布规律物质循环形态变化水循环

药理学线上线下混合式教学模式的探索与实践

药理学是医药院校重要的基础学科,在指导临床合理用药和新药研发中发挥重要作用。随着近年来线上教学的广泛应用与开展,优势和缺点逐渐显露。分析线上与线下教学的特点,设计

期刊

药理学线上线下混合式教学模式

基于语言模型验证的词义消歧语料获取

与本文相关的学术论文