基于AdaBoost.MH算法的汉语多义词消歧

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:wqvbqjxtid1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出一种基于AdaBoost.MH算法的有指导的汉语多义词消歧方法,该方法利用AdaBoost.MH算法对决策树产生的弱规则进行加强,经过若干次迭代后,最终得到一个准确度更高的分类规则;并给出了一种简单的终止算法中迭代的方法;为获取多义词上下文中的知识源,在采用传统的词性标注和局部搭配序列等知识源的基础上,引入了一种新的知识源,即语义范畴,提高了算法的学习效率和排歧的正确率.通过对6个典型多义词和SENSEVAL3中文语料中20个多义词的词义消歧实验,AdaBoost.MH算法获得了较高的开放测试正确
其他文献
<正>中国国际贸易促进委员会机械行业分会(简称机械贸促会)成立于1988年,是中国国际贸易促进委员会和中国国际商会在机械行业的分支机构。自1988年成立以来,先后在亚洲、欧洲
期刊
广东某海上风电场处于开敞海域,涨落潮为不规则半日潮,流向复杂,风大浪高,海况复杂,地质条件较差;针对钢管桩单桩基础直径φ8.5 m、长113.57 m、重1823 t工况,分析了施工时的
电动葫芦是一种轻小型起重设备(见下图),主要结构有减速器,运行机构,卷筒装置,吊钩装置,联轴器,软缆电流引入器,限位器。
辅助汉语学习研究作为一个重要的研究领域,已经在自然语言处理领域激发起越来越多人的兴趣。文中提出一个基于字分析单元的辅助阅读系统,它可以为汉语学习者提供即时的辅助翻译
第六届上海国际电力设备及技术展览会暨第五届上海国际电机工程及电工装备展览会已于6月7日圆满结束。一连三天的展会共吸引了19,800名中外买家前来参观。
加强水稻种植技术的开发和推广应用,能够显著提高水稻的产量和品质,推动农业经济的现代化发展。本文主要结合实际工作经验,首先探讨了现阶段水稻种植过程中所面临的问题,并论
目前,商务部主办的“品牌万里行”活动正开展得如火如荼,在全国上下掀起了自主品牌热潮。本刊近期也组织了一些机电行业的品牌评选活动,于是想和大家共同探究一下中国品牌的现状
栽培历史:齐齐哈尔引入,吉林省陆地种植多年。分布区域:齐齐哈尔地区种植广泛特征特性:植株为直立类型,皱叶。中熟品种,抗逆性为中强。栽培要点:露地可以无支架栽培,3月中旬
基于trigger对的长距离蒙古语语言模型采用统计方法进行自然语言建模。该文简要介绍了基于trigger对的长距离蒙古语语言模型的三种实现方法,并在汉语-蒙古语机器翻译系统测试
我国机床拥有量高居全球之首,去年我国机床产值1260亿元人民币,超过意大利排名世界第三。中国机床工具协会总干事长吴柏林近日在沪表示,我国虽已跻身机床生产大国行列,但要实现“