中文专利中有标记并列结构的自动识别研究

来源 :计算机工程 | 被引量 : 0次 | 上传用户:jinlu2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文专利中名词性有标记并列结构分布广泛、结构复杂,现有的识别技术仅能运用有限的特征识别某些简单类型的并列结构,总体识别效果不佳。为此,提出一种基于边界感知原则的识别方法。在概念层次网络(HNC)理论的基础上,从数量、层级、语义类型、语义特征、干扰特征、结构特征、外部环境和位置特征8个维度对并列结构进行标注,考察并总结语义特征、结构特征和外部词特征,制定217条形式化规则,并将其融合到已有的HNC翻译系统中。测试结果表明,与Google在线翻译系统相比,该方法对有标记并列结构的识别正确率较高。
其他文献
黄廷义,手鞑意渐53年出生于河南襄城县。现为河南省美术家协会会员,河南省国画家协会会员。自由酷爱绘画艺术。70年代拜花鸟画家贾兰亭先生为师。1985年到上海东方艺校花乌班进
近日,商丘市梁园区李庄乡区、乡两级人大代表一行10人,在李庄乡人大主任杨联华的带领下,到梁园区人民法院李庄人民法庭视察。
特高压工程具有建设规模大、电压等级高、设计复杂等特点。对特高压工程造价进行定量分析有助于增强各施工单位和管理部门成本控制和施工管理水平,提高经济效益。首先,对特高
工程中常采用计算机仿真对大电网的运行特性进行分析计算。其中机电暂态仿真主要对大电网整体的稳定性进行分析,电磁暂态仿真主要针对局域电网的动态特性进行研究,如电力系统
以克螟稻Ts5为亲本与另5个感虫亲本作正反杂交,结果表明10个杂交组合的F1代中,以Ts5为父本所配组合杂种优势强于以Ts5为母本所配的组合.F2代的抗虫株与非抗虫株群体在农艺性
本文阐述了绒毛的发育过程及 CVS 时绒毛的三种细胞来源。综合绒毛与胎儿染色体构成不一致的典型病例,进行分类。统计了2,632例 CVS 中所发生的不一致在各类中所占的比重。从
中国农业发展银行(以下简称“农发行”)作为唯一的国有农业政策性银行,是政府的银行,必须顺应国家现代化建设发展的大势,跟上现代化进程的步伐,着力打造现代化政策性银行,这不
吉林石化公司苯酚丙酮装置中设计有一套α-甲基苯乙烯回收单元,由于2001改造时对原有精馏塔进行利旧使用,且工艺流程设计不合理导致生产的α-甲基苯乙烯产品存在纯度低、颜色
大规模分布式计算时代的到来,给企业和社会带来了新的机会和挑战。为了提高效率,我们往往借助于中间件技术,因此中间件的透明性和可观察性是选用中间件的前提。在本文中,我们
二十多年来,水稻穗伸长特性及不包颈不育系的研究,备受国内外遗传育种者的关注。回顾了对水稻穗伸长特性研究的发展历程,分析了其遗传背景及作用机理,对今后不包颈不育系的研