基于马尔科夫逻辑网的中文专利最大名词短语识别

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:linjr82
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
缺少标注语料和难以识别动词和名词类是阻碍中文专利最大名词短语识别的主要问题。针对上述问题,该文提出了一种基于马尔科夫逻辑网的中文最大名词短语识别方法。该方法避免对开放类的名词短语的识别,而将主要精力放在了相对封闭的分隔符的识别上,利用句子自身特征、领域迁移特征以及双语对齐特征来识别最大名词短语的边界。结果说明,双语信息较好地促进了动词、介词、连词等MNP边界的识别。MNP识别的F值可达83.27%。
其他文献
近两年国际棉价低下,世界大产棉国美国和墨西哥等都削减了棉花种植面积.去年,中国因气候不正常,棉花减产,在去年底和今年初向国际棉市购买了一定数量的棉花,从而使国际棉市出
本文利用系统设计的思想对企业管理系统进行设计,设计遵循PDCA的原则。通过累统设计在管理中的应用可以提高管理系统的效率和效果。
现阶段,中国司法职权配置存在两大方面问题:司法职权的地方化,行政化以及司法职权独立性缺失;侦查权、检察权二类职权配置上均存在相应缺陷。从宏观层面而言,应该改革现有的司法职
江苏是纺织工业的老基地之一,省内已拥有棉纺锭378万枚,布机12万台,毛纺锭47万枚,黄红麻纺锭2万多枚,棉印染能力15亿米,针棉织品用棉纱12万吨,长丝1万吨,各种化纤能力12万吨
期刊
电缆是电磁兼容设计中的关键环节,大部分电磁干扰敏感问题、电磁干扰发射问题、信号串绕问题都是电缆产生的。本文着重介绍了电缆屏蔽与滤波技术以及抑制电缆干扰与干扰吸收的
据悉,哥伦比亚政府计划在1989~1991年三年内,投资900万美元,发展种桑养蚕和建造一座年产生丝150吨的缫丝厂.其中用于发展种桑养蚕为420万美元,建缫丝厂为480万美元.据宣布,计
历史文献是研究历史时期气候变迁极为重要的途径之一。前人研究表明,淮河流域西周以前气候暖湿,西周至两汉降温,魏晋至五代寒冷,北宋至元中叶温暖,元后期至清末寒冷。在确定
据台湾《经济日报》报导,由于南朝鲜和台湾省在国际市场上是强劲的竞争对手,为此,台湾省纺织业界对南朝鲜及台湾省各产业实力强弱进行了分析比较.台湾省和南朝鲜目前均面临“
该文提出了一种多模型融合的介词短语识别方法,不仅能识别并列型介词短语,而且提高了嵌套型介词短语的识别精度。首先,利用简单名词短语识别模型识别出语料中的短语信息并进
由于短文本极稀疏性和特征分散的特点,短文本的情感分类效果总是不及篇章文本的情感分类,针对此问题,该文提出面向短文本情感分类的特征拓扑聚合模型。模型首先从特征点互信