专利关系类型挖掘方法及其系统实现

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:xiamen88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济全球化进程的加快和科技的飞速发展,知识产权得到越来越多的关注,各国在知识产权中的竞争也愈演愈烈。专利作为知识产权的一种体现形式,已成为国内外企业创新和发展的重要指标。由于专利文本数量庞大,且包含大量专业词汇,对专利的理解、分析和查找造成了较大的困难。因此,如何有效的处理和挖掘专利的关系类型以帮助分析、查找专利内容成为当前主要的研究热点。专利的目的是对产品结构、产品功能、产品应用、产品生产中的技术要素、技术功效(功能和效果)进行改进和优化,其中蕴含着复杂的关系类型,然而目前多数传统的关系类型挖掘方法专注于将专利的关系类型简单地归纳为动词的关系类型或者名词的关系类型。因此,为了进一步挖掘出专利文本中包含的关系类型,本文提出两种专利关系类型挖掘的方法,并且设计实现了专利关系类型挖掘系统。本文的具体研究内容如下:(1)为了通过动词聚类来进行专利关系类型的挖掘,我们首先结合人类概念学习和语言学知识,将专利权利要求部分结构化表示为有价表示形式,该有价表示形式将专利文本中的技术要素和功能要素表示为配价单元及其关联关系。之后在此基础上,构建专利图,一个图即代表一篇专利。其中,专利图中的节点由有价表示结构下的动词构成,两个节点之间是否有边则由这两个动词共同支配的名词个数决定。最后我们使用图挖掘主题模型挖掘所有专利图中节点的关系类型。(2)为了通过动词和名词的联合关系来进行专利关系类型的挖掘,本文在将权利要求部分表示为有价表示形式的基础上构建动词关联关系网络和名词关联关系网络。其中,名词关联关系网络是由两个名词间的共现概率获得,而动词关联关系网络则是由两个动词的上下文语境的相似性获得。之后使用双侧隐马尔可夫随机场进一步挖掘出动词与名词间的联合关系类型,从而能够较为全面地挖掘出专利文本中的关系类型。(3)本文设计并实现了专利关系类型挖掘系统,该系统包括五个模块,分别是数据预处理模块、文本有价表示模块、关联关系网络构建模块、专利图构建模块和关系类型挖掘算法计算模块。本论文在专利文本有价表示的基础上,通过两个方面来发现专利文本中的关系类型。实验研究表明,以上研究方法具有较好的实验效果。专利关系类型挖掘可以细化专利的产品技术和功能类型,丰富专利的语义表达,加深对专利文本的理解,简化专利的分析和比较,便于对专利的研究。
其他文献
在计算机视觉任务中,基于图像的人体行为识别研究是一项非常具有挑战性的工作。由于其缺少时域信息以及极易受到人体姿态、场景和光照等因素的干扰,因此如何有效地提取图像中的空间线索信息来表征人体行为是目前基于图像人体行为识别研究所重点关注的问题。近些年来,随着深度学习的快速发展,以卷积神经网络为代表的深度学习模型在计算机视觉领域中取得了巨大的成功,进一步促进了图像行为识别研究的发展。本文基于深度学习方法对
频繁项集挖掘已经成为数据挖掘领域的一个热门研究,被广泛应用于商业决策、经济学、医疗学和生物信息学等领域。人们在做决策时可以通过挖掘频繁项集来获取许多有价值的信息,但在频繁项集挖掘和发布的过程中难免会带来隐私泄漏的风险。因此,如何在不泄漏隐私的前提下高效地进行频繁项集挖掘是目前的一个研究热点。与此同时,考虑到目前无论线上还是线下的实时数据也正在呈指数级别的增长的情况,本文还研究了如何在动态场景下隐私
大数据与移动通信领域的发展促进了智慧交通的进步,越来越多的学者加入了对轨迹数据挖掘的研究工作中。移动硬件设施的升级为轨迹数据挖掘工作提供了大量的时空轨迹数据,但对于这些数据的质量分析往往被忽略,匆忙投入到具体实验研究中,带来的结果往往是不可靠的。数据需要经过科学的分析与评估,针对性的数据清洗,将数据完好的假象进行剥离,才会使后续的研究更有意义。本文分析了轨迹数据质量存在的问题,主要分为三类,即重复
软件老化是指随着软件系统的长时间运行,系统出现性能下降、系统宕机、甚至软件完全失效等现象。移动端设备在执行视频直播、边缘计算、移动端游戏等高负载、高功耗应用时,极易发生软件老化,从而严重影响用户的使用体验。准确检测识别安卓系统软件老化的发生,进而执行抗衰操作提升用户的使用流畅度,对于安卓软件高质量运行重要的意义。然而,随着安卓操作系统的不断发展以及应用程序种类的愈加复杂,软件老化现象在安卓系统下的
随着互联网技术的发展和人们生活水准的提高,人机对话系统特别是基于知识图谱的对话系统已经成为自然语言处理领域中越来越热门的应用之一。随着图数据库的迅猛发展,图数据库类别不断增加,Neo4j是众多的图数据库中最流行的一种,如何通过自然语言直接与数据库进行交互已经成为了自然语言处理任务中研究热点之一。本文中主要研究的任务是自然语言到Cypher结构化查询语言的转化,是一个语义解析任务。语义解析是一种将自
近些年,食品在其生产以及流通的过程中出现了许多严重的安全问题,人们对食品的安全性需求越发明显。当其出现安全问题时,需要对生产流通过程进行追踪,由于现有的溯源信息都存储于中心数据库中,数据不透明、易篡改。区块链技术的特点能够消除对集中第三方信任的依赖,但是区块链中的交易对于参与节点具有透明性,导致数据的安全性、共享性差。尽管区块链在溯源场景中有了很多的可行性研究,但是并没有有效地解决整个溯源过程中部
“无监督”身份认证的时代已经到来,快速准确便捷的实现身份认证,不仅能够方便人们的生活,还能保障个人权益。以往常见的身份认证方法普遍存在被“冒名顶替”的风险。因此,生物特征识别技术应运而生。其中声音作为人类携带的自然属性,采用“非接触式”的认证方式,使身份认证更加便捷,且对硬件要求简单,在刑侦、金融、军事、智能设备等领域,可以被广泛应用。SOPC(片上可编程系统)是一种以FPGA(现场可编程门阵列)
区块链具有的不可篡改、可追溯与去中心化核心特征,让区块链具有广阔的应用场景,积分联盟就是区块链的应用场景之一。在传统的积分联盟体系中,积分数据易被篡改、积分流通不透明以及产生纠纷难以追责等问题制约着行业发展。区块链中的数据存储技术具有的可追溯、去中心化与不可篡改等特点符合积分联盟的诉求。因此,在积分联盟中应用区块链技术是解决问题的新思路。共识机制是区块链的核心组成部分,对区块链的安全与性能方面有着
随着内蒙古自治区奶牛养殖趋于规模化,推广应用基于物联网的挤奶设施智能化设备,实现牛奶计量自动化和智能化意义深远。目前国内在牛奶计量方面的研究相对滞后,传统的人工计量和红外计量方法由于自身局限性,不能安全、准确的计量奶量,给牧场带来了较大的损失。鉴于计算机视觉技术在数据采集和处理中非接触和高精度的优点,本文在基于图像处理的液体流量检测方法和现有挤奶设备的计量方法基础上,研究设计了一种基于机器视觉技术
航空工业生产具有高复杂性、高精确度的特点。传统的生产方式依靠纸质记录、人工记忆和工作经验,需要投入大量人力成本,且容易出现失误甚至事故。本文设计开发基于增强现实的车间生产辅助平台。基于三维建模技术,构建了数字化工艺卡片库;建立管理平台,实现生产数据存储与管理;基于增强现实的实时识别、虚实融合等技术,实现车间生产指导和反馈。本平台有利于提高生产质量,减少操作误差,规范记录标准,节约人力成本。本文主要