基于自然语言处理的疑似侵权专利智能检索研究

来源 :江苏大学 | 被引量 : 3次 | 上传用户:asd137889706
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专利文献作为技术信息最有效的载体,囊括了全球90%以上的最新技术成果,对于知识产权的保护起着至关重要的作用。随着目前专利数量的不断增长以及专利侵权诉讼的日益频繁,专利侵权检索已成为情报科学领域的研究热点之一。传统的专利侵权检索主要是通过构建检索式从专利检索系统中检索相关专利,然后人工筛选出具有侵权风险的专利,不仅耗时耗力还容易受主观因素的影响。因此,研究具有自动检索疑似侵权专利的智能检索算法具有重要的现实意义。本文在介绍了专利侵权检索所涉及的侵权判定、文本预处理、相似度计算等基础上,重点研究了专利侵权检索系统的核心,即疑似侵权专利检测算法。论文就当前专利侵权检索研究中存在的特征选择不合理、权利要求书信息利用不充分等问题提出相应的解决方案。本文的主要工作如下:(1)针对中文专利侵权检索过程中关键词特征表达能力弱等问题,提出了一种基于三元组特征覆盖度计算的侵权专利检测方法。该方法将专利权利要求抽取为三元组特征的集合,并结合词向量技术和HowNet计算三元组特征间的语义相似度。通过对专利技术特征集合覆盖度算法的改进,有效提高了对疑似侵权专利的识别能力。实验结果表明,该方法取得较好的检索效果和准确率。(2)针对依存句法分析器稳定性差而影响三元组特征抽取以及方法类专利检索准确率低等问题,提出了一种基于句子相似度计算的侵权专利检测算法。该算法以句子作为最小计算单元,对权利要求书进行树状结构化构建,并结合侵权判定规则设计了一种树匹配算法,对树状权利要求书进行侵权程度的计算。通过与现有的侵权检索算法进行实验对比表明,该算法具有一定的优势。(3)在Java平台下,采用面向对象的思想,设计并实现了具有数据库更新、预处理、初步检索、侵权检测等功能的中文疑似侵权专利智能检索系统。其中侵权检测模块实现了本文所提出的两种检测方法,其余模块也对传统的方法进行了改进。
其他文献
近年来,信息数字系统的软硬件协同设计逐渐成为研究热点。随着设计规模的不断复杂化,技术上的不断演进和成熟,业内研究者们正逐步由RTL级设计向系统级设计转移。然而目前国内在
情感状态在人们日常交互中扮演着十分重要的角色,丰富的情感状态有助于个体表达自己的思想,因此,对于情感分析的研究是十分重要的。视觉和语音是人类表达情感最直接和有效的
近年来,随着信息技术的飞速发展,云计算、物联网以及对等网络等技术也得到充分的了解与研究。这些技术在各种领域的运用,促成了更加便利、快捷的服务供应概念,服务计算因此得
随着信息时代的到来和现代科学技术的突飞猛进,尤其是计算机技术、通信技术以及自动化技术的长足发展,电子政务(E-Government)的应用逐渐为人们所重视。电子政务对提高政府机关
Cache是计算机体系结构中处理处理器和内存读写速度差异的一个有效的功能部件,随着半导体制造工艺的快速发展,传统的以SRAM作为Cache的技术受到了存储单元面积、静态功耗等因
分布式应用就是对地域上分隔的一组群体需要相对独立又相互协同进行某项工作的需求给出完整支持。这样的工作方式对系统的安全提出了更高的要求。随着分布式应用逐渐成为计算
近年来,数字技术和计算机网络的迅猛发展,使数字多媒体(数字图像、数字音频、数字视频及三维计算机图像)的应用取得了惊人的进展,给人们的工作和生活带来了极大的便利,但是也正是
  本文针对人形目标识别的特点,在分析了传统的处理方法的基础上,提出了适于表征人形目标的特征数据,在此基础上,提出使用径向基函数网络完成特征的识别。  详细分析了常用的
无线互联、物联网等技术的发展促使嵌入式设备的广泛应用,智能手机、家电的出现对嵌入式设备的性能有了更高的要求,而Java的可移植性,安全性和兼容性,给J2ME的产生带来了巨大
传统的染色计算机配色在配色过程中引入大量的假设,并且计算过程复杂,配色误差较大。本文从尽量减少获取样品信息的操作复杂度和误差的角度,提出了基于染色的数字化计算机配