专利自动标引系统的设计与开发

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:lidawei232
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今世界已进入知识经济时代,专利规模的不断扩张,专利等知识产权受到人们前所未有的重视。专利不仅是企业技术实力的重要展现,更是企业参与竞争的战略性资源,是企业高价值的资产。目前专利文献的标引工作主要是请专业标引人员进行标引,在标引的过程中存在天然的缺陷,费时费力且主观性强,且在专利标引的过程中,只能对每件专利文献中的信息进行标引,标引的内容极少,专利知识难以掌握并合理利用,并且标引的内容并不能直观、简洁的体现专利的有效信息,给用户带来的帮助非常有限,用户体验度较差,如何设计一个完善的专利自动标引系统,对专利信息进行自动标引,是一项有意义值得研究的课题。本文针对专利信息标引工作进行调研分析,旨在设计开发一款企业级的完善的专利自动标引系统,挖掘专利有价值的信息,实现专利的自动标引,也为后续专利自动标引工作的研究奠定基础。本论文分析了专利自动标引系统的可行性并提出了详细的方案及模块设计,具体工作包括以下几个方面:第一,便于系统的管理和使用,本文主要从系统的人员管理、权限管理、专利检索、专利标引、专利审查、质量分析等几方面进行设计开发,应对企业中不同使用人员的操作需求。第二,将自动标引相关技术与实际需要相结合设计了 5层关键词体系,从不同维度对专利进行标引,从而使标引结果更好的覆盖专利的各个主题,缓解关键词覆盖度不够的问题,标引视角更为广泛,并通过系统WEB界面使标引结果直观、简洁的展现。第三,针对专利语料匮乏的问题,由北京东方灵盾科技有限公司提供的21000篇中医药专利作为专利语料集,主要从语料标注、命名体识别、主题词提取等方面进行研究。首先设定了语料标注规范,结合专利关键词的特点,定义了5类实体,对专利数据进行标注,构建了专利语料库。第四,针对现有专利中的命名体识别任务,采用深度学习对专利命名体识别与提取,分别以多模型为基础,分析模型优劣点,为了更好地获取上下文特征,对传统的LSTM进行改进,采用双向LSTM网络,使用Bi-LSTM+CRF模型对专利进行命名体识别。实验证明在相同特征的条件下,改进模型在性能上表现出优势。
其他文献
学位
随着空气质量下降、环境污染的加剧,肺癌已经成为人类健康的第一杀手,提前做好预防检测可以有效的保护人民的生命安全;肺部CT影像已成为肺部检测的常用工具。虽然医疗设备的进步极大的提高了检测的准确率,但是因为疲劳等原因,往往造成漏诊或误诊。计算机辅助检测和诊断的研究可以有效的减轻医生的工作量,更好的辅助医生的工作。但另一方面,成像数量的增大给医生带来的是更大的工作量。为了解决这一矛盾,20世纪90年代开
非线性发展方程被广泛地应用于描述浅水波、非线性光学、玻色-爱因斯坦凝聚、等离子体等领域中的非线性现象,求解此类方程对解释各种非线性现象有着重要意义。近年来,求解非线性发展方程的精确解已经成为孤子理论研究的热点。随着孤子理论的发展,人们提出了Hirota双线性方法,反散射变换法,黎曼-希尔伯特方法等许多有效的求解手段。在求精确解过程中,常出现大量有规律、重复的计算,借助符号计算,可以提高计算的速度和
随着经济全球化的深入和国家产业布局的安排,企业的发展也在日趋壮大,外部环境的复杂性也随之增加。如何确保企业在竞争环境中占据主导地位,如何将企业资源进行有效地整合,如何将产品和服务更好地提供给用户,如何运用创新理念来提升企业的价值创造力等,这都要求当今企业需要适应不断变化的外部环境,以迎接未知的机遇和挑战。在业务需求不断变化的企业信息化管理流程中,将工作流技术应用到目前业务流程中,有效地实现了相关信
随着资本市场的竞争愈发激烈,越来越多的上市公司控股股东通过股权质押的方式获取融资。若股权质押比例过高,公司股票到达平仓线,控股股东资金周转出现问题不能及时补仓,则会
从大脑中提取出与生理信息或行为相关的脑电信号对于大脑信息的处理机制和脑-机接口(BCI)研究具有重要意义。为了得到更精确的脑电信号,获得有效的大脑信息,神经元细胞外微电极阵列记录的方式得到快速发展,由此记录到的动作电位(锋电位)能够提供更精确的信号,控制更精细的动作,在植入式BCI的研究中越来越引起研究者们的关注。在脑电信号的提取过程中,通常是通过神经元细胞外微电极阵列记录的方式产生的神经信号来获
本研究旨在探讨思维导图辅助课文背诵活动对初中生英语成绩的影响。本研究的理论基础是输入假设、输出假设和图式理论。本研究的意义是为英语学习者提供有效的背诵方法指导,以便掌握课文中的基本知识,并且对他们的英语学习产生积极的影响。本研究的具体研究问题如下:(1)思维导图辅助课文背诵活动对初中学生的英语成绩有何影响?(2)思维导图辅助课文背诵活动对高低水平学生的英语成绩有何影响?本研究的对象是江苏省新簧初中
在我国,票据的签发与转让属于银行的专营业务,法律将票据的融资功能限制在很小的范围内。同时,受商业银行“惜贷”行为的影响,部分企业为了实现融资目的“另辟蹊径”,市场上
选址问题一直是当前社会中常见的热点问题,比如:广告气球的投放,公共设施安置以及实体销售网点选择,这类问题时时刻刻出现在实际生活中。随着,GPS技术在移动设备上的广泛应用,可以获取到不同设备用户大量的位置信息。选址问题的初衷便是更好的服务大众或者吸引大众的注意力。在这些地理位置信息的基础上,再进行选址问题的分析,会使得到的结果更具有参考价值。在本文中,主要研究并提出一个基于移动轨迹的Top-k最大影
日益复杂的战场电磁环境和未知的目标特性给雷达信号处理带来了更多的挑战。传统的雷达信号处理是基于模型的,主要利用模型的先验信息及相关信号处理准则设计信号处理方法,它使用了高斯的、线性的和平稳的假设。深度学习方法是一种基于数据的方法,它可以直接获得输入与输出之间的关系,本文研究如何在雷达信号处理中使用该方法。本文主要研究内容有:高斯和非高斯噪声条件下的确定性信号的神经网络检测器,对于运动目标的神经网络