基于权利人长短期意图的专利推荐研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:ys331223
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在科学技术飞速发展的21世纪,知识产权的保护变得至关重要,专利作为首要的保护方式,其涵盖90%以上最新的技术信息,且有诸多新型技术只以专利文献的形式公开,通过对专利文献进行知识挖掘与统计分析,能够快速了解国内外相关技术的发展现状和发展趋势,进而为国家和企业制定发展战略提供可靠的依据。近年来,专利申请和授权的数量整体上呈上升趋势。由于专利数量的快速增长,面对海量的专利数据,为了快速找到相关领域的专利文献,专利推荐应运而生。专利推荐即推荐与给定专利相关的现有专利,具有重要意义和挑战。目前,由于专利本身的信息主要以文本的形式呈现,专利推荐算法大多是基于专利的文本内容。借助文本挖掘技术可以从海量的专利文本中提取出高质量的信息,以用于专利推荐。除文本信息外,有的专利推荐算法还加入专利的引文和书目信息,进而可生成多种网络结构,利用文本和网络表示学习方法,文本内容和专利网络中的各种节点被表示成低维、实值的向量,通过对向量的计算实现专利推荐。现有的专利推荐算法有效的整合专利的文本内容和书目信息,但忽略了专利申请时间对权利人的交互行为也具有重要影响。实际生活中,权利人的意图会随着时间而变化,权利人的长期意图随时间变化缓慢,而短期意图变化迅速。从权利人所拥有的专利序列中,我们可以挖掘权利人的长期意图和短期意图,权利人的长期意图可以反映权利人的整体偏好,权利人的短期意图代表权利人的近期需求。因此,本文按照申请时间先后挖掘权利人拥有的专利文本和书目信息,捕获权利人的真实意图,实现更有效的专利推荐。本文的主要工作包括以下内容:1.本文首先介绍专利推荐的研究背景和意义,接着充分调研目前基于专利推荐和基于长短期意图推荐常用方法的研究现状,同时分析每类方法的优缺点,然后重点说明基于专利的文本内容和书目信息的专利推荐算法的不足之处,并针对这些不足之处进行分析。2.针对权利人的意图会随着时间而变化的问题,提出一种基于权利人长短期意图的深度专利推荐算法(ALSI)。该算法首先使用Doc2vec模型训练专利文本内容以获得专利的潜在表示;其次,基于申请先后的专利序列,利用自注意力机制挖掘权利人的短期意图;然后,借助多层感知机将权利人映射到一个公共表示空间,对权利人的长期意图进行建模;最后,将两个意图融合以计算预测的匹配分数。在USPTO-A和USPTO-B的两个专利数据集上进行实验,与对比算法相比,我们提出的ALSI算法在召回率(Recall)和平均倒数排名(MRR)两个评价指标上均有着明显的效果提升。3.针对权利人的长期和短期意图对最终的推荐效果影响不同的问题,提出一种基于权利人长短期意图增强的专利推荐算法(LSTS)。该算法首先基于专利文本内容的相似性,来获取相似专利之间的语义连边,然后构建一个具有语义连边和书目信息的专利异构信息网络,以整合专利的文本内容和书目信息,利用网络表示学习的方法获得专利的潜在表示。其次,基于申请先后的专利序列,利用具有自我注意机制的双向LSTM模型挖掘权利人的短期意图,再借助多层感知机对权利人的长期意图建模。最后,为权利人的长短期意图分配不同的权重以计算预测的匹配分数,进而进行专利推荐。在USPTO-A和USPTO-B的两个专利数据集上的进行实验,与对比算法和ALSI算法相比,我们提出的LSTS算法在召回率(Recall)和平均倒数排名(MRR)两个评价指标上均有着明显的效果提升。
其他文献
随着集成电路制造工艺的不断进步,芯片集成度与性能都获得了提升。然而,晶体管特征尺寸的大幅缩小也给集成电路的可靠性提出了巨大挑战。对于纳米级互补金属氧化物半导体(Complementary Metal Oxide Semiconductor,CMOS)集成电路,软错误是造成其故障的重要原因。在先进工艺下,纳米级CMOS锁存器等诸多器件对软错误中的多节点翻转(Multiple-Node Upset,M
学位
遥感场景分类(Remote Sensing Scene Classification,RSSC)是遥感图像领域的一个重要且活跃的分支。随着遥感技术和计算机科学技术的飞速发展,遥感场景分类在理论和实际应用中都取得了可喜可贺的成果。然而,由于遥感图像场景往往是由多种物体通过复杂多样的空间组合和关联形成的,所以RSSC依然面临着严峻的挑战。首先,除了全局信息外,局部特征对遥感图像的识别至关重要。由于CN
学位
近年来随着深度学习的发展,人体三维重建工作在神经网络的支持下,成为了新的研究热门,并涌现出了许多基于深度网络的方法,但这些人体重建工作往往要求在没有遮挡物的情况下对人体进行重建。然而,在现实生活中,由于人与物体的频繁交互运动,人被各种物体遮挡的情况是随处可见且不可避免的。当人体出现被遮挡的情况时,现有的方法往往不能够得到令人满意的重建结果。针对这个问题,本文提出了针对遮挡人体重建鲁棒性较好的基于多
学位
人脸面部表情是人类情感表达的重要方式之一。微表情是一种可以反应人内心真实情感的表情。在人们试图隐藏自己内心的真实情感时,微表情会自发的产生。微表情既无法抑制也无法模仿,可以作为判断人真实情感的重要手段。因此微表情在医疗健康,国家安全等方面具有广泛的应用前景。相比于宏表情,微表情的持续时间短,动作幅度低。这些特点导致通过人工对微表情进行检测和识别十分困难,因此对于自动微表情的分析有着紧迫的需求。微表
学位
近年来,深度卷积神经网络在各种计算机视觉上取得了突破性的进展,其应用范围也越来越广。然而,深度卷积神经网络需要强大计算能力、高存储空间和高内存占用的特性却严重阻碍着它的应用和发展,使得这些高性能的模型难以部署在一些资源受限的设备上,也无法部署在对实时性要求极高的系统中,如智能手机、树莓派、嵌入式AI系统等。通道剪枝是一个能够减小模型尺寸的研究领域,而为了更加有效地降低神经网络模型的资源占用,更小地
学位
自然图像抠图是图像处理和计算机视觉领域中一项充满挑战又十分重要的基础研究,具有广泛的应用价值。现有的自然图像抠图算法在抠图精确度以及复杂场景中的抠图方面存在一定的局限性,同一场景中不同区域的抠图难度存在不均衡的现象。研究发现,针对精细化抠图和复杂场景的抠图,可通过注意力机制提取并增强有效特征,结合多尺度侧边监督对抠图结果进行细化;而针对抠图中的不同区域抠图难度差异性大的特点,可基于注意力机制对抠图
学位
车辆图像精细化识别能够准确判断出图像中车辆的品牌、系列、年份,是支撑智慧交通系统的重要技术之一,能够缓解车辆保有量快速增加给交通管理部门带来的压力,使得城市治理更加高效。现有算法使用完整的车辆图像进行精细化识别,已经达到了较好的效果。但在城市交通复杂场景下车辆会被其他车辆或物体遮挡,以致于精细化识别算法所处理的车辆图像是不完整的,极大限制了算法性能。此外,利用检测算法从交通卡口摄像机拍摄到的全景图
学位
聚类可以在没有监督信息的指导下,将数据划分成不同的簇,使得相似的数据尽可能在同一个簇中,而不相似的数据被划分在不同的簇中。“物以类聚,人以群分”,在模式识别、医学诊断、生物学等领域中存在着大量需要将数据按一定规则划分的场景。因此,聚类成为无监督学习中一个被广泛关注的问题,一些经典的方法如K-均值、谱聚类、子空间聚类也得到了广泛的应用。聚类方法尽管操作简单,适用性强,但是由于缺少监督信息的指导依然存
学位
随着生物医学领域研究和信息技术的发展,与生物医学研究相关的文献、数据等资料呈爆炸性增长。海量的生物医学文献报道了特定生物分子(如基因、miRNA和lncRNA等)在食管癌发生与发展中的作用,例如促进或抑制食管癌发生、作为预后因子以及生物标志物等。上述信息对于食管癌早期诊断以及药物研发具有重要意义。但是这些信息分布零散,并且食管癌文本中包含相当多的特定专有名词和术语,所以在通用语言上提出的实体识别和
学位
随着互联网技术的不断发展,越来越多的用户习惯于在各类社交平台上交流观点、分享日常,这种线上的表达方式带来了庞大的社交文本数据。作为一种流行的社交媒体表达方式,社交文本数据不规则的语言结构和语法表达方式使得针对社交文本的情感分析和观点挖掘变得十分困难,然而除纯文本外,社交文本内容还包含着情感鲜明的表情符号。表情符号作为一种特殊的符号语言包含了使用者的丰富情感,在辅助理解社交文本情感任务中起到了非常关
学位