基于功效特征聚类的专利推荐方法研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:zyl123456789zyl12345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着专利数量的日益庞杂,从海量专利中获取有效信息已愈发困难,在此背景下,用于挖掘有效信息的推荐算法已逐渐应用到专利领域中。然而,作为推荐算法中的关键技术,文本聚类算法在推荐系统的应用过程中存在一定不足。首先,作为聚类算法的输入表征,功效特征在专利中十分重要,如何精确提取专利中的功效信息是目前面临的挑战。其次,在专利聚类分析方面,基于IPC分类分析的方法是粗粒度的,无法与专利内容紧密结合,不能实现跨领域的专利聚类分析。最后,在专利推荐方面,如何解决推荐中的冷启动问题以及专利的精确推荐仍是一大挑战。本文针对以上问题进行了如下工作:(1)提出了一种知识增强语义表示(ERNIE)和卷积神经网络(CNN)相结合的模型(FEI-Joint),通过该模型提取专利文献的功效特征。在ERNIE层中加入功效词表对训练结果做修正,CNN层中采用动态更新权重的训练方式,最终获得功效特征矩阵。(2)为实现对专利功效特征聚类,提出一种具有早期淘汰策略与类合并思想的自组织神经网络(ERCM-SOM)。针对SOM算法效率与准确率较低的问题,该算法在寻找获胜神经元的过程中提前淘汰掉不可能获胜的神经元,使聚类效率提高。另一方面,在聚类的最终阶段利用距离与密度相结合的类合并算法提高聚类准确率。(3)基于上述的功效特征聚类算法,结合用户注册时填写的用户信息以及用户的浏览记录,引入时间迁移模型,构建了基于功效特征聚类的协同过滤专利推荐模型。该模型为用户提供了具有实时性的专利推荐,并实现基于功效特征聚类的专利推荐方法的应用。本文对FEI-Joint模型、ERCM-SOM算法和改良推荐算法的有效性以及整合后的推荐服务可用性分别进行了实验。实验证明,与TF-IDF、LDA、CNN在特征提取后的聚类效果相比,FEI-Joint模型在F-measure方面明显提高。ERCM-SOM算法与KMeans、SOM算法相比F-measure值提高的同时,时间较SOM算法有明显缩短。对比IPC的专利分类,采用基于功效特征的聚类方法可实现跨领域的专利聚类效果,为设计者借鉴其他领域的设计方式奠定基础。在结合功效特征聚类和加入时间迁移模型的推荐模型中,各项指标均得到一定的提升,证实了其良好的推荐效果。
其他文献
不论是在理论上,还是在司法实践中,违约精神损害赔偿制度一直以来都是倍受争议的话题。《民法典》第九百九十六的创新之举再次引起了理论与实务界对该制度的审慎思考与热烈讨论。确立违约精神损害赔偿制度是为了对人的精神权益给予更周密和更高程度的保护,实属实践之迫切需要。因而,本文以《民法典》第九百九十六的规定为中心展开论述,研究我国的违约精神损害赔偿制度。除引言和结语部分外,本文分为以下五个部分:第一部分介绍
学位
近年来,不同发展阶段的目标检测算法层出不穷,不少学者越来越关注目标检测算法面向工业界的应用,尤其是算法对实际场景是否有足够的鲁棒性。遥感图像是航空器或航天器在高空采集的俯瞰航拍图像集,对地球资源调查与开发、国土整治、环境监测、以及全球性研究有着重要的实用性价值。遥感图像的目标检测对于计算机视觉和数字图像处理方向的很多任务都有很重要的应用价值,因此具有很高的研究意义。随着人工智能技术的迅速发展,基于
学位
通过运行序批式生物反应器与摇瓶实验相结合方法,在进水中投加不同数量Ca2+(0~200mg/L),考察了Ca2+在好氧颗粒污泥形成中的作用.当SBRⅠ、Ⅱ进水Ca2+含量分别为30、100mg/L,运行20d后,两反应器中均出现了好氧颗粒污泥.运行前50d,SBRⅠ中颗粒污泥浓度MLSS与污泥沉降指数SVI指标明显好于SBRⅡ;运行80d后,SBRⅠ、Ⅱ中污泥浓度MLSS均稳定在7.5g/L,SV
期刊
人脸表情迁移是计算机图形学角色动画领域的一项关键技术,可应用在电影制作、人机交互、虚拟现实等诸多领域。随着深度学习的发展,人脸表情迁移的深度生成模型替代了传统计算机图形学方法,提高了泛化能力。同时,基于生成对抗网络(Generative Adversarial Network,GAN)的人脸表情迁移为生成清晰的人脸表情图像提供了生成器与判别器博弈对抗生成的新思路。本文通过对生成对抗网络及其相关理论
学位
现实工程应用中常受数据采集设备、成本等的制约,导致数据集正负样本比例失衡,由此引发后续分类识别准确率低等问题。在众多解决方法中,最简易有效的是通过数据生成方法平衡正负样本比例。目前不平衡学习多集中于处理二分类失衡数据,但实际样本数据常具有多属性多类别的特点,因此,研究多类别不平衡学习问题具有实际应用价值。之前的研究工作中,多类别失衡数据生成过程的设计都是基于样本整体分布,而未考虑多类别失衡数据集中
学位
涉及计算机程序的发明在满足构成技术方案、具备实用性或其他条件下能授予专利权已逐渐成为共识。当下,如何为涉及计算机程序的发明提供更适宜的保护规则以实现制度目的、适应行业发展及满足发明人的权益保护需求成为新的重点问题。本文第一部分主要从涉及计算机程序的发明的概念、可专利性审查标准和权利要求撰写类型演变三方面对涉及计算机程序的发明进行基本介绍。第二部分主要从立法和司法两方面介绍我国涉及计算机程序的发明专
学位
报纸
准确客观地衡量科研学者的学术水平是一项至关重要的任务,目前各种基于图的排名算法如Page Rank算法等,已经被广泛应用在同构网络中,针对单一类型实体进行排名,但不适用于异构网络。虽然科学排名算法发展迅速,但仍有一些问题值得进一步研究。第一个问题,传统的算法都是应用于同构网络中,可是新的研究已经证明,使用混合或异构网络的排名效率更高。第二个问题,以往的研究只考虑了研究者的平均绩效,而忽略了研究者的
学位
无重叠的序列模式挖掘是序列模式挖掘的一种重要挖掘方法,不仅能够灵活地表达用户的需求,而且满足Apriori性质,运用该性质还能够避免很多无效的计算,从而提高挖掘的性能。然而现有的算法并没有考虑用户感兴趣的属性,导致挖掘结果中包含了大量用户并不关注的频繁模式。为了解决这一问题,本文研究了无重叠的三支序列模式(Nonoverlapping three-way sequential pattern,NT
学位
遥感图像技术的发展促进了农业生产、预防自然灾害和军事预警等众多行业的发展。遥感图像目标检测是遥感图像解译的重要任务之一,是指在图像中准确地找到某类目标的位置。其输入为一幅遥感图像,输出为被检测目标的类别信息和坐标信息。遥感图像的尺寸往往是巨大的并且需要极高的检测响应速度。随着大规模的集成运算群的发展,使用先进的计算机技术处理遥感图像成为完成遥感目标检测任务的必要方法,故而针对遥感图像的目标检测算法
学位