基于深度学习的专利推荐算法研究与应用

来源 :安徽大学 | 被引量 : 0次 | 上传用户:xushieng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据2018年世界五大知识产权局统计报告,截止2017年底,全球共有1360万有效专利,中国有200多万有效专利。如何从这些专利数据中高效地挖掘用户可能感兴趣的专利,从而辅助科研人员研究和撰写专利,成为了专利研究领域面临的巨大挑战。推荐算法是数据挖掘的主要分支,广泛应用在不同领域。目前专利领域中,传统的推荐算法挖掘数据存在特征画像表示单一片面的问题,以及稀疏交互矩阵中用户之间的相似度矩阵计算精准度不高的问题。深度学习模型在自然语言处理领域被广泛使用,它能够更加准确地表示专利文档特征,因此本文利用深度学习模型来改进专利推荐算法,并将其应用于专利撰写辅助软件中,从而提升专利撰写的质量以及专利价值。本文主要围绕用户兴趣爱好方面的专利推荐算法、协同关系方面的专利推荐算法、基于推荐算法的专利撰写辅助系统三个方面进行研究。本文的主要工作如下:(1)在用户兴趣爱好方面,针对传统内容推荐算法利用词频向量表示特征画像过于单一片面的问题,提出了基于用户画像的专利推荐算法。该算法训练专利语料得到Word2vec深度学习模型,然后通过深度学习模型更准确、更全面地表示特征画像,最后通过实验对比验证了在专利领域该算法相比于传统内容推荐算法具有优越性。(2)在用户协同关系方面,针对稀疏交互矩阵中用户之间的相似度矩阵计算精准度不高的问题,提出了基于深度语义相似性的专利推荐算法。该算法训练专利语料得到Doc2vec深度学习模型,然后通过深度学习模型构建专利之间语义相似度矩阵,再结合用户与专利之间交互矩阵的补全策略,来补全交互矩阵,从而更加准确地计算出目标用户的最相邻用户集合,最后通过实验对比验证了在专利领域该算法相比于传统基于用户协同过滤推荐算法具有优越性。(3)针对专利科研人员不能充分利用海量专利数据高效地研究和撰写专利的问题,设计并实现了基于上述推荐算法的专利撰写辅助系统,包括推荐引擎模块、专利撰写辅助模块、用户兴趣收集模块以及系统模块。本文实现了并行式混合推荐引擎,结合用户兴趣爱好和用户协同关系,全面地、精确地推荐专利,实现智能检索,将其应用于专利撰写辅助软件中,辅助专利科研人员更高效地研究和撰写专利,从而提升专利撰写的质量以及专利价值。
其他文献
3月13日下午,2016年甘肃省中职学校学生技能大赛在兰州石化职业技术学院拉开帷幕。本次大赛由甘肃省教育厅、省人社厅、省财政厅、省卫计委共同主办。在为期5天的比赛中,共有来
山东省枣庄市市中区常年花生种植面积4.1万亩,其中百分之九十以上为丘陵旱薄地种植。近年来通过在科技局立项实施《花生新品种试验与开发》《万亩优质花生生产示范开发》等科技
随着国内“供给侧”改革的进一步深入、产业结构升级及“一带一路”倡议的指引,为顺应企业战略发展的需求,许多行业都在进行大规模的战略转变和进一步整合,中国并购市场呈活
在Weinberg-Salam弱电统一的理论框架中,计算了荷电弱规范玻色子W^±与γ光子的电磁弹性散射过程W^±γ→W±γ的不变振幅,散射角分布及散射总截面,并对民得结果进行了简短了讨论。
墨法是书法中非常重要的技法之一。$$人们在观赏书法作品时,视觉的第一感觉应该是纸上黑色的墨。书法作品的颜色通常只有三种:黑、白、红。其中,白所占的面积最大,无字处是大的
报纸
在研究了AdvancedEncryptionStandard(AES)算法的特性和一些攻击AES方法的基础上,提出了分析AES的一种新的思想及基于此思想的攻击方法.该思想利用了AES的对称性,本文证明了
随着经济的高速增长,我国已经进入经济新常态的发展状态,目前大部分制造类企业国内的销量明显下滑,而且产能过剩也已经出现在制造业行业。当前,我国诸多类型的制造业企业,因
研究了用间氯偶氮安替比林分光光度法测定烟草中钙的方法。在碱性介质中,钙与间氯偶氮安替比林形成1:1的蓝色配合物,其最大吸收波长为630nm,表观摩尔吸光系数为2.6×10^4L&#18
介绍了成本比较法和期望净收益法在信息建设项目成本收益分析中的具体应用,提出了解决具体项目的方法和步骤。
近几年来,由于受高校扩招的冲击和社会对就业人员学历要求越来越高的影响,中等专业学校生源质量逐年下滑,每况愈下。生源质量的急速下滑,给教学管理带来很大的困难,让教惯了