论文部分内容阅读
根据2018年世界五大知识产权局统计报告,截止2017年底,全球共有1360万有效专利,中国有200多万有效专利。如何从这些专利数据中高效地挖掘用户可能感兴趣的专利,从而辅助科研人员研究和撰写专利,成为了专利研究领域面临的巨大挑战。推荐算法是数据挖掘的主要分支,广泛应用在不同领域。目前专利领域中,传统的推荐算法挖掘数据存在特征画像表示单一片面的问题,以及稀疏交互矩阵中用户之间的相似度矩阵计算精准度不高的问题。深度学习模型在自然语言处理领域被广泛使用,它能够更加准确地表示专利文档特征,因此本文利用深度学习模型来改进专利推荐算法,并将其应用于专利撰写辅助软件中,从而提升专利撰写的质量以及专利价值。本文主要围绕用户兴趣爱好方面的专利推荐算法、协同关系方面的专利推荐算法、基于推荐算法的专利撰写辅助系统三个方面进行研究。本文的主要工作如下:(1)在用户兴趣爱好方面,针对传统内容推荐算法利用词频向量表示特征画像过于单一片面的问题,提出了基于用户画像的专利推荐算法。该算法训练专利语料得到Word2vec深度学习模型,然后通过深度学习模型更准确、更全面地表示特征画像,最后通过实验对比验证了在专利领域该算法相比于传统内容推荐算法具有优越性。(2)在用户协同关系方面,针对稀疏交互矩阵中用户之间的相似度矩阵计算精准度不高的问题,提出了基于深度语义相似性的专利推荐算法。该算法训练专利语料得到Doc2vec深度学习模型,然后通过深度学习模型构建专利之间语义相似度矩阵,再结合用户与专利之间交互矩阵的补全策略,来补全交互矩阵,从而更加准确地计算出目标用户的最相邻用户集合,最后通过实验对比验证了在专利领域该算法相比于传统基于用户协同过滤推荐算法具有优越性。(3)针对专利科研人员不能充分利用海量专利数据高效地研究和撰写专利的问题,设计并实现了基于上述推荐算法的专利撰写辅助系统,包括推荐引擎模块、专利撰写辅助模块、用户兴趣收集模块以及系统模块。本文实现了并行式混合推荐引擎,结合用户兴趣爱好和用户协同关系,全面地、精确地推荐专利,实现智能检索,将其应用于专利撰写辅助软件中,辅助专利科研人员更高效地研究和撰写专利,从而提升专利撰写的质量以及专利价值。