论文部分内容阅读
科技创新是战略性新兴产业发展的核心推动力,而科技创新的基本前提是要充分、合理的利用现有的科技信息资源,就必须做好科研成果的转化。科技报告作为一种特殊的科技文献,主要记录和描述科研项目的过程和结果,对于科技创新具有非常重要的参考价值。科技报告是科研工作者所承担的实验、科研等工作的全过程及取得的成果,是按照相关格式和标准编写而成,能够如实反映所承担科研项目所采用的技术、方法及过程中总结的经验、教训的科技文献。2014年,随着国家科技报告服务系统(NSTRS)正式向社会大众提供科技报告服务,标志着我国科技报告工作步入了新阶段。截至2018年4月2日,国家科技报告服务系统共收录了123635份科技报告,用户可以在系统中进行搜索,以获取符合自身科研兴趣的科技报告。这虽然能够从某种程度上满足用户的需求,但用户如何从大量的科技报告中获取自己想要的报告成为随之而来的难题,为用户推荐满足其实际需求的科技报告成为接下来要解决的问题。 鉴于此,在检索和阅读大量国内外相关文献的基础上,对各种推荐方法进行深入学习和研究后,本文基于主题模型提出了以下三种推荐方法: 第一,基于LDA模型的推荐,利用LDA主题模型完成主题抽取,再通过计算文档主题之间的相似度完成推荐。该方法不仅实现了词频空间上的降维,降低了计算的难度,还可以发现文档间的潜在联系及文档内各主题的概率分布。 第二,基于CTM主题关联模型的推荐,该方法在兼顾LDA模型的同时,通过发现各主题在不同文档中的潜在联系,最后将主题间关联度较大的文档推荐给用户,弥补了LDA主题模型倾向于推荐某一主题范围文档的问题,提高了推荐效果,并通过实证验证了CTM关联模型的优越性。 第三,基于用户主题兴趣的推荐,通过获取用户历史行为记录,提取用户兴趣特征,构建用户-文档-主题间的关系,再计算文档主题与用户兴趣主题之间的相似度,最后按照相似度排序将相似度较大的前m篇文档推荐给用户,从而完成推荐过程。该方法在主题模型的基础上加入了用户兴趣,使得推荐结果更贴合用户实际需求,进而提升推荐效果。