论文部分内容阅读
在学术研究过程中,查找和阅读文献是研究人员的普遍工作,在海量的论文文献中如何找出有价值的论文成为一个需要改进的问题。为了解决这一问题,学术论文推荐系统逐渐成为推荐系统的一个新兴应用方向。学术论文是一类具有较强知识性的长文本,用户可以通过阅读论文获取某研究领域的知识或研究成果。以往的学术论文推荐系统中常利用LDA和CTM模型进行主题分析,并通过分析用户阅读或发表的文献,挖掘用户的潜在研究需求,为用户推荐相应的论文。虽然可以大大降低论文查找难度,使文献阅读变得更加方便。但是,研究人员阅读文献不仅仅为了巩固原有知识,更多是为了学习新的领域知识,因此,推荐结果如果既让用户可以接受又包含更多的新知识将会带来更好的用户体验。本文以改善用户对新论文中知识的接受程度、提高推荐论文知识的多样性和推荐惊喜度作为主要目标,基于主题模型、学习理论等知识并结合学术论文推荐的特点对学术论文推荐问题进行了研究。首先对论文语料库进行主题分析挖掘学术研究中各主题之间的关联关系,为减小语料库中论文知识分布对知识图谱准确性的影响并且可以更明确地反应学术论文研究领域知识之间关联程度的强弱,本文在知识图谱中加入概率模型形成不确定知识图谱。然后,根据用户阅读文献和研究目标的描述,提出了包含用户背景知识和研究目标知识的两层用户知识模型,并利用用户背景知识和研究目标之间存在的知识差异,提出了学习路径查找算法。最后根据学习路径中知识的重要程度和论文包含知识的相似性对论文进行评分,文中还对无法发现用户背景知识和研究目标知识差异或无法得到最优学习路径的特殊情况进行了分析和处理。实验表明,本文提出的利用语义模型捕捉文档中的语义信息、不确定知识图谱反应知识之间的联系,最后根据用户已有知识和研究目标的特点进行学术论文推荐的方法,在降低时间复杂度、改善研究人员对推荐结果的接受程度和满意度、提高推荐推荐论文的知识多样性以及惊喜度上都起到了很好的效果。