论文部分内容阅读
如今,论文推荐系统会根据用户的个性化检索需求向用户推荐学术论文。通常,论文推荐系统首先会分析用户输入的关键词,然后向用户推荐学术论文。事实上,一篇学术论文可能只包含用户部分查询的关键词。因此,论文推荐系统需要向用户推荐一组覆盖所有查询关键词的论文集合。然而,现有的论文推荐系统仅使用关键词匹配技术进行论文推荐,而忽略了不同论文之间研究内容的相关性。因此,现有的论文推荐系统可能会向用户推荐一组来自不同研究领域的论文集合;并且,这组论文集合不能满足用户对某个领域或主题进行深入和持续性研究的潜在需求。幸运的是,文献引证关系图中引用关系对构建论文之间的相关性(相关关系)提供了一种有效的方式。因此,本文基于现有的文献引证关系图提出并设计两种不同的论文推荐方法。这两种论文推荐方法主要的研究内容如下:(1)基于无向文献引证关系图的关键词驱动和流行度感知的论文推荐方法。目前,现有的论文推荐系统主要根据用户输入的关键词进行论文推荐,但是这种论文推荐过程忽略了论文之间研究内容的相关性。鉴于此缺点,本文首先提出了一种基于无向文献引证关系图的关键词驱动和流行度感知的论文推荐方法,即,PRkeyword+pop(Paper Recommendation)方法。PRkeyword+pop方法可以根据用户查询的关键词在无向文献引证关系图上进行论文集合检索;而且,该论文推荐方法在论文推荐过程中不仅考虑了论文之间的相关关系还考虑了论文的流行度。另外,本文在Hep-Th数据集上进行大量的实验来验证PRkeyword+pop方法的有效性和可行性。实验结果证明,与其它几种论文推荐方法相比,PRkeyword+pop方法可以向用户推荐一组令人满意的论文集合。(2)基于加权论文相关图的关键词驱动和权重感知的论文推荐方法。虽然现有的文献引证关系图描述了不同论文之间的引用关系,但是现有的文献引证关系图中引用关系是非常稀疏的。此外,现有的文献引证关系图没有考虑论文中作者自我引用的影响。针对上述问题,本文结合论文发表时间、论文关键词和论文作者等信息提出一种基于加权相似度的链路预测方法,该链路预测方法可以有效地解决现有的文献引证关系图中关系稀疏性问题;从而,本文在现有的文献引证关系图基础上构建了加权论文相关图。在加权论文相关图的基础上,本文又提出了一种新的论文推荐方法,即,LP-PRkeyword+weight(Link Prediction-Paper Recommendation)方法。LP-PRkeyword+weight方法可以根据用户查询的关键词在加权论文相关图上进行论文集合检索;而且,该论文推荐方法在论文推荐过程中不仅考虑了论文之间的相关关系还考虑了论文之间的相关性强度(即,权重)。同样地,本文也在Hep-Th数据集上进行了大量的实验来验证LP-PRkeyword+weight方法的有效性和可行性。实验结果表明,与其它几种论文推荐方法相比,LP-PRkeyword+weight方法在搜索一组令人满意的论文集合方面更具有明显的优势。