论文部分内容阅读
随着科技的快速发展,科技论文的规模在快速增长,为科研工作者带来了丰富的文献资料。据统计,高校论文数量以每年6%-8%的速度在增长,规模已达千万级,用户搜索感兴趣论文的时间也与日俱增。在此背景下,论文推荐系统应运而生,传统的论文推荐系统基于论文元数据或向量空间模型进行,存在无法解决语义和效率低下的问题,推荐效果不理想。为了解决该问题,本文将主题模型应用于论文推荐系统中,并给出改进的用户兴趣模型算法。本文的主要工作如下:1.对主题模型和论文推荐系统的相关理论和研究现状进行了分析,研究分析了主题模型应用在论文推荐系统中的可行性。2.给出了一种新的用户兴趣模型算法TV-IPF,该算法增加了在用户兴趣论文列表中出现次数少、权值大的主题在用户兴趣模型中的权值,同时不会降低出现在较多兴趣论文中的主题的权值。与传统的均值方法相比,基于改进算法得出的用户兴趣模型和相应的推荐结果更符合用户的真实需求。3.设计并实现了基于主题模型的推荐系统,检验了主题模型解决语义问题的能力,研究了在新的用户模型算法下稀疏度、推荐数量对推荐性能的影响。此外,分析了主题模型和协同过滤算法的优缺点,给出了两者的混合推荐系统,依据稀疏度来决定两者在推荐结果中的比例。该混合推荐系统在评分矩阵稀疏时也能够给出准确推荐,同时能够适当的提高推荐系统的多样性。实验表明,本文给出的论文推荐方法提高了推荐系统的召回率和多样性。