论文部分内容阅读
近年来,随着数字化图书馆的不断发展与普及,其资源越来越丰富,信息量越来越大。人们在享受数字图书馆带来的方便与快捷的同时,也深受其因信息的海量存储所带来的困扰。拥有海量信息的数字化图书馆不仅需要响应用户的请求,更应该主动地向用户推送信息资源。而个性化推荐技术就是研究如何向用户主动提供用户感兴趣的信息的一门技术,它是当前研究的热点,也是本文的主要内容。数字图书馆的个性化推荐服务是一种以用户需求为中心,主动分析用户的兴趣爱好,进而智能高效地为用户找到感兴趣的信息的服务。在众多的个性化推荐算法中协同过滤推荐算法是当前应用最广泛的推荐技术之一,其核心思想可理解为“如果与我同兴趣的用户喜欢这本书,那么我也很有可能喜欢它”。然而,数据稀疏问题普遍存在于实际推荐系统中,并且受到众多研究者的关注。在实际系统中,项目数量十分庞大,然而用户给予评分的项目数量大约仅占项目总数的1%。由此导致用户评分矩阵的极度稀疏,进而影响最终推荐结果的准确率。这就是所谓的数据稀疏问题。该问题也普遍存在于在数字图书馆的推荐系统中。本文主要研究如何在数据稀疏情况下提高推荐结果的准确率,以更好的将协同推荐技术应用到数字图书馆的个性化推荐服务中。主要研究内容和创新点如下:1.提出一种基于最近邻用户动态重排序的相似度算法。在数据稀疏情况下充分利用项目类别信息,根据不同的目标项目动态调整邻居集内用户权重;并提出修正的重叠度因子弥补现有方法中手动调整参数的不足。试验表明,该算法在数据稀疏时能够有效提高推荐结果的准确率。2.提出一种基于信任度的协同过滤算法。从信任度的角度建立没有共同评分项目用户之间的关联,进而弥补由于数据稀疏所造成的难以寻找目标用户最近邻集的不足。试验表明,通过定义信任度和制定信任传播规则,可以有效缓解由数据稀疏造成的无法形成最近邻居集的问题。3.将本文提出的基于最近邻用户动态重排序算法应用于《图书馆交互式科研管理平台》中以检验算法的实用性。实验显示该算法能够有效的提高推荐结果的准确率。最后,对论文工作进行总结,并对下一步工作进行展望。