面向数字图书馆的个性化推荐算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:lfshiyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着数字化图书馆的不断发展与普及,其资源越来越丰富,信息量越来越大。人们在享受数字图书馆带来的方便与快捷的同时,也深受其因信息的海量存储所带来的困扰。拥有海量信息的数字化图书馆不仅需要响应用户的请求,更应该主动地向用户推送信息资源。而个性化推荐技术就是研究如何向用户主动提供用户感兴趣的信息的一门技术,它是当前研究的热点,也是本文的主要内容。数字图书馆的个性化推荐服务是一种以用户需求为中心,主动分析用户的兴趣爱好,进而智能高效地为用户找到感兴趣的信息的服务。在众多的个性化推荐算法中协同过滤推荐算法是当前应用最广泛的推荐技术之一,其核心思想可理解为“如果与我同兴趣的用户喜欢这本书,那么我也很有可能喜欢它”。然而,数据稀疏问题普遍存在于实际推荐系统中,并且受到众多研究者的关注。在实际系统中,项目数量十分庞大,然而用户给予评分的项目数量大约仅占项目总数的1%。由此导致用户评分矩阵的极度稀疏,进而影响最终推荐结果的准确率。这就是所谓的数据稀疏问题。该问题也普遍存在于在数字图书馆的推荐系统中。本文主要研究如何在数据稀疏情况下提高推荐结果的准确率,以更好的将协同推荐技术应用到数字图书馆的个性化推荐服务中。主要研究内容和创新点如下:1.提出一种基于最近邻用户动态重排序的相似度算法。在数据稀疏情况下充分利用项目类别信息,根据不同的目标项目动态调整邻居集内用户权重;并提出修正的重叠度因子弥补现有方法中手动调整参数的不足。试验表明,该算法在数据稀疏时能够有效提高推荐结果的准确率。2.提出一种基于信任度的协同过滤算法。从信任度的角度建立没有共同评分项目用户之间的关联,进而弥补由于数据稀疏所造成的难以寻找目标用户最近邻集的不足。试验表明,通过定义信任度和制定信任传播规则,可以有效缓解由数据稀疏造成的无法形成最近邻居集的问题。3.将本文提出的基于最近邻用户动态重排序算法应用于《图书馆交互式科研管理平台》中以检验算法的实用性。实验显示该算法能够有效的提高推荐结果的准确率。最后,对论文工作进行总结,并对下一步工作进行展望。
其他文献
在数字化网络化信息获取已成为科研人员现实的信息需求的背景之下,用户信息需求的特点、用户信息行为方式、信息服务场景都发生了重大的变化。方便快捷、数字化网络化、信息
通过问卷调查和访谈的形式发现:学生的英语语言能力与学生的就业呈显著的正相关。以此为基础,对以后的大学英语教学提出几点建议,重点强调提高学生英语能力的重要性。
利用'拍拍赚'任务平台有限的真实数据,对用户和任务进行分析,设计方案来提高任务的完成率并降低运营成本.首先根据已知的任务信息及会员信息构建相关变量,应用逐步回
在知识经济背景下,知识管理成为全球范围内越来越受重视的热门话题。作为人类知识宝库的图书馆,在21世纪必然会面对知识管理这一新的课题。本文从知识管理的概念、特征和目标入
目的观察B超引导下经颈内静脉置入PICC导管在血管通路困难患者中的应用效果。方法 46例无法在上肢或下肢行PICC置管的患者,采取B超引导下经颈内静脉PICC置管术。结果 46例患
人类进入21世纪,也同时步入了知识经济社会,知识成为整个社会发展的原动力。图书馆作为社会知识传播的枢纽,如何响应时代召唤,发挥其知识中介应有的作用,成为摆在图书馆界学者面前
教师对学生的情感,是教师在长期教育教学活动中所形成的对学生的一种较稳定的心理反应。教师的这种情感是一种高尚的道德情感,它对培养学生的学习兴趣,养成高尚的道德品质以
由不同组织在互联网上建设的众多数字图书馆具有分布性、异构性和自治性等特性,使得各数字图书馆之间很难互连互通和共享信息资源。而继因特网、Web之后的第三次信息技术浪潮
“中华塔器专家联谊会2006年镇海研讨会”于2006年10月19日-23日在浙江宁波市召开。参加本次会议的受邀代表除少数专家因公务时间安排原因不能与会外,其余专家均欣然参会。本
土壤铬污染已对农业生产和人类健康造成了严重的威胁。环境中的铬主要以Cr3+和Cr6+两种氧化形态存在。虽然Cr3+是人类和动物必需的营养元素,但Cr3+和Cr6+对植物都具有严重的