基于概念相似度的推荐子系统的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:zc81065442
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的飞速发展与数字资源数量的爆炸式增长,使传统的以关键字为检索为手段的信息获取技术日益不能满足人们的需求。在这种情况下,个性化服务应运而生。推荐系统是实现个性化服务的一项重要内容,它通过收集用户特征资料并根据用户偏好为用户主动进行个性化的推荐,并且跟踪用户兴趣变化,实时更新推荐。根据与用户偏好进行比较的信息的不同,推荐技术可分为基于内容的推荐技术和协作过滤推荐技术,这两种技术都有各自的优点与不足,很多系统通过结合这两种技术来达到更好的推荐效果。 本文设计并实现了一个科技文献的推荐子系统,该子系统是高等学校博士学科点专项科研基金“协作式科技论文网络共享平台”项目(编号20070001073)支持的PKUSpace中的一部分。PKUSpace致力于建立一个科研服务与交流平台,提供科技文献的存储、共享、检索、导航等基本功能,并融入了web2.0的因素,提供协同标签,阅读笔记以及个人文献视图等功能。在此基础上还提供了标签挖掘及文献的个性化推荐等服务。 本文结合了PKUSpace中Web2.0的因素,提出了以协同标签为基础,结合科技文献的内容信息,并融合了基于内容过滤与协作过滤技术的组合推荐框架。本文的新思路在于: ·使用协同标签构建语义概念,并计算语义概念之间的相似度形成本体。协同标签是web2.0系统中常用的资源组织方式,本文提出的算法能够适用于所有提供了协同标签功能的系统。 ·使用本体中的语义概念表示用户兴趣和文献特征。相比于目前多数只是简单地利用用户是否对资源打过标签这一信息来判断用户是否对资源感兴趣的方法,此方法为用户兴趣引入了文本内容,并同时为用户兴趣和文献特征引入了丰富的语义信息。 ·使用文献的TF-IDF特征向量计算文献对目标用户的新奇度,用于过滤内容高度相似的文献,从而为用户发现新的感兴趣的文献,避免推荐与他标记过的文献内容非常相似的文章。 实验表明,本文提出的方法不仅提高了原PKUSpace中推荐子系统的准确率,而且对最终的推荐列表进行了很好的组织。
其他文献
近年来,随着计算机网络与无线通信的发展,以及对可携带、可移动计算机的需求不断增长,使得无线局域网以其移动灵活、易维护、易架设等优点被广泛应用。无线局域网是通过无线
Maze网络文件系统是基于北京大学天网FTP搜索引擎的一个混和型P2P网络文件共享系统,它运用了一些新颖的P2P网络技术,结合多种文件共享与传输技术,同时利用天网FTP搜索引擎的
深空探测业已成为世界关注的焦点,这类任务的高成本特性,也使得与探测成本密切相关的探测轨道的设计和优化方法的研究成为热点。深空探测的轨道(尤其在涉及借力飞行变轨时)通常
指令调度依据机器资源特征和程序属性,通过调整指令的执行次序来提高指令级并行度,是一种重要的编译优化技术。一般地,指令调度考虑的机器资源主要是计算部件。本论文在指令调度
网格系统中存在种类繁多的应用与资源,它们不同的管理方泫给网格系统的设计增加了复杂性,也给用户使用网格带来了困难。同时,资源服务化的趋势虽然使网格系统的构建更加规范,但也
无线传感器网络被认为是全球未来十大技术之一。由于它在许多领域具有重要的科研价值和巨大的实用价值,在基础理论和工程技术两个层面向科技工作者提出了大量挑战性问题,从而引
随着互联网技术的日益成熟,即时通信技术发展迅速。即时通信技术以其双向互动的交流方式吸引了大量用户,它的出现给人们带来了极大的便利。Jabber技术是目前发展最快、研究最
面对网络视频数据的爆炸式增长,人们迫切需要研究基于内容的视频检索技术。然而,视频的内在语义即人们对视频数据的理解与其表现形式即人们提取的二进制底层特征之间存在语义鸿
无线自组织网络具有广阔的应用前景,因而受到越来越多的关注。拓扑控制是无线自组织网络研究中最基本的问题之一,它对于节省能量、增大网络容量、减小通信干扰等具有重要意义
近十几年来,演化算法已逐步发展成为解决多目标优化问题的理想方法,特别为求解大规模复杂的多目标优化问题提供了有效的研究方法,因而多目标优化问题已成为演化算法领域的研究热