融合信任关系的协同过滤算法改进研究

来源 :北京交通大学 | 被引量 : 6次 | 上传用户:hwh494
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0、移动互联网等技术的崛起,人们获取信息的方式发生了巨大的改变,信息化已经日益深入。互联网上的信息迅速增长,人们进入了大数据时代。对于信息消费者而言,如何在海量的信息数据中找到自己感兴趣的、对自己有价值的信息变得越来越困难,另一方面也让网络中大量的信息无人问津变成长尾沉默使信息利用率降低。在此需求的推动下,推荐系统应用而生[1],它可以通过分析用户历史行为数据,运用数据挖掘的相关技术预测用户的兴趣爱好,主动向用户推送信息。目前推荐系统已被广泛应用于各个领域。此外,近几年社交网络发展十分迅速,它将现实生活中的人们通过网络联系在一起。人们可以在网络上交换信息,将这些信息应用到推荐过程中,在很大程度上弥补推荐算法的不足。本文充分挖掘社会网络中用户之间的关系,结合传统推荐算法预测用户对服务项目的评分,提高推荐的质量和可靠性。本文的主要研究工作如下:(1)在用户评分数据极端稀疏的情况下,传统的用户相似度计算方法存在弊端,导致推荐系统的推荐质量急剧下降。本文使用局部相似度的概念,引入重叠度因子修正用户局部相似度,然后将修正的局部相似度相加得到用户全局相似度。改进的用户相似度算法避免了传统方法中共同评分项目数据稀少但评分非常相似、用户相似度较高的不合理现象。(2)传统协同过滤算法将用户间的相似度作为最终权重,生成邻居用户,没有考虑到用户间的信任关系对推荐结果的影响,本文认为用户间的信任关系也可以作为推荐的权重,生成邻居用户进而进行推荐。针对传统协同过滤算法中存在的数据稀疏性问题,本文提出了信任关系传递规则,在一定程度上缓解了上述问题。(3)传统的协同过滤算法仅仅依靠用户-项目评分数据进行推荐,没有考虑到用户评分信息过期的问题,越早的评分信息价值越低,越晚的评分信息价值越高。为了更准确的对未评分项目进行预测,本文在评分预测阶段引入时间权重函数,以此来提高推荐的质量。最后,为了验证本文提出的融合信任关系的协同过滤算法(STCF)的有效性,采用MovieLens数据集进行仿真实验,实验的结果表明本文提出的算法比传统的协同过滤算法准确度更高。
其他文献
同步自动机是一种特殊的有限状态自动机,在机器人学、工业自动化以及生物计算等方面有重要应用,同步性检测和最短同步字的长度(特别是(?)ern(?)猜想)是同步自动机理论研究的两个核心
目前处理器持续增长的温度已经成为芯片设计的主要瓶颈之一。求解热方程最常用的方法是有限差分法(Finite Difference Method,简称FDM)和有限元法(Finite Element Method,简
作为当今计算机发展炙手可热的技术,并行计算及以其为基础的云计算已经成为了解决大数据量,复杂运算问题的首选方法,越来越多的应用被从单机搬到了云端。并行计算的发展使得我们
随着互联网、多媒体技术以及计算机视觉的快速发展,衍生出了大量的多媒体数据,这些数据多以图像、视频的形式呈现。一方面这些图像充斥于数字网络中给人们提供了丰富的共享资
随着科学技术的发展,XML数据已成为Web上数据表示和数据交换的新标准。XML数据是半结构数据,由于其可扩展性、平台无关性、开放性等特点,在诸多领域得到了普遍应用,如科学计
Ad Hoc网络是一种由多个随机移动节点组成的无中心的,多跳自组织的临时性无线通信网络。它能够快速灵活铺设于某些特定场合,并且能自组织、抗毁性强,即使某些节点损毁或离开
医学图像三维重建是将连续的二维医学断层图像合成为体数据并用三维图像的形式显示出来,以增强医生对器官结构和病灶三维形态的观察和理解,有利于提高临床诊断的准确性。在临
近年来,随着信息交换和信息共享数据量的急剧增加,对信息的安全性的要求也在不断的提高,现有的安全技术也无法满足信息安全的需求。国内外对Internet密钥交换协议的研究和应
近年来,在计算机技术、数字媒体以及多媒体信息高速发展的大背景下,手机、数码相机等高科技产品已经深入人们的生活,随之而来的是呈爆炸式增长的海量图像信息。因此,如何有效
成像光谱数据的光谱分辨率很高,包含很多从可见光到热红外波段的光谱信息,是一个高维的光谱数据集,同时又包含丰富的空间、辐射信息,给地质勘探应用带来了新的机遇。基于成像