异质信息网络中基于邻域的协同过滤推荐算法

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:moowoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务技术的发展,推荐系统的被广泛地应用于发掘用户兴趣,以提高商品销售量,在实际的推荐系统应用中,基于邻域的推荐系统是最为常见的推荐模型。在传统的基于邻域的推荐系统中,推荐过程首先通过用户物品之间的反馈关系来计算相似度矩阵进而确定自己的邻域节点,然后通过邻域节点的对于预测值进行影响。研究表明,将用户物品反馈信息和外部的信息例如电影的演员分类等,进行融合之后将会有效的提高推荐系统的准确度,而且还能解决以前邻域模型中的高计算复杂度的问题。为了处理逐渐增加的数据类型,研究者们提出了将学术异质网络中的研究方法引入到推荐系统中来,但是这些新的模型并没有注意到基于反馈关系和其他外部数据之间的差异,而这将在实际的推荐过程中引发严重的性能和与运行时间问题。本文详细分析了用户电影数据与学者论文数据的用户行为的差异,并以此为基础重新定义了推荐系统中的异质网络(HIN-RECSYS),提出不通过不确定的用户-物品关系来确定初始邻域,以避免系统运行初期高耗时的相似度矩阵的计算。在此之后,本文提出了一种叫做Heter-Neighbor的模型通过将新确定的邻域和传统的SVD++模型相结合,一方面通过外部数据快速的确定初始邻域,另一方面通过矩阵分解以及全局优化的方法将传统基于反馈的相似度进行快速迭代计算,保持了传统邻域推荐系统优势的同时,避免了因新数据的引入而导致系统运行时间的增加。经过实验分析发现Heter-Neighbor模型在处理异质网络数据的时性能要优于SVD++以及其他基于矩阵分解的经典算法。
其他文献
本课题的提出是为了解决火车站售票过程中出现的票据不符的问题。课题设计并实现了售票打印信息记录系统。该系统工作于售票系统的售票终端与售票打印机之间,实时地记录二者的
随着云计算技术的应用及发展,作为其基础组成部分的云存储及其安全性问题成为目前研究的重点。云存储是在云计算(cloud computing)概念上延伸和发展出来的一个新的概念,是指通过
信息技术在中国各个行业中的应用都得到了前所未有的重视,“以信息化带动工业化”已为各级决策部门所共识。然而各个行业的IT投入多以系统建设和应用开发为主,系统的有效管理
本论文研究内容来自西北工业大学航空微电子中心所承担的某预研课题,以参与的32位嵌入式微处理器“龙腾R2”的设计工作为基础,设计并实现了基于双端口RAM的数据Cache,该Cache应
随着Internet的发展,人们可以通过网络获得大量的信息资源,然而网上的信息浩如烟海,而且增长和更新的速度越来越快,从海量信息中找到所需的内容是一项极富挑战性的工作。传统的搜
水资源对社会经济的发展起着十分重要的作用。在处于干旱与半干旱地区的陕西省,地下水是重要的供水水源。加快水资源特别是地下水资源管理工作的现代化、信息化建设,已是当务
近年来,随着无线通信的迅猛发展,越来越多的无线通信技术被应用于数据通信中,WLAN、GPRS 到 WIMAX、3G 等无线通信技术的逐渐成熟,无线接入已经逐渐成为当前用户终端接入的热点。
当今社会,信息量剧增,生活节奏加快,如何从大量信息中找寻符合我们要求的信息,已是我们不得不面对的问题。因此,Top-N查询越来越被广泛应用,几乎已涉及我们工作学习生活的各个方面
网格资源具有分布性、异构性、动态性和自治性等特点,这使得网格的应用和推广面临很多挑战。作为网格基础组件之一的资源监控系统为网格上层应用提供重要的数据支持,因此对网格
肝癌是世界上最常见的恶性肿瘤之一。在我国,医院主要靠医生对医疗图像进行诊断,工作强度大,效率低,定量分析比较困难,影响了临床诊断的准确性。实现医疗的计算机辅助诊断对