基于复杂网络理论的推荐算法研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:forbj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet的快速发展使得用户接触到的信息越来越多,及时、准确在海量信息源中发现有价值的信息变得越来越困难。个性化推荐系统被视为解决这一问题的最有效方式之一。个性化推荐系统可以根据用户历史行为,通过建立相应的推荐算法,挖掘出用户特点和喜好,依据预测推荐结果帮助用户快速找到所需信息,达到个性化服务的目的。推荐算法作为个性化推荐系统中最为核心的组成部分,其效率的高低直接影响着整个推荐系统的表现。比较成熟的推荐算法有基于内容的、协同过滤等算法,这些算法虽然已经被普遍使用,但仍有不少需要完善的地方。基于复杂网络理论的推荐算法的提出就是一种很好的尝试,它也是目前的研究热点之一。随着复杂性科学的发展,将现实社会中各种现象或者关系抽象为复杂网络模型已经成为一种趋势。将个性化推荐系统中用户和商品抽象为复杂网络中的节点,用户与商品之间的选择关系抽象为网络中的连线,在这一模型基础上进行分析,为推荐算法的研究带来了新突破的可能。以复杂网络理论和相关的数据挖掘方法为基础,论文着重于寻求提升个性化推荐系统中推荐结果的精确性、多样性以及新鲜性的途径。在简述了一些复杂网络和个性化推荐系统的背景知识的基础上,分析探讨了推荐算法的发展与演变,最后结合随机游走与热传导两种物理过程构造出两类基于网络结构的推荐算法。具体工作如下:第一部分为绪论,介绍了互联网时代个性化推荐系统的研究背景,阐述了其对于解决信息超载问题的重要意义,并且对主要的研究方法和研究内容进行了概括。第二部分介绍了复杂网络理论以及个性化推荐系统。首先,概述了复杂网络理论的概念、特点以及发展状况和应用的领域。对复杂网络的几类主要拓扑特征进行了描述;介绍了几类经典复杂网络模型,并分析了各自的网络拓扑特性。其次,论文对个性化推荐系统进行了介绍。针对目前信息超载的现状指明了个性化推荐系统的研究意义以及商业价值;分析了推荐系统的业务流程、推荐系统的整体框架和推荐系统面临的主要挑战。第三部分对目前的个性化推荐算法研究进展进行了综述。主要介绍了基于内容的推荐算法、协同过滤推荐算法、基于复杂网络的推荐算法等。重点分析了基于网络结构的推荐算法,其基本思路为将用户抽象为节点,用户之间通过商品的联系抽象为连边,构建二部图(bipartite network)网络结构。类比物质扩散这种资源分配过程实现用户之间的相似性传递,以达到为目标用户推荐其未选择过商品的目的。该部分的最后对各种算法的优缺点进行了比较。第四、五部分是本论文的重点。第四部分通过分析商品度的影响能力以及资源随机游走传播方向性问题,修正了传统的协同过滤网络结构算法。尝试提出了基于随机游走的二部图网络结构推荐算法。传统的协同过滤网络结构推荐算法对于用户相似性的刻画都是从目标用户到邻居的方向来考虑。在现实的在线网络系统中,不活跃的用户占据了大部分的比例,活跃用户只有少数,本文指出有效的利用这种不均等的用户配比关系,可以增强在线社会网络以及电子商务网站的可扩展性以及用户依赖度。通过加入对于流行商品推荐能力限制的参数,适当降低流行商品的资源贡献强度,可以提高系统中那些较为冷门商品的出现比例,这样也就优化了推荐结果的多样性。同时,通过改变系统中固有的随机游走的资源传播方向,可以在不受实验数据特性的影响下,通过计算找到用户间相似性最大值,改善推荐系统的精确性。通过以上两个步骤的调整,算法可以在精确性、多样性以及个性化结果上优于以往的传统的协同过滤网络结构算法。第五部分类比物理上的热传导过程,利用标签等内容信息,在三部图网络结构中,尝试提出了基于热传导的三部图网络结构推荐算法以增加推荐结果的多样性。传统的推荐算法集中于对推荐结果精确性的改进,高精确性确实是衡量推荐系统效果的最为重要的指标之一,但是这样的结果并无法满足用户的个性化需求,因为高精确性带来的推荐往往都是那些已经可以从其他各种渠道获取到信息的流行商品。本部分通过从展示商品内容特征的标签信息入手,并将热传导这种物理过程成功的运用到用户-商品-标签三部图的复杂网络结构中,借鉴热传导的原理,不仅提高了算法的推荐结果多样性,同时也保障推荐结果的精确性。这一算法的整体表现,优于基于物质扩散的二部图网络结构推荐算法,同时也完善了传统的基于物质扩散的三部图网络结构的推荐算法。第六部分阐述本文的主要结论和不足之处,并对进一步的研究进行了展望。本文的主要创新点有两处。第一是考虑了方向性带给用户之间相似性计算的差异,引入物理学中的随机游走过程,通过比较采用两用户间相似性值较大者,改进了标准的基于网络结构的协同过滤算法。并且,通过加入对于流行商品推荐能力限制的参数,适当降低流行商品的资源贡献强度,提高系统中一些非流行商品的出现比例,这样也就优化了推荐结果的多样性。第二是在原有的利用标签信息构建的三部图网络结构推荐算法中,借鉴了物理学中热传导的原理,在用户-商品之间使用类似于热传导的资源传播方式增加了两用户的推荐列表差异性,从而改进了整个推荐算法的多样性。
其他文献
记者:作为公司合作投资方.天舟公司的哪些特质.是吸引您加盟的主要原因呢?纪红在合作之前,我们和天舟有过业务上的往来。在业务合作中.我们对天舟的团队精神、服务意识和产品都非常
在“互联网 +”背景下,现代教育教学理念也得到了新的发展,小学综合实践课教学中,应用“互联网 +”信息技术 开展课堂教学是大势所趋。如何将小学综合实践课与“互联网 +”技
基于无人车的传统负障碍物检测方法因观测角度有限导致检测速度较慢。针对该问题,提出一种无人机视觉下基于改进OTSU的负障碍物检测方法。使用无人机从较高视野位置增加观测角度并获取负障碍物图像;利用图像方差与权重系数对OTSU算法进行改进,获取图像分割的最佳结果,从而得到准确的负障碍物区域。实验结果表明,与传统的OTSU算法以及其他改进算法相比,该方法能获得更好的图像分割结果,为负障碍物区域定位提供良好
为了将应用任务快速有效地映射到片上网络,并实现低能耗、低时延等目标,优化多目标模型并提出一种改进的量子遗传算法解决片上网络映射问题。采用加权和法考虑网络拥堵时延,并引入通信带宽量化适应值,便于类比分析映射效果;结合应用任务和片上网络结构特点,利用任务节点相关链路数和通信权重双重优先标准构建较优初始解集,使得量子遗传算法改进后映射寻优收敛更加快速高效。实验结果表明,在同样的多目标映射模型下,改进的量
种业科技创新是农业现代化的源头保障。为贯彻十八届三中全会和习近平总书记视察山东时的重要讲话精神,落实汪洋副总理关于加快种业发展的重要讲话和国办发[2013]109号文件要
目的:应用功能磁共振成像(fMRI)观察针刺太溪穴后脑激活区的反应。方法:选取健康青年志愿者8例,分别针刺受试者右侧太溪穴,在fMRI下采用静息阶段与针刺阶段交替采集图像,获得
为了提高短期光伏发电预测的准确性,提出一种改进Semi Boost(Semi-supervised Boosting)天气聚类法和结合混沌纵横交叉的粒子群优化算法(Particle swarm optimization combined with chaos crossover,CC-PSO)优化深度置信网络(Deep Belief Network,DBN)连接权重的组合光伏发电功率预测方法。为了
交叉口不同方向车辆的行驶路径冲突会导致各种碰撞风险,因此利用交叉口的车辆轨迹数据提取该场景下的路径信息,对交叉口碰撞风险分析具有重要意义。提出一种基于集成聚类的路径信息提取方法,用于从交叉口车辆轨迹数据中获取交叉口路径信息。将车辆轨迹投射到网格上,并压缩其中大量的冗余点;采用集成聚类方法提取高质量的聚类,获取聚类后,基于图的拉普拉斯中心性,提取各个聚类的代表;采用深度优先搜索将聚类合并成路径。实验
十七大报告明确指出,提高自主创新能力、建设创新型国家是国家发展战略的核心,是提高综合国力的关键。笔者认为,自主创新也要有中国特色。
针对解决内容中心网络最近副本获取数据的问题,提出新型的RFS(Restricted Flooding Strategy)算法。结合洪泛算法和最优路径算法,通过控制洪泛区域降低开销的方法,近似地解决了网络无法获取邻居节点缓存副本的问题。对算法进行理论分析,并探讨算法的触发条件,给出改进修正条件下的RFS算法:RFS*算法。通过ndnSIM仿真软件,对采用RFS算法和RFS*算法的网络性能提升和网络额