云环境下基于社交信息的音乐推荐系统设计与实现

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:tomjerry2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的不断发展和移动互联网的兴起,越来越多的人选择通过互联网来随时随地享受数字化音乐带来的服务。数字音乐数量的激增使得音乐服务提供商的主要竞争从曲库的深度和规模转移到了推荐和发现音乐方面,推荐系统成为解决该问题的主要技术手段,而协同过滤推荐算法作为推荐领域最主流的算法之一,在音乐推荐系统中得到了广泛应用。然而,随着推荐准确率的不断提高,影响协同过滤推荐算法推荐效果的另一个问题越来越突显出来:如何发现相关度高的新颖推荐项。本文从上述问题出发,提出了融合社交信息的基于图的协同过滤改进算法,并以该算法为核心技术,设计开发了一套完整的音乐推荐系统。主要工作如下:首先,改进算法的主要思想是:利用用户的社交信息,对由项目相似性矩阵构建出的用户偏好图进行扩充,以降低通过信息熵计算得出的奇异推荐项的比例,然后将这些项目与通过经典协同过滤算法得到的推荐项合并在一起作为最终的推荐结果。最后,通过采集自Last.fm上的数据对算法的有效性进行了验证。结果表明,与原始算法相比,该改进算法的推荐准确率平均提高了约2.265%,由此损失的新颖性在相关指标下仅仅约为1.24%。由此说明该算法可以在发掘出新颖推荐项的同时,提升系统的准确率,从而达到更好的推荐效果。其次,基于上述算法,本文设计并实现了一套音乐推荐系统,在进行了充分的需求分析和系统架构设计的基础上,给出了单曲推荐、艺术家推荐和好友推荐的算法设计,并提出了歌单推荐的策略;然后通过MapReduce编程范式实现了各个算法并将系统运行在Hadoop云平台上;最后,邀请用户对系统进行了在线测试,当推荐数为25时平均新颖度为4.56,准确率约为17.6%,证明该音乐推荐系统在兼顾推荐新颖性和准确率方面具有出色表现。
其他文献
近年来,软件应用在工业、农业、军事、科研等领域有了更加广泛的应用。随着应用的更广泛,代码规模的增大、软件系统的复杂度提高、程序中可能出现的各种错误漏洞也越来越多。
与一般无线网络相比,无线传感器网络是一个节点数众多,且存在能量约束的分布式网络。数据融合算法能够有效地对无线传感器网络采集和传输的数据进行处理,去除无效或者冗余的
由于无线频谱资源稀缺,且频谱利用率普遍不高,如何提高频谱利用率、提升用户吞吐量以满足人们对于高速数据传输的需求,是目前无线通信要解决的关键问题。提高系统频谱利用率
学位
在当前人口老龄化影响广泛且养老服务供需矛盾日益严重的背景下,亟需探索实现“医”“养”资源更广范围、更大深度的整合。通过查阅资料、走访调研发现,当前烟台市医养结合养老服务在实践中存在较多问题,主要表现在政府推进医养结合发展的主导作用小,公办医养结合服务机构供不应求,同时市场举办的医养结合服务机构社会认可度低、入住率不高,而社区作为多元供给中的重要环节,存在发展现状与实际需求严重不相符的问题,社会组织
目的:比较不同发病时间的老年急性ST段抬高型心肌梗死(STEMI)患者接受直接PCI(PPCI)、静脉溶栓以及补救PCI治疗这几种不同再灌注治疗方法及不同发病时间接受再灌注治疗的老年急性ST段抬高型心肌梗死(STEMI)患者的临床疗效、安全性及近期预后。方法:回顾性连续入选符合STEMI诊断标准并完成随访的1338例65岁~75岁(包括65岁)的老年患者。根据实际情况,依据患者的就诊时间的早晚及接
改革开放后,新疆民族分裂主义分子加强了对意识形态领域的渗透和破坏,在新疆历史问题上大作文章是其惯用伎俩。出于分裂祖国的罪恶目的,新疆民族分裂主义分子对新疆历史、民族发展史、宗教演变史、文明融合史进行肆意的歪曲杜撰,企图挑动民族仇恨,加深民族隔阂,扰乱人们的历史观念。新疆历史领域成为反分裂斗争的主阵地之一,加强历史领域反分裂斗争迫在眉睫。首先,本文在马克思主义历史观的指导下,通过对歪曲杜撰言论的分析
学位
粮食加工企业的过度加工问题是社会普遍存在的问题,随着生活质量的提升,人们对成品粮的外观和口感提出了更高的要求,所以企业为了追求更高的市场占有率,一味地注重成品粮的外观和口感,对粮食进行了过度加工,这必然会造成粮食加工不必要的浪费,粮食中的营养也大量流失,因此,粮食的过度加工问题是目前亟待解决的问题。为了更加系统地分析粮食过度加工的现状,本文对G集团在全国范围内的粮食加工企业进行了调查,并对调查结果
分子筛以其大的比表面、均一的孔道结构和可调控的催化活性中心,作为重要的多相催化剂在石油化工和精细化工等领域有极为广泛的应用。Sn-Beta分子筛具有均匀分布的Lewis酸活
2009年,E.Arikan提出了极化码,并且从理论上证明了极化码在任意给定的二进制输入离散无记忆信道(Binary-input Discrete Memoryless Channel,B-DMC)上可以达到对称容量。极化