个性化音乐推荐系统的研究与实现

被引量 : 7次 | 上传用户:hfwandy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网时代,各类音乐网站极大的方便了人们对于音乐的需求。然而,大型的音乐门户网站能够保存上千万首歌曲,在面对如此海量的音乐信息时,人们往往难以从中找到符合自己“口味”的歌曲。传统的搜索引擎只适合应用在用户有明确的目标并且能够用关键词准确的表达出来的信息检索问题。同时,音乐是一个典型的具有“LongTail”(长尾)现象的物品——只有极少部分的歌曲会被用户下载,绝大部分音乐往往无人问津。因此,个性化音乐推荐系统正是为了在没有明确需求的情况下,挖掘处于长尾部分音乐,帮助人们找到其喜爱的歌曲。推荐系统是信息过滤(information filtering)系统的一种,它的主要功能是预测用户对某个物品的喜爱程度。在个性化音乐推荐领域,主流的推荐方法有两类,一是基于内容的推荐,二是基于协同的推荐。其中,正确的计算音乐之间的相似度是这两类推荐方法的关键所在。然而,这两种方法都存在某些不足之处,如基于内容的推荐存在推荐准确率不高的问题,基于协同的推荐倾向于为用户推荐热门的歌曲。本文通过对这两类推荐算法较为全面和深入的分析,发现这两类算法之间的存在一定的互补关系。因此,本文提出了一种将基于内容和基于协同过滤相混合的推荐算法——语义增强型的协同过滤算法。本算法首先分析了歌词中隐含的语义信息,并计算歌曲歌词之间的语义相似度,然后基于用户的音乐下载历史计算歌曲的共现相似度。因为歌词代表着一首歌曲想要传达给听众的思想感情,所以通过结合这两种不同的相似度信息,本推荐算法可以改善基于协同过滤算法的不足之处。本文研究对象是带有歌词的歌曲,在后文中,音乐、歌曲都指代含有歌词的一类歌曲。本文开发的个性化音乐推荐系统的核心算法就是语义增强型的协同过滤算法。经试验证明,在推荐冷门音乐时,本文提出的混合推荐算法比纯粹的基于内容和基于协同的推荐方法都更加有效。为满足当前为庞大用户群推荐海量音乐的需求,本系统在开发时使用了目前主流的大数据分布式计算平台Hadoop。借助Hadoop优异的扩展性经实验证明本推荐系统能够有效的完成几十万用户的计算工作本文主要的研究工作如下:首先,研究用户的歌曲下载数据,根据歌曲下载次数的分布,将歌曲分为热门音乐和冷门音乐两类,更加细致、有针对性的分析推荐算法的推荐性能。然后,较为深入和全面的研究个性化推荐领域的主流算法基本原理,在分析算法的优点和不足基础上,本文提出了语义增强型的协同过滤算法。本算法在传统的协同过滤算法中引入了歌曲歌词的语义信息,以此缓解协同过滤算法的不足。经试验证明取得了较好的成果。其次,使用Hadoop相关技术实现语义增强型的协同过滤算法,使推荐算法能够完成大规模的用户推荐计算。
其他文献
运用社会网络分析方法,绘制不同发展阶段中国科技政策制定主体合作网络图谱,提炼网络结构演化的模式特征;通过合作"广度—强度"二维矩阵分析政策主体在网络中的角色演变,并识
文章报道.澳大利亚政府决定对第一期环境保护研究工作拨款8400万澳元。第一期和以后几期环保措施的总拨款额计划达到10亿澳元。1995~1996年期间环保措施已耗用了2.2亿澳元。199
利用二项式方程进行无阻流量计算,对气井进行合理配产已在气田开发中得到广泛应用。涩北气田由于部分测试井地层出水、出砂,产能试井二项式曲线出现“倒转”现象。依据校正前
本研究从词频广度、词汇多样性、词性分布比例3个参数,分析了英语专业学生1年级到4年级口语-笔语词汇差异的变化,并考察其变化与本族语者口语-笔语词汇差异的方向是否一致。
我国农民专业合作社发展迅速,合作社数量高速增长、生产的农产品种类多样、入社农户也显著增多,但农民专业合作社农产品的流通仍存在着一些问题。流通成本高,流通速度慢、损耗大
随着云计算产业的不断扩大以及专业化分工的形成,云计算市场中逐渐形成了一条由应用服务提供商,平台服务提供商,基础设施提供商以及终端用户所组成的云计算服务供应链。如何
随着知识经济的到来,以分工和协作为特征的工作团队成为组织开展活动的主要形式。事实表明,工作团队形式能够更好的完成需要多种技能、经验和判断的工作任务。团队与一般群体的
随着现代城市人口的快速增长,对城市空间需求不断增加,而城市内部空间随着退二进三的产业模式的转变,城市内部空间留下了许多棕地。棕地长时间的荒废、无人管理,都不利于城市良性
20世纪文学理论界发生了研究范式的巨大转变,其中一大转变即是从作品论转向文本论。此转变应该划分为三个阶段:20世纪上半叶的早期文本观的出现,主要以形式主义的文本观为代表