基于能力的歌曲推荐技术的研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户：tywuyaohuan

【摘要】

：

唱歌是一种广受欢迎的娱乐活动，同时也是表达情感的一种很好的方式。传统的卡拉ok已经备受人们的喜爱，朋友们聚在一起去KTV唱歌已经成为广大唱歌爱好者的一种日常娱乐活动。唱

【作者】

：

毛旷

【机构】

：

浙江大学

【出处】

：

浙江大学

【发表日期】

：

2015年期

【关键词】

：

推荐系统发声能力演唱歌曲推荐排序学习概率推断

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

唱歌是一种广受欢迎的娱乐活动，同时也是表达情感的一种很好的方式。传统的卡拉ok已经备受人们的喜爱，朋友们聚在一起去KTV唱歌已经成为广大唱歌爱好者的一种日常娱乐活动。唱歌相关的娱乐节目例如中国好声音之类在中国以至全世界都是备受喜爱。同时随着互联网传输技术的飞速发展，越来越多的人选择在网上唱歌，在这些网上唱歌平台中用户可以录制一首自己演唱的歌曲并上传到唱歌社交社区中与大家分享。这一社交活动延伸出新的用户需求，用户对歌曲的挑选已经是传统推荐系统所无法满足的，因为用户会考虑歌曲对自己嗓音对于歌曲的适合性以达到比较好的推荐效果，如何获取用户的演唱特点以及如何建立新应用背景下的推荐算法已成为产业界以及学术界开始关心的问题，也是本文的主要研究方向。　　本文以现有的推荐系统与平台为基础，分析现有推荐系统在新的发展形势下遭遇的挑战和不足，同时调研了相关领域的大量前沿的研究，把研究方向定位于三个主要的方向:对歌手发声能力的获取与分析，基于用户发声能力的歌曲推荐技术以及对具有海量用户的在线唱歌社交社区中的推荐系统技术的研究。通过对这三个方向的深入研究，我们能够初步的解决在专业以及线上环境下进行演唱歌曲推荐的问题，满足用户的基本需求，也能够为促进线上社交唱歌社区的活跃度，产生实际的生成价值。本文通过基于能力的音乐推荐理论的建立，然后结合现有环境研发的推荐算法能够非常有效的解决能力音乐推荐的问题，基于真实的用户数据的实验充分验证了推荐算法的有效性。　　本文的主要研究内容可以分为四个部分。第一部分为了解决人类发声能力无法定量衡量的问题，对每个人生理学的发声能力进行完整数字化建模、分析以及实验;第二部分针对不同人的数字化发声能力，研究基于用户发声能力的音乐推荐技术;第三部分，针对现有的在线社交唱歌社区，提出了社交唱歌社区中的歌曲推荐系统框架;第四部分，从系统角度出发介绍了基于发声能力的推荐技术的原型系统myDJ。　　本文的主要贡献及创新点如下：　　(1)首先是提出了歌手档案建模技术用于用户唱歌能力建模。研究了整个歌手档案建模的过程，同时分析了歌手档案中不同区域对于影响歌曲推荐的重要性，同时提出了一种精简的歌手档案用于缩减建模一个人发声能力的录音过程。本文还提出了一种唱歌声音质量估计的方法，用户查询过程中，人声质量的自动评估。在对大量志愿者的发声能力进行了建模后，从而可视化的展示了不同人的歌手档案。　　(2)其次是提出了基于发声能力的歌曲推荐问题。提出了一整套建立歌曲档案的技术方案，结合歌曲档案与歌手档案以及不同歌手档案区域的重要性前提下，建立了排序学习的模型，用于训练歌曲推荐函数。在对真实用户的实验中验证了基于人类发声能力的音乐推荐框架以及推荐算法的有效性。　　(3)由于在线社交唱歌社区的中演唱歌曲推荐的需要，我们提出了一整套的演唱歌曲推荐方案。给出了一种从歌曲的历史评分中挖掘歌曲难度序的方法，通过分析歌曲难度序的置信度与支持度对难度序的可靠性进行衡量，从而在推荐中给予不同的权重。然后我们提出了基于难度图的歌曲建模技术，创新性的提出了一种通用的迭代概率推断算法用于在难度图中进行演唱歌曲推荐，此算法有效的解决了推荐系统遇到的冷启动问题，具有非常强的理论价值。通过在5sing上的数据上的实验，验证了推荐框架的有效性。　　(4)最后实现了基于能力的歌曲推荐原型系统myDJ。通过使用myDJ可以很方便的收集用户的发声能力，同时对歌曲进行有效的建模，本文对不同歌手档案进行了详尽的展示，对歌曲推荐结果进行了细致的分析，从实践角度验证了上述理论的有效性。

其他文献

基于因素相关性计算的安全度量

由于安全评估技术是理解系统安全状态的重要手段，国内外组织和机构先后制定了一批安全评估标准和方法，典型的标准包括美国的TCSEC[5]，美国标准局的NIST-SP800[8]，欧洲的ITSEC[6]

学位

信息安全

行为模式挖掘

用户规模万级以上的网络信息系统数量呈指数级增长态势，是当前互联网发展的一个基本事实。用户使用系统的行为往往受到网络中其他个体以及群体使用方式的影响。因此，如何在网络

学位

网络信息

嵌入式系统中基于电池抽象模型的动态电压调节策略研究

随着移动计算技术的发展，功耗问题已经成为制约嵌入式系统发展的重要因素之一。动态电压调节(DVS)技术是一种通过在线调节系统工作电压／频率的低功耗技术，在保证系统性能的同时

学位

嵌入式系统电池模型动态电压调节系统能量消耗电池放电

基于GPRS嵌入式自动抄表系统的研究与实现

与传统的人工抄表系统相比，自动抄表(Automatic Meter Reading)系统具有高效、便捷、准确等优点，已广泛应用于水、电、气等公共服务事业中。针对AMR系统在无线通讯、数据安全和

学位

自动抄表系统GPRS嵌入式linux实时系统无线网络无线传输数据安全系统设计

概念和上下位关系的获取理论和方法研究

随着计算机的普及以及互联网的迅猛发展,知识获取的来源、数量和形式也随之发生了根本的变化.目前,在Internet的数据中蕴含了海量的知识,同时也含有大量的垃圾信息,完全人工

学位

知识获取概念获取意义识别信息抽取

移动平台上的游戏开发技术研究

伴随着移动网络和移动终端性能的不断提高与完善，手机游戏增长势头远远超过其他移动数据业务，已经逐渐成为一个生机勃勃而又潜力巨大的文化产业。现阶段的手机游戏发展滞后于手

学位

移动网络手机游戏游戏开发

跨媒体表达与排序联合优化理论与方法研究

随着互联网上多媒体数据的日益增长，通过一种模态数据检索另外一种模态数据（例如，以文本检索图像）的跨媒体检索具有广泛的应用并日益受到关注。跨媒体排序是跨媒体检索中的一个重

学位

数据检索跨媒体表达跨媒体排序联合优化算法

基于服务Agent的语义Web服务发现、集成方法的研究

伴随着网络技术的飞速发展,Web服务的应用范围在不断地扩大。越来越多的Web服务被作为共享服务提供给请求者使用,而Web服务种类的多样化也造成了在其之上的发现和集成效率的

学位

服务Agent服务Agent语义Web语义WebWeb服务发现Web服务发现系统集成系统集成功能结构功能结构

基于主题匹配与信息融合的交互式视频检索框架

随着多媒体技术和互联网技术的飞速发展，以视频为代表的多媒体数据正在以惊人的速度增长。面对如此丰富、无序、海量的多媒体数据，如何实现所需资源的有效组织、高效检索和快速

学位

视频特征信息融合主题匹配多媒体数据视频检索分支反馈算法主题直方图

基于样本的图像纹理合成技术研究

在计算机图形学中,常需要给几何模型增加丰富而真实的细节,纹理被普遍认为是最有效的手段。纹理合成可以生成任意大的所需要的纹理,解决了纹理映射中的接缝和扭曲问题。但传

学位

图像纹理图像纹理计算机图形学计算机图形学几何模型几何模型纹理映射纹理映射纹理合成纹理合成实时模式匹配实时模式匹配合成算法合成算法

基于能力的歌曲推荐技术的研究

与本文相关的学术论文