论文部分内容阅读
唱歌是一种广受欢迎的娱乐活动,同时也是表达情感的一种很好的方式。传统的卡拉ok已经备受人们的喜爱,朋友们聚在一起去KTV唱歌已经成为广大唱歌爱好者的一种日常娱乐活动。唱歌相关的娱乐节目例如中国好声音之类在中国以至全世界都是备受喜爱。同时随着互联网传输技术的飞速发展,越来越多的人选择在网上唱歌,在这些网上唱歌平台中用户可以录制一首自己演唱的歌曲并上传到唱歌社交社区中与大家分享。这一社交活动延伸出新的用户需求,用户对歌曲的挑选已经是传统推荐系统所无法满足的,因为用户会考虑歌曲对自己嗓音对于歌曲的适合性以达到比较好的推荐效果,如何获取用户的演唱特点以及如何建立新应用背景下的推荐算法已成为产业界以及学术界开始关心的问题,也是本文的主要研究方向。 本文以现有的推荐系统与平台为基础,分析现有推荐系统在新的发展形势下遭遇的挑战和不足,同时调研了相关领域的大量前沿的研究,把研究方向定位于三个主要的方向:对歌手发声能力的获取与分析,基于用户发声能力的歌曲推荐技术以及对具有海量用户的在线唱歌社交社区中的推荐系统技术的研究。通过对这三个方向的深入研究,我们能够初步的解决在专业以及线上环境下进行演唱歌曲推荐的问题,满足用户的基本需求,也能够为促进线上社交唱歌社区的活跃度,产生实际的生成价值。本文通过基于能力的音乐推荐理论的建立,然后结合现有环境研发的推荐算法能够非常有效的解决能力音乐推荐的问题,基于真实的用户数据的实验充分验证了推荐算法的有效性。 本文的主要研究内容可以分为四个部分。第一部分为了解决人类发声能力无法定量衡量的问题,对每个人生理学的发声能力进行完整数字化建模、分析以及实验;第二部分针对不同人的数字化发声能力,研究基于用户发声能力的音乐推荐技术;第三部分,针对现有的在线社交唱歌社区,提出了社交唱歌社区中的歌曲推荐系统框架;第四部分,从系统角度出发介绍了基于发声能力的推荐技术的原型系统myDJ。 本文的主要贡献及创新点如下: (1)首先是提出了歌手档案建模技术用于用户唱歌能力建模。研究了整个歌手档案建模的过程,同时分析了歌手档案中不同区域对于影响歌曲推荐的重要性,同时提出了一种精简的歌手档案用于缩减建模一个人发声能力的录音过程。本文还提出了一种唱歌声音质量估计的方法,用户查询过程中,人声质量的自动评估。在对大量志愿者的发声能力进行了建模后,从而可视化的展示了不同人的歌手档案。 (2)其次是提出了基于发声能力的歌曲推荐问题。提出了一整套建立歌曲档案的技术方案,结合歌曲档案与歌手档案以及不同歌手档案区域的重要性前提下,建立了排序学习的模型,用于训练歌曲推荐函数。在对真实用户的实验中验证了基于人类发声能力的音乐推荐框架以及推荐算法的有效性。 (3)由于在线社交唱歌社区的中演唱歌曲推荐的需要,我们提出了一整套的演唱歌曲推荐方案。给出了一种从歌曲的历史评分中挖掘歌曲难度序的方法,通过分析歌曲难度序的置信度与支持度对难度序的可靠性进行衡量,从而在推荐中给予不同的权重。然后我们提出了基于难度图的歌曲建模技术,创新性的提出了一种通用的迭代概率推断算法用于在难度图中进行演唱歌曲推荐,此算法有效的解决了推荐系统遇到的冷启动问题,具有非常强的理论价值。通过在5sing上的数据上的实验,验证了推荐框架的有效性。 (4)最后实现了基于能力的歌曲推荐原型系统myDJ。通过使用myDJ可以很方便的收集用户的发声能力,同时对歌曲进行有效的建模,本文对不同歌手档案进行了详尽的展示,对歌曲推荐结果进行了细致的分析,从实践角度验证了上述理论的有效性。