演唱者声音特质建模及其应用

来源 :福州大学 | 被引量 : 0次 | 上传用户:ssathena
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,在移动互联网应用的快速发展和各档大型真人音乐选秀类节目的双重刺激下,歌曲演唱类APP蓬勃发展,同时也对音乐推荐系统带来了新的挑战。传统音乐推荐系统着眼于为用户推荐喜欢听的歌曲。而在歌曲演唱的应用场景中,仅仅根据用户喜好推荐歌曲并不全面,还需要考虑用户的演唱能力是否和推荐歌曲的演绎要求相匹配。然而,音乐推荐方法并没有伴随着应用场景的迁移而发生同步迁移。目前大部分歌曲演唱类APP依然停留在按照音乐分类、热度、用户点播记录推荐歌曲的状态,无法根据用户演唱能力画像推荐适合用户演唱的歌曲。为此,本文以演唱者演唱能力画像刻画为主要研究目标,以演唱者的清唱音频信号为研究对象,选取演唱者的演唱音域和音色作为其特质表征,进而构建了演唱者声音特质模型作为用户演唱能力画像,最终应用于歌曲个性化推荐之上,根据演唱者演唱能力画像,向演唱者推荐适合其声音特质演唱的歌曲。首先,本文提出一种基于威尔逊置信统计的演唱者演唱音域提取方法。该方法通过比对演唱者MIDI音高序列与歌曲标准MIDI音高模型,基于威尔逊置信区间评估演唱者在各个基本音级上的完成质量,确定演唱者的基本演唱能力,进而确立演唱者的演唱音域。实验结果表明经由本方法提取的演唱音域与实验对象演唱水平一致性程度较高。其次,本文对人声音色的表征和相似性度量方式进行探索,借助深度卷积网络强大的降维能力及特征学习能力,将高维的、时序的人声频谱特征嵌入到3维的音色嵌入空间中,从而在3维音色嵌入空间内实现音色相似性的可度量性。目前实验结果表明在包含15个歌手的音色嵌入空间中,歌手音色分类识别准确率达到73.12%,有效地保证了音色相似性度量的准确性。最后,本文综合演唱者的演唱音域及音色表征,建立其演唱者声音特质模型,并用于其演唱能力画像的刻画。同时,根据歌曲的简谱、伴奏及原唱歌手的音色表征等信息,建立歌曲基准模型。利用演唱者声音特质模型与歌曲进行音域以及音色匹配,得到适合演唱者演唱的个性化歌曲推荐列表。
其他文献
截止2018年底,全国铁路营业里程已达13.1万公里,近年来我国铁路建设取得了举世瞩目的成就。铁路设备维护管理单位管辖设备数量逐年递增、管辖范围逐年扩大,随之设备维护管理工作面临前所未有的挑战,现行维修管理体系已经不适应铁路设备维护管理需要。亟待利用成熟的计算机技术和传感技术,通过实时采集设备的运行参数进行大数据分析,监视设备运行状态实现预测性维修,弥补计划检修和故障维修的不足,解决维修决策缺乏针
公路工程施工中的内业资料能对工程建设过程进行真实和科学的反馈,从而对各个环节之间的联系进行反映和表达。在企业进行工程项目交验的环节中,这项工作的开展也可以提供准确
与石化、通讯、金融等其他支柱型行业相比。汽车业应该是增长率最高、市场化程度最高、垄断意味最轻的行业。    市面上林林总总的汽车报道永远是浮到水面上的冰山一角。福田汽车副总经理董海洋抱怨的说:“很多记者,老忽略经济基础,老关心上层建筑;老关心现象,而不关注本质。”  如何能够看到本质?它除了要求我们具有基本常识之外,还要求有非常深刻的判断和认识。    “强大”的标准是什么?    让我们回到汽车
目的:探讨儿童免疫性血小板减少症(ITP)发生严重不良事件(SAE)的高危因素及预后。方法:回顾性分析2011年1月至2015年12月重庆医科大学附属儿童医院收治入院的血小板计数≤20×109/L、并发生严重不良事件(SAE)的ITP患儿的临床特征、高危因素及预后。结果:在血小板计数≤20×109/L的ITP患儿1604例中,发生SAE者140例(8.73%),包括严重出血事件(SBE)138例(
城市污染治理需要的不仅是消声器、除尘器等环保设施,而且要有综合性的解决方案。    2003年6月,国家电网三峡至常州500千伏直流输电工程政平换流站满负荷运转后,周边村庄的村民就被这个总投资约15亿元的换流站产生的噪声侵扰不已。遭到大量投诉后,国家电网意欲拿出3亿多元让村庄搬迁。这时,一家声学公司上门要求为该换流站进行噪声治理,并成功完成了任务。  这家公司就是北京绿创环保集团旗下的绿创声学工程