基于GMM和人耳听觉特征的歌手识别系统算法研究

被引量 : 0次 | 上传用户:aiwo2516
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展,多媒体信息资源迅速增加。面对多媒体音乐库中的海量资源,人们要查询到符合自己需求的目标音乐异常困难。如何实现计算机分析并感知用户对音乐资源的需求成为人机交互能力未来发展的目标。基于内容的音乐信息检索应用主要体现在音乐的自动分类和识别中,而众多的音乐分类中,以音乐流派分类和音乐歌手识别较为常见。音乐自动分类中的歌手识别属于音乐信息检索一个重要分支。歌手识别是采用机器识别的方法,模拟人耳的这种“经验”来识别歌手的声音。本文研究的重点是应用高斯混合模型算法并基于人耳的听觉特征的歌手识别,属于基于内容的音乐识别范畴。本系统利用提取歌曲中歌声的人耳听觉特性以达到识别不同歌手的目的,为未知歌曲的信息内容提供了基于声音的歌手识别,提高了歌手识别的正确率,丰富了音乐信息检索的内容。本文首先讨论了音乐和人声的基本特性,并围绕歌手识别进行展开,提出了能代表人耳听觉的特性作为识别特征的方法。其次研究了歌曲中人声识别的内容,并利用稀疏表示的应用算法进行分析。再次重点分析了高斯混合模型算法在处理语音信号识别的优势,以及应用于歌手识别领域的可行性。最后通过仿真实验验证以上算法的可行性,测试了提取不同特征情况下歌手识别的效果,其效果达到预期目标。
其他文献
本文以当下较热门的抖音、快手等移动短视频App的用户为研究对象,分析他们在价值感知和移动短视频依恋程度之间的关系,并引入网络归属感和网络隐私关注因素,进行中介效应检验
塑料产业的发展,为人类社会的进步做出了巨大的贡献,但石油资源有限,不可再生,且近年来价格暴涨;在环境中较难自然降解,造成的环境污染日趋严重,因此寻求塑料的替代品势在必行
作为能够提升学生身体素质的重要学科,体育教学的质量得到了越来越多人的关注。提高小学体育教学的水平和质量,对帮助小学生的身体健康和心灵素质提升有着至关重要的作用。由
根据颜色特征利用阈值自动设定的方法对图像进行分割,自动、快速识别红色番茄;采用形心匹配取代常规的特征点选择和匹配方法,对双目立体成像测距公式进行了修正,经过验证,当
中国当归为伞形科(Umbrelliferae)植物。当归Angelica sinensis(Oliv)Diels的根可入肝、心、脾经,药性甘、辛、温,具有补血活血、调经止痛、润燥滑肠等功效,为临床使用频率最高的
水资源是生产生活所必需的资源,如何合理、可持续地开采水资源,让有限的水资源创造出最大的价值一直都是管理者需要迫切考虑的。本文选取黑龙江省红兴隆管理局为研究基点,从
本研究以在校大学生为被试,分别以中国情绪图片系统和中国情绪面孔系统中的正性和中性图片(面孔)为刺激材料,采用认知行为实验,探讨了不同刺激材料诱发正性情绪和中性情绪对
目的探讨情绪影响时间知觉的性别差异。方法让38名大学生志愿者完成时间等分任务。结果在低唤醒图片,800 ms时距条件下,男性较女性高估时间;相对于低唤醒图片及中性图片,男性
随着我国城镇化发展速度变快,由较为重视农村向城市发展的数量和规模,转变为更加强调提高城市发展后的质量,以及城乡之间协调统一的可持续发展。作为一种特殊形态的城市类型,
普洱茶是一个具有特定内涵的产业,它独特的加工方法和品质,以及特殊的保健功能和收藏价值,使得普洱茶成为云南特有的一个茶叶品种,在上个世纪80年代重新兴起后,它带动和促进