鲁棒性哼唱特征研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:qq1123388099
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
哼唱检索系统,一种基于内容的多媒体检索系统,作为目前的研究热点,一直存在哼唱特征不稳定的问题,造成此问题的主要原因是人声个性化,哼唱人的音域不同、哼唱节奏不同、个别音高不准确等问题,都会导致哼唱特征不稳定。本文针对哼唱检索系统中存在的哼唱特征不稳定问题,进行了以下几点研究,旨在提取更具鲁棒性的哼唱特征:1、哼唱片段特征提取改进算法针对哼唱音频,提取哼唱音高特征后,为提高哼唱片段与MIDI的匹配度,改进了哼唱片段的特征提取算法。通过分析人声哼唱频率分布范围,哼唱与MIDI的对齐实验,对哼唱音高进行规整操作;结合乐理知识,进行音符切分操作;根据人声个性化进行半音域转换,以哼唱人的基准频率代替原440Hz的统一基准频率,使得哼唱音符特征与midi的音符特征值达到更好的匹配。以上改进方法通过实验给出算法的有效性。2、提出了一种基于局部统计的哼唱特征提取算法通过对哼唱音符序列在纵向音域分布和横向时序变化的局部统计,获得哼唱旋律的直方图统计特征。此算法在纵向音域上进行区间分布投影统计;在横向上进行音符时序变化模式直方图分布统计,最终获得纵向与横向的联合直方图特征,并加入均值、极差、方差特征。最后以4段连续子序列加整段联合直方图特征对音符分布进行描述。此算法不同于传统的以音高或音符直接作为哼唱特征的表示方法,而是将音符转化为统计特征的形式,保证了哼唱特征的相对稳定,对于不同用户在哼唱中表现的速度、音域、节奏等方面的差异有很好的容错性。最后,通过实验检验了此方法的有效性,实验数据为5000首MIDI,104首哼唱查询,应用本文提出的哼唱特征提取算法作为哼唱特征,并采用局部敏感哈希算法(Local Sensitive Hash)作为相似特征匹配算法,得到TOP1准确率为86%,TOP5准确率为92%,与原哼唱识别系统中以音符作为特征的结果进行了比较,实验结果优于原始结果。
其他文献
在认知无线电(Cognitive Radio,CR)系统中,频谱感知技术用于发现频谱机会,是实现频谱资源再利用的首要且核心技术。相较于传统窄带频谱感知技术而言,宽带频谱感知技术能够更
近些年,Web应用程序逐渐受到人们关注,因其开发周期短、维护方便等特点,己经成为一种应用频率很高且功能丰富的互动媒体。Web应用程序在给人们带来极大便利的同时,也带来了很
学位
目的:在“中医传承辅助平台(V2.5)”基础上,总结谷越涛主任医师治疗慢性肾小球肾炎的临床经验。方法:通过整理2017年1月至2018年12月由谷越涛主任医师诊治的慢性肾小球肾炎的病例,对常用中药进行深入的分析与研究,得到由谷越涛主任医师诊治的慢性肾小球肾炎患者的处方1135份,对其进行数据整理,采用一人录入,一人核对的方法逐一录入“中医传承辅助平台(V2.5)”,通过平台中的“数据分析”对录入的
国内移动互联网庞大的用户基数,支撑着手机购物、手机网上银行以及移动支付等业务的迅速发展,海量的用户信息通过移动通信网络上传到各类应用服务商,用户面临严峻的网络钓鱼
济南信息工程学院具有悠久的办学历史,旗下拥有诸多优势专业,软件专业即是其中之一。该校多年来通过不断改革创新,秉承求真务实的探索精神,在教学领域投入了较多的精力,为提
随着认知无线电的出现,有关频谱检测算法的研究越来越多。但随着无线通信技术的飞速发展,信号带宽越来越宽,现有的采样硬件已不能满足采样速率的要求。同时,无线通信应用场景
显微拉曼光谱技术因高分辨率、无损非接触等特点,成为微尺度力学测量领域的有力工具。针对该技术不适用于非拉曼活性材料的局限,一些研究者将具有拉曼活性和应力/应变敏感性
IMS将核心网统一到IP分组网络,使得所有人都可以从互联网访问到它,但是在全IP化带来巨大便利的同时,也导致IMS网络面临严峻的安全挑战。为了应对这些挑战,SBC设备被部署到IMS
随着无线通信技术的发展,用户业务需求种类呈现多样化,全球移动数据量呈指数急剧增长。作为5G移动网络的关键技术之一,异构网络部署成为下一代无线网络增加网络容量和覆盖度