基于哼唱的MIDI音乐检索系统的研究

来源 :西安建筑科技大学 | 被引量 : 0次 | 上传用户:blackcat
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在科技及网络的不断发展,多媒体技术及设备数量飞速增长的环境下,音频数据作为多媒体数据的重要组成部分,其信息量也在不断的增长。在海量音乐数据库,传统的音频检索方式给用户的使用带来种种的限制,用户已经不满足于这种基于文本的音频检索,这对音乐检索提出了更新、更高的要求。自然、方便、有效的哼唱音乐检索是一种基于内容的音乐检索方式,有着广泛的应用前景和重要的研究价值。该方式允许用户以哼唱的形式来检索所需的歌曲,用户无需记住歌曲的名字、演唱者或者歌词,只要哼出歌曲的旋律就能找到想要的歌曲。本文对MIDI音乐数据库的哼唱音乐检索系统的关键技术进行了研究,主要有三个方面:MIDI音乐数据库的旋律特征提取、哼唱特征提取和音乐旋律匹配算法。针对这三方面,本文做了以下工作:1.选择MIDI格式作为音乐文件格式,分析了解MIDI文件的结构,实现从MIDI音乐库中提取音乐的旋律信息。2.详细分析几种基音提取算法。为了保证系统的时间复杂度较低和算法精度较高,本文对哼唱语音信号用两层BP神经网络进行切分音符及清浊音区分,阐述平均幅度差函数法和自相关函数法的优缺点并进一步改进,得到更精确的基音周期,从而提取音高和音长,生成哼唱的旋律特征,为后续的匹配算法做好准备工作。3.分析几种传统的旋律匹配算法的优缺点。结合本系统对准确度及速度的要求,本文建立基于音高差隐马尔科夫模型加权音长比来匹配,最终得到最佳匹配音乐。最后本文针对基于哼唱的MIDI音乐检索系统进行实验验证,对其进行抗噪性分析并与其他论文进行对比,结果表明该系统的检索具有较高的准确性和实用性。
其他文献
近年来,多媒体数字集群在各行各业发展迅速,为了使数字集群系统在建设的时候更加方便灵活,基于Ad Hoc临时组网的集群通信系统将成为该领域一个新的研究方向。本文的主要工作是深
本文对WCDMA增强型上行链路(Uplink Enhanced On Wideband Code Division MultipleAccess)的关键技术进行研究,着重对WCDMA增强型上行链路的分组调度、HARQ(HybridAutomatic Repe
当前安检的需求对相应的技术提出了全新的要求,一方面需要快速、实时地检测出被检人员携带的隐匿危险物品;另一方面要求安检系统安全、无辐射,同时让被检人员感觉个人隐私不
为了在现有通信网络条件下获得宽带语音音质,人们提出人工语音带宽扩展技术,该技术仅利用窄带语音信息来重建宽带语音信息的。传统的语音带宽扩展方法需要将窄带码流完全解码
随着互联网和多媒体技术的发展,无线通信中的宽带高速数据通信服务的需求正在不断地增长。但是可用的无线频谱资源是有限的,高数据速率只能通过高效的信号处理来实现。信息论领
面对日益稀缺的频谱资源,认知无线电作为一种潜在的解决方案被提了出来。其核心思想是让次用户(secondary user)自适应地使用主用户(primary user)未用的频谱,即白空间(white s
全球移动通信系统已经历了三代,目前正在研究第四代(4G)。LTE-Advanced是3GPP为满足国际电信联盟对4G移动通信标准IMT-Advanced要求而提出的,其性能在峰值速率、频谱效率、时延
林肯实验室提出了针对合成孔径雷达(SyntheticApertureRadar,SAR)自动目标识别系统的三级处理流程,即检测阶段(预筛选)、鉴别阶段、分类阶段。为了实时处理SAR图像数据,有效地发现
在高密集度的无线网络中,干扰问题已经是抑制系统容量的一个关键因素。单小区技术会将小区间干扰(ICI)作为噪声处理,而多小区协作技术通过基站间的协作能够有效利用小区间干扰,提
随着雷达系统与电子侦察接收机的相互角逐,任何一方技术的进步必然会促进另一方的飞速发展。准连续波雷达是一种新体制雷达,因其具有一系列优点而被国内外专家学者重点研究,