基于音频指纹的分片音频检索算法的研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:cstmddn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,多媒体信息尤其是音频信息呈现出爆炸式增长。传统的基于文本的检索方法已经不能满足人们对音频信息检索的需求。基于音频信号的音频检索技术的研究正在快步推进,尤其是音频指纹检索技术是研究的热点,音频指纹是从音频信号中提取的一段数字摘要,比较的是其相应较小的数字指纹,而不是直接比较很大的音频数据本身。因此,音频指纹检索技术不仅能大大减少搜索量,而且能够显著的提高检索效率。随着技术发展,其应用场景已经进入音乐检索、版权保护、广告监播、电视互动等各种领域。因此,对音频指纹检索技术进行研究有很大的意义。本文以Shazam算法为基础,通过对音频指纹提取过程进行分析,提出了改进的音频指纹提取算法,提高了音频检索的准确率。在改进音频指纹提取算法的基础上,提出了分片音频检索算法,在保证了检索准确率的同时,大大缩短了检索时间。主要工作如下:提出了一种基于三角组合的音频指纹提取算法。详细分析Shazam算法中音频指纹提取过程的优缺点,针对Shazam算法中将频谱峰值点进行点对组合构成音频指纹,优化为一个锚点对应两个目标峰值点组成三角组合,以此构成音频指纹。这样不但可以增加指纹信息量,减少提取的指纹量,而且更加增强了音频指纹的鲁棒性,从而提高了音频检索算法的准确性和鲁棒性,并且通过仿真实验证明了该改进算法较高的检索性能。提出了一种基于音频指纹的分片音频检索方法。该方法以改进的音频指纹提取算法为基础,对音频指纹提取和匹配过程进行优化,利用音频分片和匹配阈值的思想,将较长待检音频片段进行分片,对分片进行音频指纹提取和匹配,若匹配值大于匹配阈值,检索结束,就不用对剩余的分片进行任何处理,否则,就需要使用其他分片。该改进方法,在保证比较高的准确率的同时,能在很大程度上缩短检索时间,最后通过仿真实验也证明了该结论。
其他文献
为了适应高海拔地区的极端环境,高原动物进化出了一些典型的解剖学和生理学特征,包括更大的肺脏和心脏、迟钝的缺氧性肺血管收缩、更大的血流量以及更强的代谢能力。近年来,
随着教育事业的发展,如何引导小学生养成良好的学习习惯,是小学教师应重点考虑的问题。良好的学习习惯是推动学生长远发展的重要前置条件,小学教师应明确自身肩负的社会责任,
1 引言小波包[1]由于拥有优良的特性而受到人们的关注,它已被应用在信号处理[2],图像压缩[3],编码理论[4]等工程方面,我们知道,由L2(R)中的函数生成的正交小波基具有较差的频率局部
本文阐述了RFID技术在医药、制造业及建筑等相关产品质量追溯方面的研究与应用现状,研究了基于RFID技术的建筑部品质量追溯系统中用户端、RFID系统以及数据库的功能特点和组
改革开放以来,我国中小型企业不断成长、壮大,成为最为活跃、经济效果非常明显的经济组织。本文首先分析了中小企业行业分布现状,针对分布数量最多的前十个行业,我们做了具体
介绍了美国ROBBINS公司生产的EPB6260盾构机的推进、铰接两大主要液压系统的原理、特点、工作方式,及其与盾构推进控制的联系。有助于盾构机设计与使用者更好了解液压系统工
针对目前重金属检测操作复杂,成本较高,测量结果随温度变化波动较大的问题,研制一套水环境重金属检测系统。该系统以三电极电化学传感器为感知单元,将无线传感器模块与传感器
与游乐设施的设计和制造质量相比,管理不善导致的游乐事故要多得多,另外一些游玩者自身安全意识的缺乏也会让本来安全的游乐设施项目变成伤人甚至是杀人的机器。游乐设施质量之灾  大型游乐设施出事故,有的直接是因为设备质量问题所致。2009年8月深圳华侨城的“太空迷航”惨剧发生以后,集合多个方面专家的调查组在长时间调查后得出结论:“太空迷航”设备存在严重的设计缺陷,该设备存在局部制造缺陷。  5号座舱支承系
报纸
汽车在使人类社会交通更加便捷的同时,却也不可避免地带来了环境的污染。康宁公司在30多年前发明了用于汽车上的催化转化器的蜂窝陶瓷载体,以及后来的微粒捕集器,致力于净化人类
传统上把隐喻作为修辞研究的范围,无论是亚里士多德的“对比论”,还是昆提良的“替代论”都将隐喻看作是词语层次上的一种修辞方式。随着当代认知语言学的兴起,20世纪70年代被称