【摘 要】
:
随着现代信息技术、多媒体技术和网络技术的迅速发展,多媒体信息的数据量急剧增多。为了充分利用已有的音频信息资源,基于内容的音频信息检索技术受到越来越多的关注。基于内
论文部分内容阅读
随着现代信息技术、多媒体技术和网络技术的迅速发展,多媒体信息的数据量急剧增多。为了充分利用已有的音频信息资源,基于内容的音频信息检索技术受到越来越多的关注。基于内容的音频检索研究是一种涉及音乐理论、信号处理、模式识别等相关领域的综合学科研究,其在音乐数据库管理、Internet音乐检索以及生活娱乐等方面都具有非常重要的意义。整个基于内容的音频检索系统可以分成两大部分,一是音频特征提取,二是音频特征搜索。由于音频特征搜索主要依靠特征提取得来的数据,本文将主要围绕基于内容音频检索特征提取技术展开研究工作。本文首先介绍了基于内容的音频检索系统框架以及相关的特点难点,然后说明了该系统框架内语音平台上人声哼唱特征处理流程。接下来在乐音平台上,本文结合音频信号的相关特征,分别基于时域和频域对有背景音乐的歌曲进行研究分析,提出了三个新的乐音基音特征提取方法。前两种方法是时域上的基音提取算法,是在前人的研究成果上做的改进,从而进一步提高乐音基音特征提取的准确率;第一种是基于音阶的时域乐音基音特征提取方法,该算法引入乐理音阶的属性,通过对于浊音能量模型的建立和研究,选择了峰值滤波器滤取各倍频点能量值进行比较判决,解决了平均幅度差函数(AMDF)算法提取效率不高的问题;第二种算法以人声特征着眼,结合简化逆滤波算法(SIFT),以开环-闭环基音提取为框架进一步提高基音提取的准确率。第三种则是通过对MP3解码过程中频域上数据的特征研究,提出的一种崭新的直接在频域上提取基音的算法,具有更大的应用前景。其与时域基音提取算法具有不相上下的提取效果。本论文为基于内容的音频检索特征提取工作提供了一定的研究思路,对进一步的深入研究具有借鉴意义。
其他文献
时域有限差分法(Finite Difference Time Domain,FDTD)作为一种灵活有效的数值计算方法,被广泛应用于解决各种电磁仿真问题中。然而在实际应用时,由于传统FDTD算法的显式差分特
随着信号处理技术和微电子技术的飞速发展,数字波束形成(DBF)技术在现代雷达和通信系统中的应用越来越广泛。本文开展了基于多片DSPs的并行处理器的研制工作。本文的主要贡献
高质量低码率的压缩技术一直语音和音频编码孜孜以求的目标。语音编码技术可以达到非常低的编码速率,但只能处理窄带语音信号。而音频编码技术虽然可以达到很好的音质效果,但
正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)是一种将载波分割为若干相互正交的子载波,克服多径传播引起的频率选择性衰落和码间干扰的多载波调制技术。
随着计算机性能和仿真技术的提高,计算机仿真技术得到越来越广泛的运用。OPNET是一种具有高可靠度的网络建模、设计、仿真和分析工具。本文首先介绍了基于OPNET建立的UMTS仿
随着社会经济和计算机网络的快速发展,依赖计算机网络传输信息成为社会发展的趋势,而网络进行信息传输时存在着隐患,信息安全传输成为当前人们越来越关注的问题。而密码学技
氢气是一种新型的清洁能源和重要的化工原料,具有燃烧值高、环保、可循环使用、资源丰富等诸多优点,被广泛应用于冶金、化工、航空、航天等重要工业、国防领域。然而,氢气也是
随着无线通信技术的发展,业务种类和数据量急剧增加,使得有限的频带资源变得更加紧张。在无线IP网络里,对数据包进行压缩,可以提高频带资源的利用率,有两种方法可以对数据包
LDPC(Low-Density Parity-Check Codes,低密度校验码)是一种能逼近Shannon容量限的渐进好码,其长码性能甚至超过了Turbo码。由于低密度校验码具有译码复杂度低、错误平层低等
远程教育知识管理学习平台是为远程网络培训提供稳健的软件支撑环境和丰富的课件资源,为干部学习提供一条全新的途径。这将对更新干部学习理念,提升干部知识和能力有着十分重