音频样例检索的索引方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ltsomeday
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着二十世纪信息技术、多媒体技术和网络技术的快速发展,多媒体信息的数据量急剧增多。为了充分利用已有的音频信息资源,音频样例检索技术受到越来越多的关注。音频样例检索是通过用户提交查询样例,然后从音频数据库中检索出具有相似内容的音频信息并反馈给用户实现的。在音频样例检索应用中,速度是重要的评价指标。为了提升音频样例检索的速度,本文对音频样例检索的索引方法展开研究,具体内容如下:(1) Philips方法的查全率难以满足检索应用的需求,其查全率与音频指纹的提取过程直接相关。Phililps方法的检索速度与音频库的规模相关,当音频库的规模较大时,检索的时间消耗会大幅度增加,检索的主要时间代价在于每次定位后都需要进行误码率计算。针对上述不足,给出了指纹提取过程优化和检索优化方法。(2) Philips方法利用能量特征进行二值量化,考虑到时域对不齐带来的不良影响,选用了大帧叠,小帧移,导致指纹提取的时间消耗过高。频谱质心是能量在频率上的加权均值,能够更好刻画频谱特性。利用频谱质心特征,提出了基于频谱质心的音频指纹索引方法(NSSCFP),通过小帧叠进行指纹提取,大幅度降低了指纹提取速度。(3)基于哈希表的音频索引方法是通过对音频信号提取二进制指纹序列实现的,表现出较好的性能和速度。现实中的音频数据容易受噪声等干扰,导致提取的音频指纹易发生畸变,需要近邻检索。而哈希表从结构上看,不适合近邻检索。针对上述不足,提出了基于m叉平衡树的音频索引方法,通过层节点扩展实现了近邻检索,有效提高了检索应用的性能和速度。
其他文献
当前,网络和多媒体技术迅猛发展,多媒体信息急剧增长,网络多媒体数据中数据重复现象很常见,尤其是一些大型多媒体分享网站中,用户上传了大量重复的多媒体数据。重复数据不仅增加了
随着网络规模的增大及其相关技术的发展,越来越多的用户在网络上进行信息的交流,数据的传输等活动,享受着网络带给人们的服务和便利。应用在对等网络上的软件更新技术也逐渐取代
随着Internet的普及和信息技术的发展,微博用户人数迅速增长,微博数据呈爆炸式的增长。当用户登陆进微博之后所面对的就是大量的更新微博,使用户完全被眼前多种多样的微博信息所
视频中人工文本是由制作人员在影片制作后期手工添加的,用来补充说明图像内容的文本字符。人工文本与图像内容的联系紧密,使得它对图像内容的说明以及检索有着十分重要的意义,因
工业无线技术是一种面向设备间短距离、低速率信息交互的无线通信技术,是无线传感器网络技术在工业领域应用的具体化和实例化应用。工业无线传感器网络利用工业无线技术实现了
偏好处理是人工智能中的一个重要的研究内容。CP-nets(conditional preference networks,条件偏好网)是一个带标记的有向图,它编码相关变量之间的偏好关系。作为一种简单直观
随着互联网技术在众多领域飞速地发展,网络数据的存在形式也呈现出多样化的趋势。其中,数据流作为一种新型的数据形式已在众多应用领域广泛地出现。例如,传感器网络环境中的
随着嵌入式技术和无线通信的快速发展,无线传感器网络及其应用广泛应用于军事、环境监测和医疗救灾等领域,人们对于其性能等要求也越来越高。一般网络部署节点众多,环境复杂,且由
近年来,随着计算机处理能力的不断提高,互联网技术取得了飞速发展,各种基于Web2.0技术的新兴网络应用的出现使得越来越多的数据被收集和整合在一起,互联网中的网页数目激增。在当
伪随机数发生器在计算机仿真和信息安全领域都有着广泛的用途,伪随机数序列的随机性、不可预测性以及产生速率对应用系统的效率和安全性具有重要价值。本文设计了一种基于超素