基于内容的海量音频智能检索与重复性检测

来源 :太原理工大学 | 被引量 : 12次 | 上传用户:wqra555551q
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的发展和计算机处理能力的提高,使得我们面临着“信息海洋”的时代,尤其是对于音频信号这种非结构化数据的存储量越来越多,对其存储与管理的需求也越来越大。传统的基于文本的音频检索技术是指利用与音频内容相关的文本关键词作为查询输入,输出音频的完整信息。它需要人工对音频所表示的含义进行文本标注,存在主观性和不完整性,因此无法准确描述音频信息中所蕴含的丰富的语义信息及内容的感知信息,也不能够满足在海量音频数据的环境下对音频内容快速高效的检索要求。基于内容的音频检索是指通过对音频数据中的旋律、音调、响度等音频特征的详细分析,使与查询输入不同的音频数据具有不同的语义,而具有相同语义的音频在听觉感知上保持相似。不仅避免了基于文本检索的诸多弊端,也能够适应海量音频环境下的检索需求,成为很多国内外学者的研究重点和热点。本文在认真总结国内外学者研究成果的基础上,重点针对基于内容的音频检索相关技术进行了讨论,并在Philips指纹提取技术的基础上,重点围绕音频特征分类与索引技术进行了研究,对音频的相似度量方法进行了合理的选择,最后结合Filter-and-Refine框架模型在提高音频检索准确率的基础上,加快检索速度,同时能够支持实时音频检索。实现了在普通配置的PC机上从13W条音频库中进行音频片段检索的平均速度在1s内,检索召回率达到95%以上,检索准确率达到97%以上,对于互联网时代下的音频数据访问服务有重大意义。本文的主要工作及研究成果如下:1.对音频信号的基本数字特征做了简要阐述,重点对本文用到的帧特征和段特征分别进行了说明,选取了Philips指纹提取技术作为研究基础,结合ABV算法设计并实现了对音频指纹的压缩和分类,能够在短时间内对不相关的音频进行快速过滤处理,减少了匹配计算量。2.对FNV的哈希算法进行改进,使用混合哈希算法对提取的音频指纹建立哈希索引表,使得其对音频指纹的散列分布性好,抗冲突性强,计算效率高。3.结合Filter-and-Refine框架实现了层级过滤音频检索系统,加快了过滤速度,提高了匹配效率。
其他文献
中国文化具有鲜明的地域性特色1。一方水土养育一方人民,一方人民拥有一方文化,而这种文化就是我们所说的地域文化。在我国博大精深的地域文化中,有许多的因素决定了其强烈的地
[病例1]一个半圆的半径是8cm,这个半圆的周长是多少?
儿子从国外回来探亲。他很久没有看到儿子了,只见儿子又长高长结实了。一家人很开心地坐在一起唠嗑着。谈着说着,他忽然仿佛想起了什么,问道,孩子,这些年
说来也奇怪,“普天之下,莫非王土”,拥有全天下财富的皇帝,却有热衷于做买卖赚钱的,你相信吗?  中国的历史上,确实就有这样的皇帝。南朝萧齐时代的皇帝萧宝卷就曾在宫苑之内建了一个集市,命令宫女、太监们扮作小摊小贩和往来的客人,让他最宠爱的妃子潘玉奴做市场主管,自己则担任一名抄写文件的小吏,同时客串肉铺的伙计,工作之余坐在肉铺里切肉。无论是谁——包括皇帝本人,一旦工作出现失误,都会遭到身任市场主管的潘
生态补偿机制一种有效解决生态文明建设与经济建设矛盾的方法。本文以农户的视角,通过案例分析的方法,对海南省白沙黎族自治县生态补偿机制的现状进行分析,发现白沙黎族自治
在景德镇有一个人,人们不是通过印刷精美的卡纸式的名片来了解他,而是通过他的陶瓷作品来认识他、熟悉他、仰慕他,称其为——
丁酉逢世,却给景德镇瓷坛一声沉重的闷雷。中国工艺美术大师、景德镇著名陶瓷美术家王隆夫、戴荣华俩老溘然逝世。惊悉之际,闻者无不唏嘘。为缅怀一代宗师,特将本刊二十年前
微藻广泛存在于各种水体环境中,作为初级生产者,在水生生态系统中是物质循环与能量流动的重要组成部分。文章结合微藻的功能、微藻类型、微藻处理氮磷机理等相关研究进展,探
全纳教育的理念正逐渐为人们所接受并已在很多国家付诸实施。学前教育是全纳教育的起点,幼儿园教师的素质决定着学前阶段全纳教育的质量,教师的教育观念、专业知识与技能,决