基于内容的音频检索技术研究

来源 :北京邮电大学 | 被引量 : 9次 | 上传用户:caonisbma
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年随着多媒体数据成指数级的增长,对于多媒体信息的检索就变得越来越迫切。音频检索技术在相当多的领域都具有极大的应用价值,例如远程教学,卫生医疗,数字图书馆,环境监测,新闻节目检索和娱乐节目的编辑和制作等。本文围绕音频检索的两个分支语音检索和音乐检索进行了探索性的研究。主要工作可以归纳为以下三个部分。基于音节混淆网络的STD检索。利用语音识别技术将广播语音文件转换为混淆网络格式的文本,利用文本检索的相关技术,查询输入的关键词,返回对应的语音文件及其时间信息。通过实验,分析了不同剪枝策略对于系统性能的影响。MIDI音乐的哼唱检索。分析MIDI格式的音频,提取音频中的旋律信息。利用基频提取算法对哼唱查询片段进行旋律提取,并与数据库中音频的旋律进行相似度计算,按相似度高低返回查询结果。通过实验,分析了不同匹配算法对于系统性能的影响。基于声纹的样例检索。采用图形学的相关算法,对查询样例的语谱图提取特征点,利用Hash结构进行特征点匹配,返回相似音频。通过实验,分析了不同的索引结构以及特征提取算法对系统性能的影响。最后,对全文进行总结,并对基于内容的音频检索的前景进行了展望。
其他文献
黄永玉,著名画家。1924年出生在湖南省凤凰县城沱江镇。曾任中央美术学院教授、中国美术家协会副主席。他设计的猴票和“酒鬼”酒包装家喻户晓。博学多识,诗书画俱佳,亦是诗
循环流化床锅炉(CFBB)燃烧控制系统是一个分布参数、非线性、时变、大滞后、多变量紧密耦合的被控对象,燃烧控制难,自动投运率低,实际运行中主要依靠手动控制。本文主要进行
近年来,我国进入高速铁路快速建设和开通阶段,一大批跨越南北、横亘东西的高速铁路线路相继开通运营。同时,我国幅员辽阔,气象、地形、地貌和地质差异很大,高速铁路从寒冷干
西藏和平解放以后,党中央历来重视西藏的稳定和发展,先后多次专门召开西藏工作会议,确立了内地各省市对口支援西藏的政策。正是在这样一个大好的外部环境下,西藏的社会经济进入了高速发展的时代。  然而,西方反华势力丝毫没有放松对西藏的破坏和分裂活动,以十四世达赖为首的分裂势力不愿意看到西藏的繁荣与发展,不愿意看到西藏安定繁荣的大好局面。“中国越发展越强大,西方敌对势力、境内外分裂势力越不甘心于他们的失败,
城市轨道交通具有客运量大、快速、便捷、准时等诸多其他出行方式无法替代的特征,成为当今世界缓解城市交通拥堵最有效的出行工具并逐渐成为现代城市公共交通体系的主导。城
只要人类社会存在,就有传媒实践活动;传媒实践活动没有止境,创新就没有止境。现代社会,创新已成为一个国家、一个民族生存和发展的决定性因素。传媒在营造利于人们创新思维、
现在很多地方都在推行学分制和素质教育,对于学分制能否顺利开展,能开展多久,效果如何,很多人也就此提出了疑问。
京津冀一体化发展的大背景下,物流一体化成为物流产业和区域经济发展的重要内容。作为京津冀物流一体化发展的关键内容,物流网络优化的核心,也即物流网络节点优化布局,应当予
随着科学技术的不断发展,城镇现代化建设取得了长足的进步,为了打造健康、和谐、绿色、开放、共享的新型城市,越来越多的城市公园出现在人们视野中。这些城市公园不但改善了
本刊讯浙江新闻界11月8日在杭州召开全省新闻宣传“创新年”活动经验交流会,以研讨交流新闻改革创新经验、检阅创新成果的方式欢度第九个中国记者节。会议认为,今年以来,我省