快速音频指纹搜索算法研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:kekedehome
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音频指纹是指从一段音频采样中提取的独特的信息,可以用于辨识不同的声音采样,是一项基于内容的识别技术。从相同采样不同编码格式的音频文件提取的音频指纹信息是相似的。   以音频文件为例,即使其中的文本信息(例如文件名等)改变了,或者文件稍微改动,甚至文件经过解码再编码,只要音频内容总体不变,那么从这文件提取出来的音频指纹信息是相似的。   基于这个音频指纹信息,可以辨别音频内容基本相同,但文件不完全相同的音频文件。   音频指纹技术主要有两方面应用:提供一种新的辨别音频文件的方法;商业用途广泛,例如:盗版监控等。   本文工作成果:   提出了创建音频指纹数据库,以及音频指纹检索的流程。   基于开源项目FFmpeg,根据本项目实际需求实现了一个解码器。   基于开源项目foosic,根据本项目实际需求实现了音频指纹提取算法。   提出了一种新的音频指纹检索策略。在音频指纹检索模块中,提出并实现了一种新的音频指纹数据处理算法:求和算法。完成了一个具有实际应用价值的音频指纹检索系统。   本检索系统的功能:用户输入一个歌曲片段,在支持的范围内,无论其编码格式或采样率为何种形式,系统都能够通过查找近似音频指纹来找到该歌曲的相关信息。   本系统有137346首歌曲数据。能支持wav, mp3,wma三种编码格式。   本系统与foosic开源项目的系统做了一个对比测试。实验结果表明,在以foosic系统性能参数为100%的情况下,本文系统仅需3.72%的时间(约88ms),而达到95.92%(相对于foosic算法)的检索正确率(约91%)。
其他文献
现存的交互式英语口语练习平台存在功能缺失,不能满足用户口语练习需求等问题.基于此情况,笔者提出优化口语练习平台的方案,其以满足学习者的口语训练需求为原则,结合平台提
垂直腔面发射激光器(VCSEL)由于其良好的光束特性在激光泵浦、激光医学、激光显示、高密度数据存储等很多领域都具有广阔的应用前景,但较小的输出功率是制约其应用的一个重要
学位
微加速度传感器作为一种惯性器件在汽车、电子、导航、石油探测和地震预报等领域有着广泛的应用。压阻式微加速度传感器因具有线性度好、易于小型化、频率响应特性好、直接输
学位
价格新常态是PPI、生产资料价格长期下降,CPI持续温和上涨,食品、居住、服务价格刚性上涨。因此,应定量分析三类价格刚性上涨明显掩盖经济通缩程度。当前,通缩判定标准需上调
MIMO-OFDM技术提供了高频谱利用率和抗多径干扰的良好特性,已经成为下一代宽带无线通信系统的主流技术。随着军事通信的发展,战场通信传输的主要业务逐渐由话音转向数据,如数据
先进的半导体制造技术让人们可以设计并且生产自然界中并不存在的光学材料。这些人造的纳米材料,在另外一方面,也催生了纳米光学和生物光子学。这两门学科主要研究纳米材料的宏
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
在当今的视频监控领域中,智能化是继数字化与网络化后的又一主要发展趋势。视频场景的智能分析通过数字图像处理和分析来理解视频画面中的内容,可以自动的抽取和分析视频源中的
基于TMS320DM642的视频处理方案是数字信号处理领域十分成熟、应用十分广泛的技术,最常见的应用是流媒体技术,该技术包括网络、解码与视频输出模块。同时,为了使人机交互界面更
目前关于植入式系统的应用研究非常活跃。对于一个植入式系统而言,电源是设计中所要着重考虑的。由于使用寿命的问题,电池在植入式系统的应用中不是最佳选择。近年来,很多植入式