快速音频指纹搜索算法研究

来源 :北京大学 | 被引量 : 0次 | 上传用户：kekedehome

【摘要】

：

音频指纹是指从一段音频采样中提取的独特的信息，可以用于辨识不同的声音采样，是一项基于内容的识别技术。从相同采样不同编码格式的音频文件提取的音频指纹信息是相似的。　　

【作者】

：

关耀铧

【机构】

：

北京大学

【出处】

：

北京大学

【发表日期】

：

2009年期

【关键词】

：

音频指纹搜索算法编码格式数据库技术

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

音频指纹是指从一段音频采样中提取的独特的信息，可以用于辨识不同的声音采样，是一项基于内容的识别技术。从相同采样不同编码格式的音频文件提取的音频指纹信息是相似的。　　以音频文件为例，即使其中的文本信息（例如文件名等）改变了，或者文件稍微改动，甚至文件经过解码再编码，只要音频内容总体不变，那么从这文件提取出来的音频指纹信息是相似的。　　基于这个音频指纹信息，可以辨别音频内容基本相同，但文件不完全相同的音频文件。　　音频指纹技术主要有两方面应用：提供一种新的辨别音频文件的方法；商业用途广泛，例如：盗版监控等。　　本文工作成果：　　提出了创建音频指纹数据库，以及音频指纹检索的流程。　　基于开源项目FFmpeg，根据本项目实际需求实现了一个解码器。　　基于开源项目foosic，根据本项目实际需求实现了音频指纹提取算法。　　提出了一种新的音频指纹检索策略。在音频指纹检索模块中，提出并实现了一种新的音频指纹数据处理算法：求和算法。完成了一个具有实际应用价值的音频指纹检索系统。　　本检索系统的功能：用户输入一个歌曲片段，在支持的范围内，无论其编码格式或采样率为何种形式，系统都能够通过查找近似音频指纹来找到该歌曲的相关信息。　　本系统有137346首歌曲数据。能支持wav， mp3，wma三种编码格式。　　本系统与foosic开源项目的系统做了一个对比测试。实验结果表明，在以foosic系统性能参数为100％的情况下，本文系统仅需3.72％的时间(约88ms)，而达到95.92％（相对于foosic算法）的检索正确率(约91％)。

其他文献

基于现存交互式英语口语练习平台的优化方案理论支持与探究

现存的交互式英语口语练习平台存在功能缺失,不能满足用户口语练习需求等问题.基于此情况,笔者提出优化口语练习平台的方案,其以满足学习者的口语训练需求为原则,结合平台提

期刊

交互式优化方案理论基础语言输入假说交际法联想教学法

光泵浦垂直外腔面发射激光器及电泵浦面发射激光器列阵的研究

垂直腔面发射激光器(VCSEL)由于其良好的光束特性在激光泵浦、激光医学、激光显示、高密度数据存储等很多领域都具有广阔的应用前景，但较小的输出功率是制约其应用的一个重要

学位

垂直腔面

“L形梁—质量块”结构压阻式微加速度传感器研究

微加速度传感器作为一种惯性器件在汽车、电子、导航、石油探测和地震预报等领域有着广泛的应用。压阻式微加速度传感器因具有线性度好、易于小型化、频率响应特性好、直接输

学位

微加速度

新常态下通缩判定标准研究

价格新常态是PPI、生产资料价格长期下降,CPI持续温和上涨,食品、居住、服务价格刚性上涨。因此,应定量分析三类价格刚性上涨明显掩盖经济通缩程度。当前,通缩判定标准需上调

期刊

价格刚性常态价格新常态经济通缩标准研究通缩判定标准通货紧缩定量分析居住价格测算结果

战场环境下MIMO仿真平台的搭建

MIMO-OFDM技术提供了高频谱利用率和抗多径干扰的良好特性，已经成为下一代宽带无线通信系统的主流技术。随着军事通信的发展，战场通信传输的主要业务逐渐由话音转向数据，如数据

学位

军事通信军事通信无线通信无线通信MIMO-OFDM技术MIMO-OFDM技术仿真平台仿真平台频谱利用率频谱利用率空时编码空时编码信道模型信道模型

人工纳米材料的光学性质研究

先进的半导体制造技术让人们可以设计并且生产自然界中并不存在的光学材料。这些人造的纳米材料，在另外一方面，也催生了纳米光学和生物光子学。这两门学科主要研究纳米材料的宏

学位

生物光子学量子点光子晶体纳米材料光学性质

创业板市场投资者适当性管理工作简要回顾

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

创业板适当性中国证券业协会深圳证券交易所证券业必备条款证监会网上远程新闻会客厅会员管理

基于DM642平台的嵌入式智能视频监控系统

在当今的视频监控领域中，智能化是继数字化与网络化后的又一主要发展趋势。视频场景的智能分析通过数字图像处理和分析来理解视频画面中的内容，可以自动的抽取和分析视频源中的

学位

背景模型H.264标准DM642平台嵌入式系统智能视频监控系统码率控制

基于DM642的模拟显示中文流媒体终端

基于TMS320DM642的视频处理方案是数字信号处理领域十分成熟、应用十分广泛的技术，最常见的应用是流媒体技术，该技术包括网络、解码与视频输出模块。同时，为了使人机交互界面更

学位

数字信号处理解码协议视频处理流媒体终端

适用于植入式系统的无线能量和信号传输系统的研究与设计

目前关于植入式系统的应用研究非常活跃。对于一个植入式系统而言，电源是设计中所要着重考虑的。由于使用寿命的问题，电池在植入式系统的应用中不是最佳选择。近年来，很多植入式

学位

无线能量传输电感耦合MEMS电感植入式系统E类功率放大电路

快速音频指纹搜索算法研究

与本文相关的学术论文