基于稀疏分解的音频场景识别方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：PILIYADAN

【摘要】

：

现在人们已经进入了信息化时代，并且随着科技的发展，信息在人们平时的生产和生活中变得越来越重要。这些信息以不同的方式出现在我们的生活中，如何将这些信息加以良好的有效的利

【作者】

：

刘柳

【机构】

：

哈尔滨工业大学

【出处】

：

哈尔滨工业大学

【发表日期】

：

2012年期

【关键词】

：

识别模型稀疏分解音频场景识别音频处理

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

现在人们已经进入了信息化时代，并且随着科技的发展，信息在人们平时的生产和生活中变得越来越重要。这些信息以不同的方式出现在我们的生活中，如何将这些信息加以良好的有效的利用，是信息化时代赋予我们的重要使命。在这些信息中，音频信号又是其中一个不可或缺的重要组成部分。网络多媒体以及数字信号处理技术现在已经有了长足的进步。音频信号作为数字信号的一部分，其规模也日益增长。然而，对越来越多的音频数据及其中包含着的海量信息而言，如何从中找到我们感兴趣的内容，是一个难点问题，也是一个亟待解决的问题。常规人工检索的方式显然无法有效处理网络中多模态的海量规模的音频数据，所以我们需要有效的技术手段来实现音频数据自动处理和内容分析识别。而这些技术手段必将可以有效支撑现实中的各类智能系统的音频处理需求。音频场景识别是通过对音频信号中所包含的声学事件进行检测分析，从而对音频进行语义内容的理解，进而达到识别出特定的音频场景的目的。所谓音频场景是指包含特定语义的某个音频数据片段，这个语义往往具有很强的代表性和区分度，是人类分析和区别音频内容的重要依据和手段，在现实中有很多重要的应用。音频场景的识别，主要依靠提取出来的音频信号特征，和音频场景的识别模型，来识别出表征该场景的语义标签。提取一个有优良效果的音频信号特征,对音频场景的识别有很大帮助。在特征的数据分析方面，根据成分分析的思想，可以对音频信号的声学特征加以优化。本文使用稀疏分解的理论，提取出了一种音频信号的稀疏特征，这种特征具有长时的性质，在音频场景识别方面具有良好的效果。随后使用成分分析的思想，对特征进行加权优化。该方法可以获取音频信号特征中的关键成分。本文使用的稀疏分解思想，是一种信号处理的方式，最初主要应用于图像信号的处理中。在人们使用非冗余正交变换进行数据表示时，发现了很多的问题。如一些信号本身就是很多复杂的信号的混合体，在单一的正交变换中不能得到很好的表示。稀疏表示是使用一种过完备冗余函数系统的原子库来代替基函数进行数据表示的方法。其中原子是原子库中的元素。选择出原子库中的m个原子对原始数据信号进行最佳表示，就是数据信号在原子库上的稀疏分解。根据信号的稀疏分解理论，本文提出了一种新的音频场景的识别方式。首先对目标场景和集外场景分别训练原子库，并将得到的原子库组合。然后将待识别的音频信号特征在组合得到的原子库上进行稀疏分解。对稀疏分解中的原子来源进行分析，通过这些原子的是否为目标场景原子库中的原子来进行投票，来判断该音频信号的场景归属。本文的实验语料来源于网络上的真实音频数据。并将实验结果与现有的一些音频场景识别模型的识别结果进行了对比，从而更全面的展现出实验的情况，使实验结果更具有说服力。最后对实验结果进行分析，并总结研究收获。对本文中可以继续改进和完善的地方进行了展望。

其他文献

SaaS型运输服务系统及路线规划问题研究

随着现代社会中的运输服务市场的不断发展和扩大,并在现代商业中占有重要地位。各运输公司均需要一些软件来实现运输,需求和客户的管理。本文主要目标是创建一个结合运输管理

学位

SaaS技术运输服务系统路径规划

基于图像配准的纸币分析技术研究

纸币图像分析的目的就是通过对纸币图像进行分析和理解，来高可靠性的对纸币进行分类、有效的检测出纸币的真伪、新旧和残缺，保证市场上流通纸币的安全性和整洁性。很多国家对市

学位

纸币分析图像配准特征提取防伪特征检测

面向软件错误定位的测试用例选择方法研究

随着人们在日常生活中对计算机软件的需求不断增长，计算机软件系统的规模和复杂度也在不断的攀升，而对大规模复杂系统的测试和维护等需求超出了目前的测试与维护技术，因此也就出

学位

错误定位测试用例选择路径信息分支特征聚类

基于网络模拟的拓扑划分评价模型研究

随着互联网的迅速发展，网络规模急剧增大，结构日趋复杂，大规模网络已经成为网络研究的热点。网络模拟能够研究复杂网络行为，评价尚未实施的网络协议，具有成本低，易使用、模拟真实性

学位

并行模拟拓扑划分评价模型模拟运行时间优化划分方法

机械领域文本采集和分类的研究与设计

随着互联网的迅速发展，各行业信息化程度不断提高，越来越多的信息积累在网络上，如何在浩瀚的信息中寻找到有用的信息，一直是领域研究的热点。本文的研究背景是陕西省教育厅专项科

学位

主题爬虫专业词库文本分类灰色关联度贝叶斯分类

实体检索结果倾向性分析

随着论坛等互联网社区的蓬勃发展，越来越多用户参与到互联网的建设中来，向互联网贡献数据。这些数据中很大一部分是对人物和事件的评论，包含了用户的观点和态度。浏览这些信息能

学位

信息检索情感分析实体检索句子领域识别句子情感分类

基于随机微分方程模型的基因调控网络研究

近年来,基因调控网络一直是一个生物信息学中的热点问题。基因调控网络描述的是基因之间的相互调控关系,通过分析该网络,可以从中发现基因之间相互作用和协同工作的原理,并且

学位

基因调控网络系统辨识随机微分方程极大似然估计树结构进化算法

基于超图分割的共指消解研究

所谓共指消解就是将对应同一实体的多个表述划分到一个等价类的过程。共指消解是信息抽取中的一个重要子任务，在自然语言处理和信息检索的各个领域有着重要的应用。传统方法将

学位

共指消解超图建模k路分割迭代2路分割超边权重学习

多模态虚拟心脏可视化方法研究

心脏的收缩和舒张为人体的血液循环提供动力，是人体的动力之源，然而心血管疾病一直威胁着人类的健康。由于临床医学对人体心脏的研究成本高、效率低，虚拟心脏的研究得以迅速发展

学位

体绘制GPU光线投射传递函数四维可视化多模态可视化

一种基于能量均衡的无线传感器网络的机会泛洪协议

无线传感器网络(WSNs)由大量传感器节点组成，这些节点分布在一定的区域内，并且通过无线节点间的相互通信来组成自组织的网络。无线传感器网络的主要功能是环境监测和信息采集，并

学位

无线传感器网络机会泛洪低占空比能量均衡网络生命期剩余能量

基于稀疏分解的音频场景识别方法研究

与本文相关的学术论文