噪声背景下声音事件的特征提取及识别

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:flyballball
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来声音识别技术快速发展,生活环境中的声音事件与人的生活密切相关,声音事件识别技术在声音追踪、定位和安防领域中有重要利用价值。通过声音事件的识别能够揭示该场景下发生的事件情况,可以对特定场所有效地监控。由于现实环境中存在复杂的背景噪声,识别系统在噪声背景下的识别性能不佳成为主要难题。声音事件识别系统由声信号预处理、特征提取和分类识别构成,其中特征提取是重要环节,特征提取直接影响识别效果。在低信噪比情况下,提取声谱图特征比传统的声音特征有更丰富的信息,深入研究声谱图特征并提出改进算法,结合前端处理中改进的声音增强算法。论文的主要内容如下:(1)声音增强。通过对比传统的声音增强算法,研究维纳滤波、多频带谱减法等算法存在的不足,提出改进的最小均方误差算法,并引入改进的最小值约束递归法,该算法能提高带噪声音信号的信噪比以达到声音信号增强效果,从而提升声音事件识别性能。(2)基于声谱图的特征提取。算法基本思路为利用伽马通滤波器将声音信号转化为声谱图,提取声谱图的子带功率分布,声谱图能包含时域和频域的信息,子带功率分布包含不同频带的功率分布情况,能较好地区分噪声和声音事件。第一种特征是提取声谱图的全局特征,第二种特征采用扇形投影方法来提取声谱图的细节特征,两种特征结合为谱图的扇形投影特征算法,二者结合具有一定抗噪性,能有效提升声音事件识别性能。(3)分类识别。针对不同分类器的特点,分别进行分类识别实验,得出较优的识别框架,然后采用支持向量机识别框架对所提取的特征矩阵进行分类识别。其主要原理是通过寻找一个超平面来对数据进行分割从而达到分类的效果,利用多分类的方式建立分类模型,对于数据样本较少情况下,支持向量机能取得较好识别效果。针对低信噪比下声音事件的识别,文章分别在说话噪声、汽车噪声、工厂噪声、粉红噪声,以及不同信噪比的条件下,对日常环境中的16类不同声音进行分类识别。实验表明结合改进的最小均方误差算法和声谱图的扇形投影特征能对真实环境的声音事件进行识别,在低信噪比下能取得较好的识别率。
其他文献
介绍在小(2)型水库安全评价中,开展水力学计算应根据各个水库的现状选择计算方法,并提出对有关参数的选择与计算途径。 Introduction In the small (2) type reservoir safe
针对传统温室布线困难、组网复杂以及系统不易维护等缺点,文中提出了一种基于ZigBee技术的温室环境监测系统解决方案,设计了以CC2430芯片为核心的节点结构,并移植了Z—Stack协议
本文试通过对记账赊销方式下国际保理业务结算与出口信用保险的比较,进一步分析国际保理业务的优势.国内商业银行在开展此项业务时应该从"扬其长、避其短"入手,迎接国际同业
随着机载通信技术持续高速的发展,对通信系统和设备的功能要求也不断提高,同时其装载环境也愈加复杂,于是对系统中天线的尺寸和性能的要求也愈加严苛。在超短波频段,为了适应
3D打印近年来也成为了一种家喻户晓的热门科技,只要有想法,食物也能成为你创作的一部分,3D食物打印机加工的食物外观都显得非常的细腻,且形状各异,从制作上大大简化了手工加工过程
生物资源,作为一种世界上储量最丰富的资源,还没有被人类充分利用。但是它具有优异的特点,如可再生性、可降解性,决定着它的良好发展潜力。农产品废弃物,作为生物质资源,在农
【正】 两晋南北朝时期,虽然政治上四分五裂,但史学却有长足的发展。在摆脱了传统的经学束缚之后,许多文人学士转向史学研究和史书的编写。当时,晋人写当朝历史的达一、二十
农民是我国当前社会最大的弱势群体。农民增收是影响整个社会收入倍增计划的短板,要使云南与全国同步实现全面小康,促进农民收入增长是关键。根据云南地方经济特色,必须从农产品
目的观察腹膜透析对小儿先天性心脏病术后的低心排治疗效果。方法回顾性分析该院12例先天性心脏病术后低心排早期治疗使用腹膜透析效果。腹透液选择百特公司2.5%低钙腹膜透析液
艺术批评的自觉,是有所意识但又难以释说的课题。试描述若干点如次: 1.它是艺术批评(或评论),不是艺术理论(艺术哲学、美学等),也不是艺术史。艺术理论是从整体上对艺术现象