噪声环境下的VAD检测方法的研究

来源 :新疆大学 | 被引量 : 0次 | 上传用户:leihaibo880125
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音端点检测(Voice Activity Detection,VAD)主要指的是检测一段语音信号的起始点和终止点,以便于分离有效的语音信号和无用的语音信号或者噪音信号,使得后续的处理更加有效率。它应用非常广泛,常用于语音识别系统、语音增强、语音编码等任务上。当前端点检测的研究主要有两个方向,其一就是通过阈值来进行检测,常用的方法有基于短时能量过零率的检测、基于信息熵的检测等。而另一种检测方法是基于模式识别的检测,常用的方法有常见的有基于隐马尔科夫模型(Hidden Markov Model,HMM)的检测、基于支持向量机的检测等。语音端点检测的检测结果好坏对后续的语音处理起着决定性的作用。本文的研究主要是基于噪声环境下的端点检测方法的研究,由于在低信噪比下的传统的检测方法都存在检测率不高的问题,因此本文首先对语音进行预处理,实现语音的有效去噪,然后通过传统的基于倒谱距离的检测方法来进行检测,在降噪的过程中,本文应用了最近几年的研究热点深度学习的知识,提出了将深度学习下的降噪自编码器用于语音去噪,并取得了一定的效果。由于噪声与语音信号之间的复杂关系,并且在我们的生活中,声音常常受到的是加性噪声的影响,因此本文重点研究了语音信号在不同噪声不同信噪比下的检测性能,实验选取了NOISE92噪声库中Factory、volvo以及white三种噪声以及纯净语音库TIMIT中部分语音数据,同时合成不同噪声类型下不同信噪比的带噪语音,在实验中,合成了包含信噪比为-10d B到10d B之间的五种带噪数据,然后通过梯度下降法(gradient descent)来训练降噪自编码器(Denoising Autoencoder,DAE),来实现对加噪之后的语音信号的重构,使其与原始纯净语音信号的误差最小,从而实现降噪的目的,进而通过倒谱距离的检测方法来实现语音端点的检测,从而提高低信噪比下端点检测的正确率。实验结果表明,特别是在低信噪比条件下传统的端点检测方法正确率都是急剧下降,但是将本文提出的方法用于语音端点检测时,其语音信号的检测正确率明显得到提升,尤其是在0dB以下的低信噪比情况下,相比传统的检测算法,其检测正确率更高。
其他文献
本文将我国少数民族和民族地区经济发展缓慢、各民族发展差距及其拉大的原因放在当代中国社会转型的大背景中加以探讨 ,认为社会转型滞后是造成少数民族和民族地区发展缓慢、
目的研究股骨干骨折合并膝关节损伤的临床治疗效果和预后。方法选取2016年4月~2018年11月本院收治的134例患者作为研究对象,按照随机法分为观察组和对照组,对照组67例,观察组6
介绍九景公路隧道工程设计概况,合理选择施工方法,光面爆破、一次锚喷支护与二次衬砌、监控景测等内容。
盗窃罪与侵占罪同属于以非法占有为目的,以非秘密的手段实施的侵财型犯罪。何为"代为保管",是厘清盗窃罪和侵占罪的关键。载体物与封缄物都因为其自身具有良好的密封性、防盗
<正>著名教育家叶圣陶先生指出:"什么是教育?简单一句话,就是要养成良好的习惯。"近年来,广州市越秀区铁一小学积极开展养成教育的实验,富有成效,并总结出具有校本特色的有效
<正>目前,我国农民外出务工人员有1.5亿,并且打工者的数量还在以每年500万人的速度递增。农村留守儿童3000万,占农村儿童的18%-22%。父母长期缺位,使其子女在身体发育、性格
我国每年酒瓶的回收量巨大,但是在酒瓶检测仍然依靠人力,对酒瓶完好程度的检查工作耗费了大量人力。针对这一问题,设计了自动化酒瓶检漏翻转装置,结构简单、工作效率高,能取代人力
<正>徘徊于书店之时,偶然看见王跃文的《大清相国》,刚好符合我喜欢看历史小说的口味,简洁的装帧设计业不错,为了打发时间,买来了阅读。此时,我还是千万莘莘学子中的一员。王
<正>2009年1月26日,国务院颁发了《国务院关于推进重庆市统筹城乡改革和发展的若干意见》(国发〔2009〕3号文件),将重庆市的改革发展上升为国家战略,为重庆市新阶段的战略发
由于我国社会经济不断发展,人们的生活水平也随之上升,人们对园林事业的要求也越来越高,这些都促进着园林事业的快速发展。在进行园林绿化设计的过程中,植物的色彩美对其具有