驾驶环境下的麦克风阵列语音增强算法研究

来源 :北京交通大学 | 被引量 : 4次 | 上传用户:din6688
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的快速发展,智能驾驶辅助系统在汽车车辆上得到了广泛应用,包括便携式导航仪、智能后视镜、娱乐控制系统等。目前绝大多数车载控制系统都是通过按键、旋钮、触摸屏等接触式操作来实现控制功能,这些手动操作会分散汽车驾驶员的注意力,带来安全隐患,因此通过声控语音技术实现人机交互是近年来的重要研究方向之一。但是驾驶环境中充斥着各种噪声,现有的语音识别技术在噪声污染下很难达到实际应用的要求,因此驾驶环境下语音增强技术的研究具有重要意义。本文研究了驾驶环境下的麦克风阵列语音增强算法,论文的主要工作如下:1.本文分析了语音信号和驾驶环境下汽车噪声信号的特性;相对于驾驶员语音,汽车噪声的能量集中在较低的频域内,因此论文提出噪声消除的优化算法,首先在输入端对信号进行低频抑制预处理,以提高输入端接收信号的信噪比,然后通过引入幅度谱裁剪算法,对输入带噪语音进行幅度谱调整,提高语音存在处与噪声段的相对信噪比比值,使语音部分更加突出,最后进行不同通道之间的信号时延估计,从而提高时间估计的精度。2.本文针对驾驶环境中驾驶员距离麦克风阵列距离较近的实际情况,结合近场信号传播模型,对广义旁瓣抵消算法(Generalized Sidelobe Canceller,GSC)进行了优化。融合近场声源位置信息对辅助通道的阻塞矩阵进行改进,在噪声估计过程中对相邻通道信号引入幅度补偿,并且利用逻辑回归函数控制噪声增益。改进后的算法有效地减少了目标语音信号的泄漏。3.本文针对广义旁瓣抵消算法在弱相干噪声抑制能力上存在的不足,提出了优化方案。对带噪信号进行广义旁瓣抵消语音增强后,通过单通道的多频带谱减算法进行语音增强,将多通道语音增强算法与单通道语音增强算法相结合,从而提高算法对不同种类噪声的抑制能力。最后采用长时谱信息静音检测方法(Long-term Spectral Divergence,LTSD)对目标语音指令进行提取。实验结果表明,本文算法能够适用于驾驶环境下的语音增强,与现有算法相比,在信噪比与语音质量等方面均有较大提高。
其他文献
目的:探讨儿童先天性主动脉瓣狭窄的解剖特点、治疗方式及临床转归。方法:对2012年1月至2016年10月,于我科住院治疗的儿童先天性主动脉瓣狭窄(AS)患者82例(男女比1.16∶1,中
《纳西东巴古籍译注全集》跋语中没有出现关于白沙[b 33 21]的跋语地名.根据经书正文中的人类迁徙路线,迎送神灵路线中的起点或终点地名,我们判断出部分经书属于白沙乡,再根
利用因子分析法和主成分分析法构建包括资源基础、生态环境、发展规模、社会科技和政府支持5个主成分共17个具体指标的县域尺度都市农业可持续发展评价指标体系,对北京市10个
本文梳理了学术界关于旅游演艺产业发展的理论及实践状况,剖析丽江旅游演艺产业的发展现状与问题,探究丽江旅游演艺产业的文化创意。结合丽江的地域优势,分析丽江旅游演艺产业的
高速公路改扩建工程涉及新老标准及新老结构物的衔接,这些复杂的问题为设计带来了挑战,而引入一些新技术和新结构可以灵活解决工程实际问题。本文结合青银高速公路K1499+063.
本篇文章首先通过对驻马店方言中存在的疑问句形式及表义差异进行考察,建立起方言的疑问句系统,包括是非问、选择问、特指问、反复问,然后就反复问在河南省境内所出现的形式
习水方言属于西南官话,西南官话属于北方方言,普通话以北方方言为基础方言。因而不管在语音还是语法上,西南官话与普通话都保持着较高的一致性,其内部也较为统一。但仔细研究
网红和传统明星作为名人的两个重要分支,由于其不同的成名路径使得消费者在现实中对二者的形象感知有所不同;此外,随着互联网时代的发展,关于网红和传统明星谁更适合作为企业
"知与不知"是悲剧人物的悲剧性思想认识方面的共同特点,另外在情感取舍上还存在着理性与情感的纠结,再加上悲剧人物具有抗争精神,当生存受到阻碍,对自身现状的不满足时,就自然
以某一级公路上2座变截面钢混组合连续箱梁桥的施工监控为例,阐述与分析该类桥梁的线形控制过程。这2座桥梁因钢混叠合梁焊接架设与现浇段支架拆除之间的施工顺序不同,导致桥