混响环境下的远程语音增强方法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:zhanglicheng666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人与人沟通、人机交互的重要手段之一。在室内环境中除了噪声,由四壁和上下表面反射引起的混响是造成语音质量和可懂度下降的主要原因。期望信号与室内声学脉冲响应进行卷积,麦克风接收的信号为直达信号与混响成分的叠加。混响在时频域引起的拖尾,往往导致语音信号的包络和精细结构产生失真。同时噪声和潜在干扰的存在,以及语音自身的非平稳性使得室内语音增强问题更为复杂。本文将对室内环境下,麦克风采集的远程语音信号增强方法展开研究。考虑固定波束形成尤其是差分波束形成在室内时变声学环境中的局限性,在自适应波束形成的基础上,本文提出了基于传递函数广义旁瓣抵消器(Transfer Function-Generalized Sidelobe Canceller,TF-GSC)和改进极小值控制递归平均(Improved Minima Controlled Re-cursive Averaging,IMCRA)的远程语音增强框架,利用空-时联合处理方法对混响语音进行去混响和消噪,同时保证去混响方法在噪声存在下的稳健性。不以声源空间位置和声学传递函数信息为先验,本文将TF-GSC结构替换为多通道线性预测(Multichannel Linear Prediction,MCLP)盲去混响框架,介绍了最小绝对值和方法、基于组稀疏性假设的最小绝对值收缩和选择(Least Absolute Shrinkage and Selection Operator,LASSO)方法和基于最大化对数似然函数的归一化延迟线性预测方法。本文将IMCRA作为以上盲去混响方法的后置滤波器,讨论了非相干噪声对GSC和MCLP语音增强框架的影响。仿真和实验说明在混响占主导的室内环境下,多通道线性预测框架的语音增强性能优于GSC框架,后置滤波为两种语音增强框架的必要补充。本文设计搭建了一套多通道远程语音采集处理系统,实现实时语音数据的采集、处理和发送,同时以实录数据验证基于GSC和MCLP框架的远程语音增强方法的有效性。
其他文献
文章介绍了海苔中磷含量的测定方法。
近几十年来,人们一直用和天然钻石硬度相差无几的人造钻石制造工业钻头、锯条、以及医疗植入物的外膜等。但科学家近日发现,如果在钻石上人为地制造出一些缝隙,或许能让它们
随着地震技术的不断发展,使得预测奥陶系灰岩岩溶裂隙发育带的精确度大幅提高。本文介绍了运用地震属性技术和模式识别方法测岩溶裂隙发育带的基本原理。利用梧桐庄煤矿的实际
文章从公民文化权利的内涵出发,分析文化权利与民生档案文化服务的内在联系,结合公民文化权利的基本内容,构建民生档案文化服务体系。 Based on the connotation of citizen
在系统地梳理古典现代性理论的基础上,吉登斯把现代性理解为一种现代社会制度,并提出了现代性的四个制度性维度,即资本主义、工业主义、监督机器和军事力量.他从全球化角度剖
2019年猪肉价格上涨既具有"非洲猪瘟"疫病影响介入的偶然性,又具有市场自发规律导致的"猪周期下行"以及生态环保力度加大造成的养殖户关停并转等升级转型带来的辐射效应的必
氧气、氢气、二氧化碳是初中生应该全面掌握的三种重要气体。学生在已有氧气知识的基础上,进一步学习氢气的性质,既对通晓氧气知识起着巩固、提高的作用,也为学习二氧化碳的知识
三维和彩色多普勒超声作为多囊卵巢综合征(PCOS)的有效诊断方法,在PCOS的临床诊断中得到越来越广泛的应用。该方法通过对患者卵巢体积、卵泡数目、髓质面积与卵巢总面积比值
现行的《城市房屋拆迁管理条例》(下称《拆迁条例》)近年来倍受攻击,新的《拆迁条例》又很难出台,问题在哪里?笔者认为,是少数人在这个问题上走了极端,也把解决问题的方法带进了
<正>参与过自上世纪八十年代绵延至今的"韦伯命题"讨论的中国学者,或许内心微有遗憾:如果韦伯能多活二三十年,掌握了中文或者读到更多中国研究资料,也许他能借给我们一双来自