基于麦克风阵列的语音增强与识别研究

来源 :浙江大学信息与电子工程学系 浙江大学 | 被引量 : 0次 | 上传用户:wtuye262626
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动语音识别技术对纯净的语音信号已经可以达到较高的识别精度。然而实际工作环境中环境噪声与混响的存在,以及其他声源的干扰,造成待识别语音特征与训练模板之间的失配,使得系统识别性能急剧下降。本论文针对以小尺寸麦克风阵为接收端的自动语音识别系统,研究若干宽带语音阵列处理方法,通过空时联合处理提高实际工作环境下语音信号被正确识别的概率。论文关于语音信号声源定位的研究,采用了基于旋转不变技术的信号参数估计(ESPRIT)算法的宽带到达方向角估计方法,并结合多通道语音线性预测分析和信噪比估计对算法进行了改进。实验证明,这种高分辨宽带信号处理方法应用在小尺寸麦克风阵接收的语音信号上,具有远优于常规波束形成方法的性能,且避免了其他典型高分辨方法中对整个角度域的扫描计算。定位结果用于指引后续阵列处理以提取从特定说话人方向到达信号。大多数现有麦克风阵语音识别系统包括阵列信号处理和特征识别两个先后独立的阶段。论文将阵信号处理和特征识别统一起来考虑,识别系统的输出被反馈至前端的麦克风阵列,结合识别过程调节滤波器系数,最大化似然概率的输出,滤波器系数调节中并采用全局搜索算法进一步改善联合优化方案的性能。与常规阵处理方法增强语音波形质量不同,论文研究增强语音特征使其与识别模型更为匹配,直接提高识别过程中正确假设的似然概率。实验证明,采用联合优化方案训练滤波器系数,系统的识别性能得到明显提高。
其他文献
分布式星载雷达的卫星间距远超过雷达辐射微波的半波长,因此会产生较多的孔径干涉栅瓣,从而不能正确区分空间回波的角度,产生角度模糊。本文主要针对分布式星载雷达的栅瓣抑
随着互联网Internet的飞速发展,网络多媒体业务也日趋多样化,网络拥塞成为制约网络发展和应用的瓶颈。传统的拥塞控制方法仅仅针对某单一问题的解决,并不能从整体关键部位着
AVS2视频部分(Audio Video coding Standard Ⅱ)是AVS工作组继AVS、AVS+之后制定的新的编码标准,经过四年的努力于2015年6月8日完善。它与HEVC具有相似的性能,并且针对监控场
由于导航信号到达地面的功率较低,因此接收机很容易受到各种有意或无意的干扰,影响导航定位功能甚至无法定位。所以导航接收机的干扰抑制技术成为目前的热点研究方向。对于信
随着我国经济的发展,城市机动车数量迅速增加,停车难问题已成为城市交通中最为棘手的问题之一,建设智能化停车场管理系统成为解决这一问题的迫切需要。而车位检测技术是智能停车
学位
自从美国联邦通信委员会在1996年发布E911规范以来,无线定位技术一直是现代通信技术的研究热点。在视距条件下,人们已经研究出定位精度较高的定位算法,然而在非视距条件下,受
随着近几年通信技术的发展,移动数据业务呈爆发性增长,然而频谱和站址的资源是短缺的,无法满足迅速增长的需求。在这样的背景下,新一代移动通信技术5G必须满足这种需求,异构
正交频分复用(OFDM)技术因具有高速传输数据能力,高频谱利用率,抗多径干扰能力强等优点被认为是第四代移动通信系统的核心技术之一。但OFDM却存在较高的峰均比问题,该问题影
图像边缘检测是图像处理与分析中最基本的内容之一,是图像压缩、计算机视觉、模式识别等领域的基础,一直是图像处理领域里的研究热点,所以对它研究有理论和现实意义。本文根据小
射频接收机的前端的微波开关和低噪声放大器(LNA)是天线下面的第一级信号处理部分,这两个部分在接收机中具有非常重要的地位,如果能设计出好的性能指标,则对整个接收机系统性
学位