人机交互应用中麦克风阵列语音增强的研究

来源 :中国科学院声学研究所 | 被引量 : 0次 | 上传用户:smartq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人机语音交互的实际应用中,计算机处理的实际信号除了包含目标语音信号以外,还常常包含噪声信号或干扰语音信号或噪声信号与干扰语音信号二者兼有,导致语音识别的可用性急剧降低。该论文开展如何根据人机语音交互的实际应用场景进行语音识别的前端处理研究,使目标语音信号相对于噪声信号和干扰语音信号得到增强,以便改善语音识别在实际应用场景中的可用性。 该论文的创新工作如下: 1、系统地分析了各种基本的麦克风阵列语音增强技术的消噪性能,包括经典的延迟相加波束形成器、自适应波束形成器、后滤波技术等;并对一些最新的麦克风阵列语音增强算法进行了分析,如近场超定向波束形成器、广义奇异值分解结构、传输函数广义旁瓣相消器等,归纳了这些算法和结构的特点及其在实际应用中的局限性。 2、针对人机语音交互实际应用中目标声源和干扰声源的空间分布特性,提出了一种结合维纳后滤波及空间滤波的麦克风阵列语音检测方法,较好地解决了低信噪比和存在干扰语音时的语音检测问题,当目标声源和干扰声源的位置固定,或其位置存在一定的相对移动时,对于信噪比为-5dB、干扰噪声比为-5dB的阵列接收信号,该语音检测算法对目标语音和干扰语音的检测结果正确率分别为87.3%和82.2%,对于干扰语音和目标语音同时存在的情况(SNR=0dB,SIR=-5dB),语音检测结果正确率为89.9%。 3、提出了一种集成维纳滤波的稳健麦克风阵列语音增强结构(RGSC-IW),通过构建一个有效的自适应模式控制器(AMC)来控制广义旁瓣相消器(GSC)的自适应,实验结果表明,当目标声源和干扰声源的位置固定或存在一定的相对移动时,RGSC-IW能够取得与人工自适应广义旁瓣相消器维纳后滤波结构(GSC-PW)相当的噪声抵消量和干扰抵消量,且RGSC-IW增强之后的语音信号失真度更小。 Ⅰ
其他文献
期刊
学位
本文通过对荣华二采区10
期刊
视网膜血管形态结构具有唯一性,没有相重性,因此其生物特征具有很高的保密性和防伪能力等应用价值。另一方面高血压动脉硬化、冠心病、慢性肾炎等是中老年人常见疾病,会引起视网
本文选题来源于国家973项目"面向功能可重组结构的DSP&CPU芯片及其软件系统的基础研究"(课题编号:G1999032900)该项目组包括硬件系统和软件系统的研制.硬件系统包含DSP&CPU总
本论文构造仿真数据,模拟回波,并采用蒙特卡罗分析方法,对雷达信号检测和恒虚警检测从理论公式与蒙特卡罗实验两方面分析。同时利用雷达恒虚警检测的蒙特卡罗实验结果进行了
现代高性能芯片的设计和制造工艺的发展促进了测试仪器的进步和变革.本论文通过对现代集成电路测试仪、微处理器测试技术和可编程逻辑器件的分析和研究,设计出一种经济实用的
学位
论文综述了通信系统和智能天线研究的进展,着重阐述了使用智能天线实现信号到达波方向估计的各种算法,在此基础上开展了信号到达波方向的信号处理技术的研究。本文主要贡献和创
Ad hoc网络是一种工作在无固定结构环境下的自组织的无线移动网络。它适用于军事或是一些战略应用场合,例如,战场上部队快速展开和推进、发生地震或水灾后的营救等。在没有网络