传声器阵列技术及其在语音识别系统中的应用

来源 :中国科学院声学研究所 | 被引量 : 0次 | 上传用户：zhaohaojed

【摘要】

：

随着计算机的便携化以及随身数码设备功能的多元化，人们越来越迫切的要求摆脱传统输入设备(键盘、鼠标等)的束缚，代之以更加便于使用的、自然的、人性化的输入方式。语音信号处

【作者】

：

张恒

【机构】

：

中国科学院声学研究所

【出处】

：

中国科学院声学研究所

【发表日期】

：

2009年期

【关键词】

：

语音识别

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机的便携化以及随身数码设备功能的多元化，人们越来越迫切的要求摆脱传统输入设备(键盘、鼠标等)的束缚，代之以更加便于使用的、自然的、人性化的输入方式。语音信号处理的应用环境也随之越来越复杂。随着人们对自然、高效的人机交互方式的渴求，语音技术的大规模实用化成为越来越紧迫的任务，而语音识别在近年来的快速发展也使得这一切成为可能。但是，实际环境的复杂多变对语音识别系统的鲁棒性提出了很大的挑战。如何减弱或去除噪声对语音识别系统的负面影响成为了研究的热点之一。　　传统的单通道算法由于只能利用时/频域信息，大多只对平稳或准平稳噪声有一定的抑制和消除作用。而当非平稳噪声存在或信噪比较低时，该类算法往往不能作出有效的贡献。另外，有研究显示，在大多数情形下，单通道噪声消除算法并不能提高语音识别率。而传声器阵列技术与单通道方法相比，其优势在于除了时、频域信息外，还能提供空间上的区分度。包含传声器阵列的语音识别器，在很多应用场合得到了积极的结果。　　典型的实用语音识别系统大致可分为语音信号采集、语音活动性检测、特征提取及解码等步骤，同时还可能需要对声学回波具有抑制作用。而传声器阵列技术可以在以上很多环节中起到积极的作用。本文将深入研究基于传声器阵列的语音识别系统的各个组成部分，分析其原理及关键技术，致力于将传声器阵列技术与语音识别系统紧密地结合起来，尽可能发挥传声器阵列在语音识别系统中的作用，主要研究工作及创新点包括：　　 1.研究了波束和零限波束形成算法，以及传声器阵列后滤波算法，提出了基于听觉感知子带的频域自适应零限波束形成算法，及其与后滤波算法的融合系统。该算法使用较小的阵列孔径及较少的阵元个数，收到了较强噪声抑制能力，并很好地保持了输出语音的质量。　　 2.研究了传声器阵列与自适应回波抵消的结合方法，开发出一套适用于车载平台的传声器阵列语音前端系统，在实际场景中，大幅提高了信噪比和语音识别率。　　 3.提出了一种基于信号波达角同一性的用于语音活动性检测(VAD)的特征，并以此特征为基础，构建了VAD算法。该算法对非方向性噪声和目标区域外的方向性噪声、甚至是高强度干扰语音有较强的区分能力，弥补了传统单通道VAD算法的不足。　　 4.提出了一种服务于语音识别的基于传声器阵列的特征增强系统，将噪声消除引入至MFCC特征域。该算法不需要关于噪声和声场的先验知识，在非平稳噪声存在的情况下，提高了识别率。

其他文献

光分组交换的光码标记理论及其技术研究

光分组交换因其高速、灵活、高效、对数据格式和协议透明、与具有突发性和自相似性的海量IP业务兼容等诸多优势，能有效地解决网络电子瓶颈和充分利用网络带宽，并能满足未来承载

学位

通信网络全光网络光分组交换光码标记光纤布拉格光栅可调光纤延时线

无线自组织网基于抢先机制的多径源路由技术研究

由于移动自组网MANET(Mobile Ad hoc Network)的自组织性,能快速部署,可以随机移动,使Ad Hoc网络在某些特殊场合得到了应用。同时,人们对通信的移动性和便携性要求越来越高,A

学位

Ad Hoc网络源路由协议抢先式路由协议干扰感知

水分胁迫下不同基因型小麦光合特性的比较研究

光合作用是作物干物质积累和产量的基础,而干旱胁迫是抑制光合作用的重要环境因素。本试验利用盆栽水分胁迫模拟干旱条件,通过对栽培一粒、栽培二粒、普通小麦、陕253和长武134等五种基因型小麦光合参数和相关生理生化指标及生长产量指标的研究,探讨了水分胁迫对小麦光合特性影响的内在机理及进化规律。主要得到了以下结论:1.水分胁迫对小麦光合作用的影响因小麦基因型的差异和所处生育阶段的不同而表现各异。拔节期除旱

学位

水分胁迫小麦基因型光合特性

无线网络环境中的媒体播放优化策略

随着无线网络技术与流媒体技术的快速发展,流媒体技术越来越多的应用于无线网络环境中,人们对流媒体系统的稳定性与质量也提出了更高的要求。无线网络通常具有传输速率低,传

学位

流媒体自适应媒体播放H.264/AVC无线网络

开花及不同栽培措施下雷竹植株的生理生态变化研究

雷竹（Phyllostachys praecox f. prevernalis）是浙江西北地区的主要笋用竹种之一,由于其出笋早、产量高、笋味好而在我国得到广泛栽培,并且通过科技人员的大量试验研究,覆盖早

学位

雷竹内源激素氨基酸营养成分开花栽培措施生理生态变化

理化因子诱导的CP43和CP47结构与功能变化规律的研究

CP43和CP47是PSⅡ中位于类囊体膜上的两种内周天线色素蛋白复合体，它们都是由六个跨膜的α-螺旋和五个膜外环组成。CP43和CP47的主要功能是把光系统Ⅱ(PSⅡ)外周天线色素蛋白

学位

盐酸胍

硅微压电超声换能器匹配电路的关键技术的研究

医学超声成像技术广泛应用于医疗超声设备中，是临床上三大影像检测手段之一。医学超声成像系统的重要组成部分包括超声换能器和与其相匹配的收发电路系统。二者对医用超声成像

学位

医学超声

双Buck多电平逆变技术研究

学位

高分辨率SAR图像线状地物提取算法的研究

SAR图像的线状目标提取对地图更新、目标识别、影像匹配等方面具有重要的辅助意义，是图像目标检测的一个重要内容。而随着高分辨率SAR图像的出现，线状目标表现出新的成像特征，传

学位

线状目标多尺度分析对象分割算法纹理检测空间结构特征目标轮廓合成孔径雷达

荒漠地表生物结皮中藻类区系与生态学研究——以古尔班通古特沙漠为例

古尔班通古特沙漠位于新疆准噶尔盆地腹地(44°11′～46°20′N，84°31′～90°00′E)，面积达4.88×104km2，海拔在300～600m之间，是我国最大的固定半固定沙漠。古尔班通古特沙漠(以下简

学位

古尔班通古特沙漠生物结皮藻类种类组成生态分布生物量

传声器阵列技术及其在语音识别系统中的应用

与本文相关的学术论文