语音识别鲁棒性技术研究

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:steproad
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前语音识别技术已经发展到了一个在实验室环境下相当高的水平,但是在实际应用环境中仍然存在多种问题。在实际应用环境下,不同传输信道之间的物理特性差异、环境加性噪音、说话人之间差异的影响等三方面问题是目前语音识别系统鲁棒性问题研究重点。考虑到语音检测技术在实际应用中的重要性和新兴的语音识别阵列技术,本文在语音端点检测、单通道环境噪音抗噪技术、多通道阵列环境噪音抗噪技术、消除说话人之间的差异性进行了研究。主要研究内容及结果如下:   ⑴在语音端点检测方面,在深入研究现代信号处理研究成果基础上,提出一种基于积分高阶谱的端点检测特征提取算法,并建立了相应的搜索机制,另一方面在分析积分谱的缺失高阶谱相位和信息冗余的不足下,提出一种基于全谱空间的非平儿谱点组合的端点检测算法,实验验证了该方法的有效性。   ⑵在单通道环境噪音抗噪技术研究方面,分析了目前广泛使用的两步维纳滤波算法,针对该算法对于信号深度衰减易造成语音信息的丢失等问题,提出了语音损失补偿的自适应算法,提高了系统的性能。   ⑶在多通道环境噪音抗噪技术研究方面,在改进阵列物理尺度过大,需要预知目标信号方位信息等不足的基础上,提出一种双麦克风阵列的多通道抗噪算法,利用高阶累计量实现对于目标信号的自动定位,采用双固定增益模式的自适应组合实现对噪音方位信号的零增益,建立了声源跟踪模块、自适应零点成型模块和后处理滤波模块的系统框架,相关实验验证了方法的有效性。   ⑷在消除说话人声道物理特性的研究方面,在前人研究的基础上提出一种基于先验知识的分层计算的快速归一化因子选取方法,使得在性能基本不变的条件下提高了归一化因子的选取速度。
其他文献
高炉炉热推断模型是高炉专家系统中的重要模型之一,它不仅反映了炉况的波动情况,而且反映了高炉能量的利用程度,对指导高炉操作,提高高炉控制水平,有十分重要的意义。 通常用来
模糊神经网络是模糊逻辑推理与神经网络有机结合的产物,是智能复合控制发展的必然趋势。它的学习算法是其理论与应用研究中最关键的一个方面。由于结构学习通常可以转化为参
随着嵌入式计算技术的发展,嵌入式处理器和实时操作系统得到了广泛的应用。光电跟踪控制系统就是一种典型的嵌入式系统应用。原有系统平台采用DOS操作系统,它的局限是单任务工
本文运用运筹学、随机分析(鞅)、随机最优控制等方法研究动态投资组合选择问题,建立了两类动态投资组合选择模型——均值--下方风险模型和效用最大化模型。其中,均值--下方风险
网格技术作为近年来的研究热点,已有不少基于网格环境的应用空间模型、任务调度、资源管理的研究文献发表和相关著作出版,但上述成果多立足于网格计算的目标,以并行理论为基础,研
光纤Bragg光栅(Fiber Bragg Grating,FBG)是目前最有发展前途、最具有代表性的光纤无源器件之一。近年来在光纤Bragg光栅传感方面的研究与应用已经越来越引起人们的重视。FBG
自主能力是传统的工业机器人向今天更具智能的先进机器大发展的最重要的使能技术之一。而实时建模与自主适应控制则是实现机器人自主能力的最为关键的两种技术。本文以中科院
学位
随着社会的不断进步,科技正高速的渗透到人类生活的方方面面。数据的采集和存储传输也日渐显示着重要的作用。在本篇论文里面,就数据的采集、存储和传输三个方面展开了详细的论
本文应用合作博弈理论研究企业战略联盟问题,通过博弈论中的利益变化和策略调整,对企业合作竞争、战略联盟以及劳资博弈若干问题进行深入研究,将定性说明和定量分析结合起来,进一
测井是油气勘探和开发的重要技术手段。由于测井系统所处的特殊环境,使得它与一般的遥测遥控和数据通信系统不同。伪随机码有类似于白噪声的统计特性,并且抗干扰能力强。以它作