抗噪声语音识别新技术的研究

被引量 : 0次 | 上传用户:juhong0226
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
抗噪语音识别技术是语音识别系统走向实用化的一个关键性难题。现有的语音识别系统通常是为受控环境中的纯净语音设计的,尽管它们在安静的环境里能取得很好的识别效果,但当存在环境噪声时,由于训练环境与识别环境的不匹配,其性能会急剧下降,在很多情况下无法满足实际应用的需要。本文对噪声环境中的语音识别技术进行了研究,其主要内容及成果如下: 1.针对传统均匀谱压缩特征提取技术会对部分语音子带信号产生过压缩而同时对其他部分子带产生欠压缩的缺点,我们依据听觉指数律提出了一种新的非均匀谱压缩技术一基于感知的非均匀谱压缩(Perceptual Non-uniform Spectral Compress,PNSC)技术。实验结果表明,本文提出的PNSC技术较传统的特征提取方法可以提供更具鲁棒性的语音特征。PNSC的应用可以有效地提高传统特征提取技术在低信噪比条件下的识别率。 2.依据人类听觉特性,特别是听觉掩蔽效应,提出了一种新的鲁棒语音特征提取技术一信噪比依赖非均匀谱压缩(SNR-dependent Non-uniform Spectral Compress,SNSC)技术。实验结果表明,基于新的SNSC特征提取技术的识别性能要优于其他非均匀谱压缩技术,以及传统的MFCC、LPCC和PLCC等特征提取技术。文中分析比较了基于传统和SNSC两种不同特征的模型参数,从模型的角度说明了基于SNSC特征的方法比传统特征提取方法更具鲁棒性;并且分析和给定该方法中参数的特性及选择范围。 3.针对SNSC技术应用到实际识别中时,需要根据应用环境情况进行重新训练的缺点,提出了一种基于SNSC特征提取技术的模型自适应方法(Model Adaptation based on SNR Non-uniform Spectral Compression,MA-SNSC)。在一定的假设条件下,文中给出了MA-SNSC算法及其推导过程。实验结果表明,该算法可以在不需要对模型重新训练的条件下自适应处理不同SNR及不同噪声条件下的识别任务,并且能够取得较好的识别性能。 4.传统的模型补偿方法如Log-Normal PMC算法等对静态模型参数给出一个严格的补偿方案,但是对其动态特征的模型参数的补偿,通常只能对其均值进行简单的修正,使得其在低信噪比条件下识别性能不佳。为此本文依据静态失配函数的导数推导出了一种新的动态模型参数补偿方法(Dynamic Parameter Compensation Method,DPCM)。实验结果表明在不同的噪声环
其他文献
一、货币政策演变对日本经济的影响受到二战的严重影响,战后日本经济的发展先后经历了波谷、波峰、低谷几个阶段。伴随经济的波动。日本货币政策在不同阶段起到了推波助澜的作
针对部分管状电加热元件在电加热锅炉中使用时出现寿命缩短和其它质量缺陷的原因进行分析,提出了对策措施,同时对进一步用好电加热元件,并力求做到节能、降耗,提出了相关建议。
延长退休年龄主要是针对我国目前严重的老龄化现象而提出来的一种政策建议,文章提出延长退休年龄,实行弹性退休制不是应对人口老龄化,解决养老金存在巨大缺口这一问题的根本
<正>近期,我们采取听取汇报、问卷调查、谈心交流等形式,对东海舰队陆勤、海勤单位官兵婚恋情况进行了调研。总的感到,大部分官兵婚恋观念正确,积极履行家庭义务,自觉遵守婚
房地产行业是我国现阶段重要的支柱产业和人们关注的消费热点,具有关联产业多,影响力大的特征。同时,住房问题与人民群众生活休戚相关。长期以来,受住房体制改革、城市化进程
医疗卫生服务关系到公众健康和社会和谐,而目前我国医疗卫生服务依然取向模糊;本文运用相关经济学理论,从医疗卫生服务的公共产品属性的分析和认定入手,提出政府作为医疗卫生
1990~1995年我科对48例口腔癌进行手术治疗,获得较好的疗效,现报告如下。1 临床资料1.1 一般资料:48例中,男30例,女18例,年龄最大86岁,最小15岁,平均年龄52岁。48例口腔癌分
<正> 一、填充材料对管状电热元件的意义及其存在问题管状电热元件的典型结构如图1所示,主要由金属护套管1、导电引出棒2、螺旋状发热丝3、耐高温绝缘粉末填料4和封口材料5组
时下,甘肃电力市场显然已经成为清洁性与经济性矛盾集中爆发的主战场,而这一场没有硝烟的对决,又是否镜鉴出了我国电力工业在实现清洁化发展中的重重矛盾?
旅游环境承载力,也称旅游环境容量,是衡量旅游环境与旅游发展是否协调的重要尺度,是发展旅游业与保护环境之间矛盾的核心理论问题。目前对于旅游环境承载力的研究主要集中在