噪声环境下语音识别方法的研究

被引量 : 0次 | 上传用户:yangzhehang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
噪声环境下的语音识别是国内外一个重要的研究课题,具有重要的理论和实际意义。由于训练环境与识别环境的不匹配,现有的语音识别系统在噪声环境下的识别性能下降十分严重,因而还不能实现真正的商业化。 本文从语音模型入手,讨论了新的抗噪语音识别方法。通过分析噪声对语音识别性能的影响,提出了两种新的抗噪语音识别方法,即动态时间规整(DTW)利学习矢量量化(LVQ)相结合的识别方法以及基于隐马尔可夫模型(HMM)和小波神经网络(WNN)混合模型的语音识别方法。其中第一种方法具有训练和识别过程简单的优点,对信噪比为10dB的情况下识别率从26%提高到50%。第二种方法则通过结合HMM的时间建模能力利WNN的分类决策能力,在不影响纯净语音识别率的情况下,比第一种方法具有更高的识别率,对信噪比为10dB的情况下识别率为66%,这种方法在低信噪比的情况下识别率提高尤为明显。 此外,本文还提出一种基于语音增强技术的语音识别方法,即通过对带噪的原始语音进行语音增强,提高源信号的信噪比,从而提高语音识别系统的识别率。本文使用谱相减利小波消嶸两种语音增强方法,可以将带噪语音的信噪比至少提高50%,信噪比为10dB时的识别率提高到80%。实验证明,这种方法对抗噪语音识别具有良好的效果。
其他文献
针对某污水处理厂曝气沉砂池出现的管道易堵塞和排砂泵故障率高等问题,对曝气沉砂池排砂系统进行升级改造,减少了排砂管的堵塞、降低了排砂泵的故障率,取得了良好的除砂效果,
甲氧苄啶(TMP)作为磺胺增效剂,具有广谱、高效、低毒等优点,抗菌谱与磺胺类药物相近,常与多种抗生素形成复方制剂,单独用于治疗细菌引起的单纯性尿路感染等。TMP溶解度低、溶
肝素是一种由动物结缔组织的肥大细胞产生的粘多糖,主要存在于猪小肠粘膜和肝、肺脏等组织细胞中。目前,我国主要以肉制品企业的副产物-猪小肠粘膜提取肝素,大多小企业技术设
近日,中共中央办公厅、国务院办公厅印发了《国家信息化发展战略纲要》,7月27日,国务院新闻办公室举行发布会向社会发布了《纲要》全文,国家互联网信息办公室副主任庄荣文、发展
期刊
利用连续液- 液提取技术分离啤酒花酊的香味成分, 用GC- MS 和双柱复检法对啤酒花酊的挥发性化学成分进行了定性分析, 质谱共鉴定出44 种化合物, 其主成分为4 ,4_dimethyl_3 ,5_dioxahexaldoxin_2 ,6_dione 和3 - 甲基丁酸。对主要成
模具是工业生产的基础工艺装备,其设计水平很大程度上决定产品的质量和企业的竞争力。近年来产品更新换代速度不断加快,导致模具的交货周期变的越来越小。因此,当今模具制造
栀子和杜仲叶是两种传统中药,在我国资源丰富,富含环烯醚萜类活性成分,两种中药中都含有典型的环戊烷型环烯醚萜京尼平苷(geniposide,GP)和京尼平苷酸(geniposidic acid,GPA)
光动力疗法(PDT)是一种利用光动力效应进行诊断和治疗疾病的一种新技术。光敏剂是PDT的核心物质,其中,第二代光动力学药物5-氨基乙酰丙酸(5-ALA)及其衍生物是目前光动力学药
微胶囊技术是用成膜材料将活性物质包裹成粒径在微米或纳米范围内的微小粒子的技术。微胶囊能够保护芯材物质,使其免受外界环境的影响,从而提高芯材物质的稳定性。近年来,微
取代苯硼酸是重要的农药、医药中间体和化工原料中间体,还广泛应用在合成新型的液晶显示材料和糖类传感器中。对于实验室利用正丁基锂传统方法制取过程,需要温度在-78℃下进