汽车噪声环境下语音识别技术的研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:lili1006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人机之间信息传递最简单、自然的方式,当工作条件恶劣、人手受限时,这种方式的便捷性将更加显著。语音识别经过近六十年的发展,到目前为止已经取得了不错的成绩,但目前语音识别技术的发展水平还远不能达到实际应用的要求。其中实际应用环境中的噪声问题是制约语音识别系统应用的一个主要因素。作为语音信号处理领域中比较困难的前沿课题,抗噪声语音识别是语音识别系统实用化进程中必须解决的关键问题。   1、本文首先在对语音识别系统构成研究的基础上,介绍了其原理、算法并分析了各类算法的适用范围和优缺点。接着,结合本课题最终实现目标--实现智能仪器仪表声控功能以及未来系统的扩展性,分别实现了三种基线系统:特定人VQ、特定人CHMM、非特定人VQ。   2、然后,根据MFCC分量对语音端点的敏感性,设计了一种基于MFCCO的新端点检测方法。一方面该方法利用了MFCC特征参数的抗噪性能,从而具有鲁棒性,另一方面该方法有着较高的检测精度。实验结果表明,基于该方法的语音识别系统不仅可以通过端点检测大大压缩数据量,而且提高了系统的识别率。   3、结合抗噪技术的三大研究方向:语音增强、抗噪模型补偿技术、抗噪特征参数提取技术,分别介绍了相应的经典方法和最新研究成果。并从抗噪特征参数提取技术角度,基于CMN RAS MFCC、DAS CMN抗噪特征参数提取原理和实现的基础上,提出了修正抗噪参数M-DAS-CMN。接着提出了基于人耳听觉Mel频率上的含噪语音信号模型,并在此模型基础上,提出了新特征参数Mel CMN。实验结果表明,新特征参数M_DAS_CMN和Mel_CMN对Volvo噪声具有更好的抗噪性。其中Mel_CMN的抗造性更显著,这也从侧面证明了Mel频率上的含噪语音信号模型的合理性。   4、最后,针对Volvo噪声环境下的语音识别系统的特点,修正了基于MFCCO端点检测法,并利用自适应算法和本文提出的抗噪特征M_DAS_CMN、Mel_CMN设计了两种新的系统。实验结果表明新系统更适用车载语音控制系统的要求。
其他文献
大多数工业过程往往有着很强的非线性,并且随着系统的运行和工业环境的变化,其内部动态也在时刻发生变化,因此难以用解析表达式对其进行精确的描述。而随着对系统控制的精度
网络控制系统(Networked Control System, NCS)是以通信网络作为控制器、执行器以及传感器之间的通讯媒介,是控制科学、计算机及网络技术的综合应用。网络资源的竞争及网络时
神经系统是由大量神经元组成的复杂网络,神经元之间通过间隙、突触等连接组成神经网络,神经元是神经系统的基本单元。神经网络之间的信息传递是以神经元动作电位的发放和传递为
本文的研究内容涉及木材干燥科学、自动化技术、计算机技术及工业通信网络技术,主要完成了以下工作:  (1)本文设计了基于集散控制系统“集中管理,分散控制”结构的木材干燥窑
仿人形机器人的研究使自主移动机器人能够在人类工作的三维空间中运动而不再受限于二维平面。对于在三维环境中运动的机器人,楼梯可能是到达目的地需要通过的路径,也可能是需
传统对卫星的导航与轨道控制模式是采用地面遥测遥控的方式,利用地面站在可见弧段内对卫星跟踪并进行数据处理,获取卫星的轨道姿态等信息,同时根据任务要求,将遥控指令上传至卫星
电弧炉炼钢具有能充分利用废钢资源、炼钢流程短、吨钢能耗小等优点,适应国际钢铁工业可持续发展的形势,因此得到了越来越多的应用,已成为最重要的炼钢方法之一。电弧电流和电弧电压是电弧炉控制系统最重要环节电极控制器的输入,精确测量电弧电流和电弧电压是保证电极控制器正常工作的前提。但是如何经济又精确地测量电弧电流和电弧电压仍然是现阶段存在的难题。本文以吉林通化钢铁公司120t电弧炉为研究对象,对电弧电流和电
无线传感器网络被认为是21世纪十大新兴技术之一,引起社会各界广泛关注。源定位是无线传感器网络重要应用之一,其中包括声源定位、气体污染源定位、灾难援救如火灾、地震灾害
本论文致力于研制具有较高集成度和自主知识产权的车载视频点播系统。 随着现代信息技术、电子技术、计算机控制技术、以及汽车装备技术的不断发展,新兴的电子应用系统——
市场经济的不断完善以及网络技术的飞速发展与广泛应用,极大地冲击了当前机床产品的设计与制造模式,为了满足当前市场的需求,弥补机床产品设计的市场响应能力的不足,缩短机床