噪声环境下语音识别前端处理技术研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:lijie6857272
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人和人之间进行情感交流和信息传递最直接的一种方式。随着计算机和通信技术的飞速发展,人们希望摆脱键盘鼠标的束缚,直接与机器进行交流,达到人机交互的目的,语音识别技术的研究越来越受到大家的关注,也取得了不少成果。但在实际应用场合,由于各种噪声的干扰,语音识别系统的性能会受到严重影响,导致识别率大幅度降低,所以噪声环境下的语音识别研究成为关注的热点和难点。本文从语音识别的前端处理部分着手,重点针对语音增强技术,对语音增强的相关算法进行了研究和实现,其主要内容和成果如下:   第一,分析了语音识别抗噪技术研究中存在的一些问题,通过现有抗噪方法的对比指出语音增强适合作为预处理手段直接应用于语音识别前端处理部分,并对语音增强的相关知识和常用语音增强算法进行了分类介绍,重点对谱减法和维纳滤波法进行详细描述。   第二,针对谱减法对噪声估计不准确,造成残留“音乐噪声”,影响语音质量的问题,提出基于噪声短时谱动态估计的改进方法。采用噪声平滑公式更加及时准确地估计噪声谱,引入过减系数控制谱减幅度,并根据反映噪声变化趋势的惯性量来动态调整过减系数。通过仿真实验和语音质量评价方法,证明该改进算法能够有效去除残留噪声,达到更好的增强效果。   第三,在维纳滤波法推广形式的基础上,结合人耳听觉掩蔽效应,建立了基于听觉掩蔽效应的两级维纳滤波模型,通过一级滤波增强后语音与纯净语音之间的误差与听觉掩蔽阈值进行比较,对相应参数进行调整,再进行二级滤波,得到最终的增强语音。仿真实验结果和语音质量的主观、客观评判表明,该改进算法在有效提高信噪比的同时减少了对纯净语音的破坏,保证了增强语音的质量。   第四,设计并实现了基于语音增强抗噪处理技术的孤立词语音识别系统,对系统硬件平台和软件方案的设计及实现过程进行了详细介绍。并且构建了专用的语音库对系统进行测试,验证了本文提出的改进算法能够有效抑制汽车噪声干扰,提高系统的识别率。
其他文献
汽轮机是发电系统中的重大资产设备,机组必须长期运行,而汽轮机转子作为汽轮机的核心部件之一,它的可靠性时刻影响着发电系统的正常工作,因此,作为重要资产,汽轮机必须长期进行维护
随着工业无线技术的飞速发展和日渐成熟,无线通信技术开始越来越多的应用到工业领域内的各行各业,为无线通信带来了新内容和新的挑战,也在很大程度上影响了工业检测与控制的手段
磁悬浮技术由于不存在直接的机械接触,与其他技术相比具有无摩擦、无需润滑、功耗低、清洁无污染等优点。经过几十年的发展,磁悬浮技术作为一种高新技术日趋成熟,其在交通、
随着中铁快运公司近年来业务的不断增长,企业在安全管理中的问题逐渐显现,中铁快运总公司希望通过对分公司的安全管理绩效评价,及评价后的奖惩措施,引导分公司逐步提高其自身
我国对机器人的研究起步较晚,但发展迅速,今年来有不少新的成果和产品发布。但室内服务机器人的研究进展并不理想,本文借鉴国内外对智能空间的研究,将智能空间技术引入室内服
随着工业生产向着自动化、智能化方向的发展,计算机视觉和图像处理技术在工业工件质量检测中的应用越来越广泛。焊缝的自动识别和直缝焊管的质量检测是图像处理技术在工业生
21世纪是人类向海洋进军的世纪,深海探测与作业技术是海洋开发研究的重要领域之一。在深海观测作业中,目前最常用的方法是基于水下机器人(ROVs/AUVs)的视频图像观测。视频图
本课题来源于国家科技部“973”计划子课题“不规则弱引力场中探测器运动行为分析与着陆控制”。导航、制导与控制作为远太空探测最基本也是最核心的一项技术,不仅影响航天器
迭代学习控制是一种新型控制算法,它不依赖于系统的精确数学模型,是一种以迭代产生优化输入信号,通过重复执行同一任务来减少误差,使系统输出尽可能逼近理想值的方法。迭代学
图像识别一直是模式识别领域中的重要研究课题之一。本文以交通标志的识别为研究背景,通过对其识别流程的详细分析,将课题分为图像分割、图像预处理、特征提取和分类识别。首