噪音环境下汉语连续数字的语音识别

来源 :南华大学 | 被引量 : 1次 | 上传用户:kingzdh410
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前的语音识别系统对纯净语音可以达到非常高的识别精度,但是环境噪声给语音识别系统造成很大的影响,导致识别器的性能急剧下降。因此抗噪问题是语音识别真正达到实用必须解决的关键问题。首先,对语音端点检测的传统方法进行了改进:采用语音信号的短时能量和过零率结合,并根据实验结果合理的设置了门限和判定方法。在强噪音环境下,提出了结合谱减算法的新的端点检测算法。其次,阐述现阶段常用去噪方法:二项式加权、维纳滤波、谱减法等。针对谱减法存在的三大问题,提出解决方案,并结合新的端点检测算法和MFCC,提出了二次去噪算法。比较各种方法的识别率,发现新的算法对噪声削弱效果较好。然后,研究了HMM模型,讨论了HMM需要解决的三大经典问题及解决方法,并介绍了语言模型的重要性和局限性,以及在大词汇量的语音识别中如何使用N元语言模型。最后,基于以上的分析结果,在matlab7.0实验环境下,对比四种去噪方法对孤立数字识别率的影响。在此基础上,构建了一个基于HTK的不定长汉语连续数字的语音识别系统,并采用四种方式进行去噪,比较识别率,从而证实了新的去噪算法具有一定的价值。
其他文献
MANET网络是移动Ad hoc网络的简称,它是由一组带有无线通信收发装置的移动节点组成的一个临时、多跳的网络,不需要中央控制设施。网络中的节点既是路由器,又是主机,作为对等
转杯纺纱又称气流纺纱。在纺纱领域中,转杯纺纱是目前技术上最成熟、应用面最广,经济效益十分显著的一种纺纱方法。而在我国,全自动纺纱机全是进口设备,实现我国自主研发的全
随着网络技术的不断发展,教育和学习的区域化、全球化趋势同样也得到迅猛的发展,并成为各国教育发展战略和决策的重点课题。世界各国在大力发展网络教育的过程中深刻认识到,教育
随着航空技术的发展,飞行的安全性和可靠性得到了不断提高,然而航空维修领域的维修差错问题却不断的显现出来,与维修差错相关的不安全事件呈上升趋势。为了防止维修差错的重
随着软件系统的日益复杂,软件开发、维护以及进化的大部分工作和主要成本集中在对现有系统的理解上。软件逆向工程是一种辅助程序理解的重要手段,其目标是利用工程化的方法和
虚拟结肠镜(virtual colonoscopy, VC)计算机辅助检测(computer-aided detection, CAD)是利用息肉与正常组织形态以及其他特征的差异由计算机实现结肠息肉自动检测的新的技术
多媒体技术是近几年来计算机领域应用十分广泛的技术之一,随着个人PC的快速普及和网络技术的迅猛发展,多媒体技术的应用需求在未来几十年内仍将增加。这些多媒体信息,特别是
随着Internet技术的迅速发展,Web信息日益膨胀,人们不得不花费大量的时间去搜索自己需要的信息。目前大多数的搜索引擎提供的服务还不能令用户满意,如何从大量的网络信息中挖
随着网络时代的发展,计算机支持的协同工作系统(CSCW)已引起工业界和学术界的高度重视,而作为一个发展的研究领域,协同工作还存在着很多问题有待进一步研究和解决,其中之一就
随着社会的进步和信息技术的发展,身份识别技术日新月异。虽然,近年来RFID卡和二代身份证等一些以射频技术为基础的识别手段,已在身份识别领域得到了广泛应用,利用指纹、语音