【摘 要】
:
目前大多数语音识别系统在静音环境下具有较高的识别率,但在噪声环境下,系统的性能会严重下降,为了使语音识别系统实用化,抗噪语音识别研究具有重要意义。 人耳具有很强的
论文部分内容阅读
目前大多数语音识别系统在静音环境下具有较高的识别率,但在噪声环境下,系统的性能会严重下降,为了使语音识别系统实用化,抗噪语音识别研究具有重要意义。 人耳具有很强的识别能力,即使在噪声环境下也如此。因此研究人耳的听觉特性,进行语音特征参数的提取,有利于提高系统的鲁棒性。 本文围绕抗噪语音识别这个中心,完成了以下研究工作。 首先实现了具有过零峰值幅度(ZCPA:Zero-crossing with Peak Amplitude)特征的语音识别系统,它是基于人耳的听觉模型建立起来的。该模型通过分析和计算语音信号相邻上升过零点间的间隔,并将之分配到对应的频率箱,以此反映信号的频率信息;再通过检测相邻上升过零点间的峰值幅度并进行非线性压缩,对频率箱幅度进行加权。论文分析了该系统的抗噪性能,通过实验证明了这种系统的抗噪性能优于常用的由LPCC,MFCC作为识别特征的系统性能。 接着,论文以上述系统为基础,提出了改进ZCPA特征,
其他文献
TETRA数字集群通信系统作为新一代数字集群系统能够提供多种业务,可以实现多种应用。数据业务是TETRA数字集群通信系统中最基本和最重要的部分之一。基于TETRA数字集群移动通
多媒体和网络通信技术的迅猛发展为多媒体信息的处理、发布和存储提供了极大便利,同时也给网络普及带来负面影响,如盗版侵权行为等数字信息安全问题。数字水印技术的出现,为
目的了解注射用双氯芬酸钠利多卡因不良反应发生的规律和特点,为临床有效防范和正确处置注射用双氯芬酸钠利多卡因不良反应提供指导和参考。方法对2014年我院患者在使用注射用
目的对305例以“拔牙后出血”为主诉就诊病例资料回顾性分析,总结拔牙后出血的原因和防治方法。方法将305例主诉为“拔牙术后出血”的临床病例按照出血牙位、出血原因、处理方
随着VPN技术在企业网络中的广泛应用,越来越多的不同需求提到日程上来。动态VPN新技术就是为了使得具备动态IP地址的设备随意接入VPN网络系统而设计的组网形式。它支持节点注
目的探讨社区卫生定向服务模式用于社区高血压、糖尿病管理中的方式及效果。方法选取我中心280例高血压及280例糖尿病患者,开展规范的社区卫生定向服务,对比干预前后患者疾病知
基于多输入输出(MIMO)的空时编码技术是实现未来带宽资源日益紧张的高速无线数据通信系统的重要技术,它结合了信道编码、调制和接收端的信号处理,能够充分利用无线通信信道中
研究显示,65岁以上老年人每年约有1/3的人跌倒1次以上,而且比例随着年龄增长而增加,80岁以上老年人跌倒的发生率可高达50﹪。卫生部2008年医院评价指南指出,在全国各医疗院所的通报
中央处理器是驱动计算机技术和产业发展的动力,CPU的设计和制造技术是计算机产业乃至信息技术产业发展的基础。进行CPU相关的设计研发工作有着重大的学术意义和现实意义。而