嗅觉滤波器组在语音识别系统中的应用

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:hellolin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别的一大难点就是识别系统在噪声环境下性能大幅下降,人耳具有良好的抗噪能力,如何让识别系统能像人耳一样具有选择性,建立符合人耳听觉特性的听觉模型是长期以来广大研究者的研究热点。本文针对识别系统中噪声鲁棒性的问题,将听觉滤波器应用到过零峰值幅度(Zero Crossing Peak Amplitude,ZCPA)特征提取过程中,得到新的特征,并将其应用到语音识别系统中。   本文首先对ZCPA特征提取过程进行了详细的介绍。该模型是用输入信号的上升过零率表征信号的频率信息,峰值幅度表征信号的幅度信息,最后将二者规整输出ZCPA特征。   此外,本文实现了Gammatone滤波器,该滤波器是一种基于耳蜗基底膜特性的较为理想的听觉滤波器。将16通道的Gammatone滤波器代替FIR滤波器用于ZCPA特征提取中,得到GTZCPA特征。实验表明,由于Gammatone滤波器在设计精度上没有做到FIR滤波器的各通道精确设计,没有达到理想结果。   针对Gammatone滤波器频响呈对称分布特性不符合人耳的听觉特性这一不足,本文在Gammatone滤波器的基础上,实现了Gammachirp滤波器。Gammachirp滤波器不仅体现了基底膜带通滤波器组带宽非对称分布的特征,还实现了对输入信号的强度依赖特性。首先将16通道频响非对称分布的不依赖强度的Gammachirp滤波器组应用到ZCPA特征提取中得到A GCZCPA特征。实验表明,频响非对称分布的Gammachirp滤波器组较频响对称分布的Gammatone滤波器组其识别结果有明显提高。其次,将16通道频响非对称分布的依赖强度的Gammachirp滤波器组应用于ZCPA特征中得到GCZCPA特征识别结果。实验结果表明,强度依赖的Gammachirp滤波器较不依赖强度的Gammachirp滤波器系统的噪声鲁棒性能更好。
其他文献
随着科技日新月异的进步发展,互联网技术每天都在改变我们的生活,人们之间信息的交流变得越来越方便,但这同时也带来隐患,在信息的传输过程中,重要信息被窃取屡见不鲜,所以对
小学语文既具备语言功能,又具备文化教育功能,是培养小学生语言能力和情感素养的重要学科.小学生具有明显的情感特征,对新鲜事物十分好奇,很容易被新鲜事物所吸引.而小学语文
盲源分离是信号处理领域的研究热点,近几年来,吸引了神经网络学界和信号处理学界众多学者的研究兴趣。简而言之,盲源分离就是在传输信道特性未知、输入信息未知或有少量先验
作文教学是中学语文教学的重要组成部分,是培养和提高学生在日常学习和工作中所必须的具备的一般的写作能力的重要手段.然而现实的作文教学中,很多现象不尽人意,学生感到很困
期刊
数字水印技术能将表明所有者身份的版权信息嵌入到数字产品中,以达到版权保护与内容认证等目的。因此,数字图像水印技术已成为当今的一个研究热点。本文针对数字图像内容认证的
机会网络(opportunity network)是近年来出现的新型网络,它不同于传统的移动自组织无线网络,节点移动、信号衰减、网络稀疏等因素造成节点在某一个较短的时间片内没有端对端的
互联网协议解析还原系统是对互联网络现行的应用层服务进行深度解析的软件。在当今互联网业务日益增大,互联网安全问题受到了严峻的挑战。目前,如何能够正确、高效地还原出互联
本论文主要研究了一种宽频带、低杂散的Ka频段上变频系统,该系统是卫星通信中不可缺少的组成部分,整个系统旨在实现140MHz信号到Ka频段的无失真的频谱搬移。在结合系统指标情
作为5G移动通信系统的一个标志性的技术,非正交多址接入技术对5G系统的用户容量、频谱效率和数据速率都有重大影响。与功率域非正交多址接入技术 NOMA(Non-Orthogonal Multip
随着网络基础设施的发展和移动设备的普及,在线视频流量增长迅速,在网络流量中占比越来越大。在线视频具有时变性,高峰期带来的网络流量远大于低峰期网络流量,如果满足高峰期