基于听觉模型与自适应分数阶Fourier变换的声学特征在语音识别中的应用

来源 :声学学报 | 被引量 : 0次 | 上传用户:jumglezhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分数阶Fourier变换在处理非平稳信号尤其是chirp信号方面有着独特的优势,而人耳听觉系统具有自动语音识别系统难以比拟的优良性能。本文采用Gammatone听觉滤波器组对语音信号进行前端时域滤波,然后对输出的各个子带信号用分数阶Fourer变换方法提取声学特征。分数阶Fourier变换的阶数对其性能有着重要影响,本文针对子带时域信号提出了采用瞬时频率曲线拟合求取阶数的方法,并将其与采用模糊函数的方法作了比较。在干净与含噪汉语孤立数字库上的语音识别结果表明,采用新提出的声学特征得到的识别正确率相对MFCC基线系统有了显著提高;根据瞬时频率曲线搜索阶数的算法与模糊函数方法相比,计算量大大减少,并且根据该方法提取的声学特征得到了最高的平均识别正确率。 Fractional Fourier transforms have unique advantages in dealing with non-stationary signals, especially chirp signals, while human hearing systems have superior performance that automatic speech recognition systems can not match. In this paper, the front-end time-domain filtering of the speech signal is performed by the Gammatone auditory filter bank, and then the fractional Fourer transform of the output sub-band signals is used to extract the acoustic features. The order of Fractional Fourier Transform has an important influence on its performance. In this paper, a method of obtaining the order by instantaneous frequency curve fitting is proposed for the subband time-domain signal, and compared with fuzzy method. The results of speech recognition on a clean and noisy Chinese isolated digital library show that the recognition accuracy obtained with the newly proposed acoustic features is significantly improved relative to the MFCC baseline system. The algorithm for searching orders and the fuzzy function method based on the instantaneous frequency curve The computational cost is greatly reduced, and the highest average recognition accuracy is obtained for the acoustic features extracted according to the method.
其他文献
在二手房交易铺天盖地的房源信息里,虚假信息不时出现--广告中的房屋或者早已售出,或者根本不存在,或者与广告信息大相径庭.这种现象得以存在,原因主要是我国存量房交易规则
为了研究复合材料雷击防护(lightning strike protection,LSP)系统在雷电流作用下的损伤规律,基于雷击过程中的能量守恒关系,建立复合材料层合板雷击防护的电-热耦合数学模型
期刊
一、资料整理流程的改进rn资料整理是档案管理中的一项传统业务,由于登记簿的作用越来越突出,对资料整理业务的要求也越来越高.为此,我们首先对业务流程做了一定调整.在原有
采用提高正极材料比容量以改善大电流放电性能的思路,设计新型高比容量复合正极材料,并通过研磨分散结合融化扩散热处理方法制备氟化碳-硫复合正极材料.电化学测试分析表明新
期刊
热能是一种广泛存在并极具应用前景的能源,但目前储热材料的能量转换时间较长,储热效率较低,亟需一种高性能的新型储热材料.本工作通过化学气相沉积(chemical vapor depositi
采用籽晶法在定向凝固炉中制备了一种[001],[011]和[111]取向的第四代单晶高温合金,分别在23℃,800℃和980℃研究了合金不同取向的拉伸性能,利用光学显微镜、扫描电镜研究不
采用微观和宏观包覆两种方式制备聚合物固态电解质包覆的硫@碳纤维复合固态电极,利用扫描电镜、元素分析和电化学测试表征电极的微观形貌,研究相应锂硫电池的电池性能.结果表
一、城市成长管理与保障-性住房rn城市成长管理是一种科学发展模式,这种模式提倡保护农地、复兴城市已有社区、保持住房的可支付性、提供多种交通方式的选择等理念.它与可持