基于频谱上下文的语音识别及情感分类算法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:LZLZ
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别系统经过多年的发展已经在很多场合取得了良好的应用效果,但是普及程度并不理想。特定环境下搭建的语音识别系统,在实际复杂应用场景中往往很难实现有效的识别结果。由于背景噪声干扰、说话人情绪变化以及信道畸变等因素的影响,使得实验室环境下训练好的语音识别系统在实际应用中性能急剧恶化,难以达到令人满意的结果。本文根据语音识别及情感分类中一些关键步骤和上述研究现状及难点,着重对噪声干扰和情绪变化下的语音识别系统进行研究。主要内容包括:(1)提出一种基于上下文特征描述符的特征提取方法。在噪声环境下以及不同情感环境中,传统语音特征难以提供有效的动态信息。因此,本文构建出一种频谱序列的上下文(SSC)的特征方法,对比传统的动态信息处理方式,系统性能有显著的提高,在噪声环境及语音情感识别中都取得了良好的效果。而且在其他频谱过程中都可引入此特征,方法具有一定的普适性。(2)研究噪声环境下的语音识别,提出一种基于递归图压缩距离的语音识别算法。语音信号作为一个随时间变化的序列,通过研究递归图模型在时间序列中的显著作用,将语音特征序列进行递归图压缩,利用MPEG-1压缩算法计算不同递归图之间的CK-1距离,完成整个语音识别过程。(3)研究情绪变化中的分类决策,提出一种基于多特征深度置信网络的语音情感识别算法。针对不同特征对情感描述能力的不同,我们提取多种鲁棒的低级特征,然后将其馈入DBN网络中提取高层特征描述符,进而采用集成学习的思想,对ELM分类结果投票融合,在三种公开数据集上证明了本文算法的有效性。
其他文献
随着新课程标准改革及新高考改革的不断推进,培养学科核心素养逐渐取代培养学生应试能力,成为了高中学科教学活动开展的重要目标。因此,高中地理学科作为高中生需要学习的重
目的探讨全程吸入七氟烷对房室缺修补术患儿心肌肌钙蛋白I(c Tn I)和肌酸激酶同工酶(CKMB)的影响。方法选择择期行房室缺修补术患儿30例,随机分为两组,观察组15例,对照组15例
中国经济进入新常态,整体增速放缓,资本市场创新、互联网金融爆发式增长等都对传统商业银行业带来很大挑战。本文通过对互联网金融现状进行阐述,与传统商业银行进行比较,探索
针对航空发动机分布式控制系统的时延问题,应用Matlab的Truetime工具箱,设计了控制系统仿真分析平台,分析了时延对系统稳定性的影响。首先针对一类应用状态反馈的控制系统,分
本系统的设计目的是为了满足消费者只要通过互联网就可以足不出户的订购自己喜欢的菜品,改变传统商业交易,在互联网上进行交易,实现网上购买菜品,提高酒店良好的社会效益和经
现阶段,谨慎原则要求会计报告向信息使用者提供尽可能全面的会计信息,特别是应报告有关可能发生的风险损失。按谨慎原则对资产减值情况进行会计处理时,也就形成了资产减值会
<正>有钱币的制造和发行,就有钱币的流通和收藏,便会有钱币的市场。从文化意义上来讲,钱币是由货币和货币文化的衍生物组成的。用我们现在的眼光来看,在古代,古钱是由古代的
一 宁王的檄文宁王朱宸濠在江西散发的举兵檄文,今天已找不到原件,但据当时看过檄文的人讲,其内容"词语凶悖"。如果结合朱宸濠在起兵那天对江西地方官员的讲话,也可知道这道檄
针对近地爆炸严重威胁地面人员和建筑安全的问题,利用ANSYSY/LS-DYNA软件对炸药近地爆炸进行数值仿真,仿真结果与叶晓华公式和GB6722—2003公式吻合较好。结果表明:在马赫反
<正>从四川省成都市的都江堰市区出发,往西南方向行进5公里,就可到达玉堂镇凤鸣、岐山村及中兴镇横山村的交界处,在这片人称“上九包、下九包”、方