基于谱图特征的语音情感识别若干问题的研究

来源 :东南大学 | 被引量 : 9次 | 上传用户:quchaolove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了使人机交互系统更加自然和智能,针对语音情感识别的研究受到越来越多学者的关注。近几十年,针对语音情感识别的研究已经取得了较大的进步,语音情感识别系统的性能得到了巨大的提升。然而,在现有的语音情感识别系统中,仍然缺乏一些能够准确识别语音情感信息的特征,因此,针对语音情感识别特征提取的研究,仍是语音情感识别领域研究的重点。语音中的情感内容与频谱能量的分布有密切的关系,部分学者将一段语音的频域系数构建成图像——谱图,并采用图像描述子从谱图中提取语音情感相关特征,取得一定的成果。由于该方向在情感识别领域刚刚兴起,仍然存在许多问题需要研究。首先、谱图中的哪些信息与语音情感类型有关?其次,如何从谱图中有效地提取这些信息?针对上述问题,本文基于语音情感信息与谱图纹理及能量分布的密切相关性,开展了基于语音谱图特征的情感识别研究,相关研究工作如下:1、基于语音情感类型与语音谱图纹理分布的密切相关性。提出了一种基于Gabor灰度图像谱局部二值模式(GGSLBP)特征提取方法。GGSLBP首先构建语谱图灰度图像;然后采用Gabor小波放大语谱图灰度图像的局部纹理信息,得到Gabor灰度图像谱;最后采用局部二值模式(LBP)提取Gabor灰度图像谱的局部纹理信息,得到GGSLBP特征。仿真实验显示:与传统的声学特征相比,GGSLBP特征具有较好的识别性能。2、针对局部二值模式(LBP)忽略了谱图中幅度信息且GGSLBP特征复杂度较高的问题,提出了一种面向语音情感识别的改进可辨别完全局部二值模式(IDisCLBP_SER)特征提取方法。首先生成语谱图灰度图像;其次采用完全局部二值模式(CLBP)计算图像的符号模式(CLBP_S)、幅度模式(CLBP_M);再次,不同于传统DisCLBP算法,IDisCLBP_SER取消了 CLBP_S、CLBP_M旋转不变映射处理,直接采用可辨别特征学习模型计算CLBP_S、CLBP_M的全局显著性模式集合;最后,采用全局显著性模式集合对CLBP_S、CBP_M特征处理,并将处理后特征级联,得到IDisCLBP_SER特征。实验表明:所提特征与现有声学特征融合后可以提升语音情感识别系统的识别性能。3、为探讨图像描述子中的旋转不变性是否适用于Mel对数能量谱图特征,提出了一种基于局部归一化中心矩谱图特征(LNCMSIF)提取方法。LNCMSIF首先采用二阶归一化中心矩描述Mel对数能量谱的局部能量分布信息,得到归一化中心矩谱;然后,采用离散余弦变换消除归一化中心矩谱系数间相关性,得到归一化中心矩谱倒谱系数;最后,将归一化中心矩谱及其倒谱系数组合在一起构成LNCMSIF特征。旋转不变性测试实验表明:旋转不变性不完全适用于Mel对数能量谱图特征。识别实验表明所提方法可以取得较好的识别结果。4、考虑到图像特征描述子的表征能力有限,不能充分地描述Mel对数能量谱中的情感信息。提出了 2种基于Gabor谱局部能量分布信息的谱图特征提取方法,分别为基于Gabor谱局部Hu不变矩谱图特征(GSLHuM)和基于Gabor谱局部归一化中心矩谱图特征(GSLNCM)。GSLHuM首先采用Gabor小波对Mel对数能量谱进行处理,得到Gabor谱;然后,采用1阶Hu不变矩描述Gabor谱局部能量分布信息;最后,采用离散余弦变换消除相关性,得到GSLHuM特征。类似的,GSLNCM特征采用归一化中心矩从Gabor谱中提取局部能量分布信息。仿真实验验证了所提的GSLHuM特征和GSLNCM特征的有效性。此外,与Mel对数能量谱图特征相比,旋转不变性对Gabor谱图特征识别性能影响较弱。
其他文献
传统文化的人生理想着眼于理想人格的形成,可以为我们培养健康向上的人生理想提供深刻的启迪;传统文化的人生态度以乐观主义人生哲学为基础,提倡自主精神,有利于我们建立健康
智能消防小车系统采用STC89C52单片机作为核心器件,并由智能消防小车、火灾报警器和控制中心三部分组成。智能消防小车有无线通信、高温报警、智能循迹等功能;控制中心负责向
本文研究了图形结构约束与尺寸约束的允动求解机制,并且采用了双向十字链瑶存储尺寸链稀疏矩阵,并解决了其双向遍历问题,实现了图形的经尺寸驱动以及多视图的联动。该方法能使设
<正>走进山东省临澧县的农村社区,有的村民在听科技讲座,有的在看书阅报,还有的在网上浏览致富快讯,这是临澧县加强农村社区文化建设后出现的新气象。为了提高社区村民的文化
综述了蒙藏药的概况及色谱分析法在蒙藏研究中的应用,并通过色谱分析法在蒙藏药鉴别中的应用现状,高效液相色谱法在蒙藏药定量分析中和薄层色谱法在蒙藏药定性分析中及气相色
20世纪20年代以来的苏联工业题材小说为十七年中国工业题材小说的创作提供了可资模仿和借鉴的样本。概括说来,前者对后者的范式作用主要体现在主题思想和叙事模式上:苏联工业
在阐述负荷预测的分类、负荷模型的基础上分析了负荷预测的基本方法,论述了预测方法程度优缺点及其适用范围。最后在电力市场环境下分析了负荷预测的影响因素,并对电力市场环
<正>二轮复习的主要目标就是学会构建知识体系。在自主构建体系的过程中,同学们要树立整体意识,具有学科内容的整体视野;要厘清4个模块的知识体系,根据社会生活热点或者思想
物料搬运系统是CIMS是一个重要组成部分。本文介绍了适用于CIMS的几种常用物料搬运系统,分析了各自的特点,并论述了面向CIMS的物料搬运系统选择的原则及策略。