结合语谱图和神经网络的语音情感识别

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:greenosnake
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音作为人们日常交流最重要的方式之一,其中蕴含了大量的跟情感相关的信息。随着近年来人工智能的发展以及技术研究的深入,使得人机交互成为了当今的研究热点,让机器具备跟人一样能识别和表达情感的能力成为研究者们的目标,语音情感识别的重要性也日益凸显出来。语音情感识别是语音处理领域富有挑战性的课题之一,它的应用非常广泛,因此,这项研究具有重要的理论意义和应用前景。目前,在语音特征提取方面,大多数研究者选择的是韵律特征、音质特征或者是基于谱的特征,而把时域和频域结合在一起的研究则相对较少。而语谱图具有把时域信息和频域信息结合在一起的特点,它本身就包含了大量跟语音相关的信息,因此本文选用语谱图来提取语音情感特征。本文的主要研究工作如下:1)阐述了语音情感识别的研究背景和意义,对语音情感识别的研究历史和现状做了简单的归纳总结,研究情感分类的模型、常用的语音情感数据库。2)对语音情感数据的预处理能够提高分析精确度,本文对语音的预处理包括预加重、分帧加窗和端点检测,经过预处理之后,提取出语音信号的基音频率、短时能量、短时过零率、共振峰和梅尔倒谱系数等参数组成情感特征矢量。3)在简单研究人工神经网络的发展、基本的模型、分类的基础上,运用典型的多层感知器——BP(Back Propagation)网络进行语音情感识别的实验,并运用增加动量项对BP网络进行优化。实验结果表明,改进的BP网络的识别率高于普通的BP网络。4)研究典型的深度学习网络结构——卷积神经网络(Convolutional Neural Network,CNN),并将其与传统的人工神经网络进行了对比,重点研究CNN的基本原理和优势。本文提出将语谱图和CNN结合进行语音情感识别的研究,通过实验找到最佳的网络模型结构,在不同的环境以及不同的信噪比下进行对比实验,并选用softmax和支持向量机(Support Vector Machine,SVM)两种不同分类器做对比。为了更进一步的验证算法的有效性,将实验在不同的语音库上进行。实验结果表明,将语谱图和CNN相结合的方法大大地提高了语音情感的识别率,并且使用SVM作为分类器效果比softmax的识别效果更好。
其他文献
江泽民总书记在党的十五大报告中指出:“非公有制经济是我国社会主义市场经济的重要组成部分。”这给我国进一步加快发展非公有制经济提供了思想保证。只要我们认真领会十五
软件过程改进是保证软件产品质量稳定的基础。有效准确的软件过程评价方法可以提高过程改进效率,为成功地进行过程控制和改进提供保障。本文结合具体应用实例,运用层次分析(AHP)
1.以下不适用于旁中心注视性弱视治疗的方法是:A.后像疗法;B.红色滤光片疗法;C.Haidinger刷训练;D.视刺激疗法。
从"无废城市"建设的现实需求和内在动力出发,阐明"无废城市"建设的必要性与紧迫性;对"无废城市"建设进行系统性思考,把握"无废城市"建设的具体内涵,进而明确"无废城市"建设的
身高不足1.5米,佝偻着背的残疾人,靠每年代人放牛,拥有了一份可观的家业,成为当地的富裕户。他就是家住在八十二团化工厂的丁圣寿。
目的:观察参地补肾胶囊对肾小球硬化大鼠基质金属蛋白酶(MMP-9)、基质金属蛋白酶抑制物(TIMP-1)及其受体mRNA表达的影响,探讨其抗肾小球硬化的机制。方法:采用单侧肾脏切除同时尾静
目的:对比分析宫腔镜下宫腔微型弯剪刀粘连分离术与双极电针分离术治疗宫腔粘连效果。方法:选取72例宫腔粘连患者,随机分为观察组和对照组,观察组给予宫腔镜下宫腔微型弯剪刀
由云梦秦简所提供的资料可以看出,秦国在其发展过程中,在经济方面曾实行精确化管理,这种管理方式曾有效地促使秦国的经济发展、国力强盛,为其统一中国奠定基础。但秦国的精确
荨麻疹为免疫系统疾病,由于过敏原使机体致敏引起,中医称"( )"、"风疹块"、"风隐疹".<医宗金鉴>云:"此证名鬼饭疙瘩",多由表虚之人汗出受风或露卧乘凉,以及饮酒或其他病后而
采用超声辅助非水解溶胶-凝胶技术制备纳米ZnO,探讨了醇种类对产物结构、形貌的影响,并对反应机理进行了推测.以亚甲基蓝为模拟污染物,对纳米ZnO的光催化性能进行了评价.结果表明,