基于语谱图与HSF特征的情感识别方法研究

来源 :温州医科大学 | 被引量 : 0次 | 上传用户:roubaozi320
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言交流是日常生活中最常用的交流方式,而语言通常以语音的形式被表达出来。人们所说的每一句话,不仅包含着说话人所表达的语义信息,还蕴含着说话人丰富的情感信息。语音情感识别就是让计算机通过人类的语音,获得说话人的情感状态,具体过程为:从语音的各种形式中提取特征,选择与情感相关度较高的特征进行训练模型,使其具有辨别不同情感的能力,最后使用测试集验证模型性能。
  本文采用语谱图和HSF(High-level StatisticalFunction)特征两种方法来研究语音情感识别,并以CASIA汉语情感数据库、SAVEE英语情感数据库和Berlin德语情感数据库三个不同语言数据库作为实验数据,实现了机器学习和深度学习两类不同模型上的情感分类。(1)基于语谱图的语音情感识别:语谱图被处理后,导入AlexNet和基于AlexNet的改进模型进行训练和识别,实验结果表明:相比于AlexNet,改进模型在三个数据库的情感识别准确率有大幅度地提高,平均提高了6%左右。(2)基于HSF特征的语音情感识别:将MARSYAS(Music Analysis,Retrieval and Synthesis for Audio Signals)提取的LLD(Low-Level Descriptor)特征统计得到HSF特征,使用经过特征选择后得到最佳HSF特征集,以支持向量机(Support Vector Machine,SVM)、反向传播神经网络(Back Propagation Neural Network,BPNN)和深度置信网络(Deep Belief Network,DBN)作为分类模型,得到了三个数据库的情感识别结果,BPNN在三个数据库上的情感识别结果均比SVM和DBN要好,尤其是在Berlin德语情感数据库上实现了84.11%的识别准确率。最后,通过比较不同模型在三个数据库上的情感识别结果,总结了两种语音情感识别方法的实施技巧,并从多方面分析了情感分类准确率低的原因,证明了改进模型的有效性和HSF特征的优越性。
其他文献
提速和重载是中国铁路运输的发展方向,但提速以来,货车空车脱轨事故频频发生,给国家和人民的生命财产安全造成了重大的损失,该文针对空车脱轨这一实际情况对铁路货车动力学性能进行了认真地分析和讨论.该论文采用动力学软件Adams/Rail对具有转8A转向架的车辆系统进行研究,通过对转8A转向架结构组成、各组成部件在实际运行过程中相互作用以及性能参数等方面细致地分析,建立了货车系统动力学模型.在该模型中,对
学位
本文以超燃冲压发动机内气体流动、混合和燃烧为背景,结合试验验证、数值仿真与理论分析,研究了高总温条件下的火焰稳定模式及稳焰机制。  首先结合NPLS技术和大涡模拟方法,分析了喷孔至凹腔间的喷注距离、射流/来流动压比和喷孔数量对凹腔上游横向喷注的流场结构和混合特性的影响。短距离喷注时,凹腔上游射流近壁面反转旋涡对带动剪切层内涡发展;长距离喷注时,射流与凹腔间相互作用强度大幅降低,K-H(Kelvin
固液火箭发动机因具有低成本、高安全性和可靠性、灵活的能量管理和多次启动等优良特性,越来越受到国内外航天推进专家的重视.由于氧化剂和燃料的燃烧方式不同,固液火箭发动机工作过程和液体火箭发动机及固体火箭发动机有很大的区别.该文结合85%HO—PE固液火箭发动机试验,从以下几个方面比较系统地研究了固液火箭发动机的工作过程:1.设计和建造了85%HO—PE固液火箭试验发动机和挤压式固液火箭发动机试验系统,
本文以钠基蒙脱土(Na-MMT)为原料,硅烷偶联剂(KH550、KH560、KH570、KH792)和硫酸铜(CuSO4)为复合插层剂,水为溶剂,在pH<4(醋酸调节)条件下,合成了四种铜-有机蒙脱土(Cu2+-OMMTs)。通过热失重法、烧失率和原子吸收分光光度法测定了硅烷偶联剂和Cu2+的含量。利用X-射线衍射法对其结构进行表征,结果表明:硅烷偶联剂进入了蒙脱土的片层,并扩大了层间距。X-射线
学位
该文以碳颗粒催化氧化及碳颗粒还原NO为模型反应,系统地考察了钙钛矿型复合氧化物及其负载的Ag催化剂在柴油车排放碳颗粒物和NO的催化净化中的性能,并对催化剂进行了比表面积(BET)及表面总氧量,XRD,XPS和TPR表征与测试.
动脉,毛细血管和静脉中的血流动力学与生物不同的生理和病理状态密切相关。监测生物体内的血管和血流量不仅是研究生物组织功能和疾病机理的重要工具,而且是临床诊断的重要手段。空间频域成像(SFDI)作为一种用于获取组织的光学和生理参数的有效方法,特别适合于研究血液动力学。本文中,我们提出了用于功能性神经影像学,非神经影像学和相干血液动力学光谱学的动态微循环PIPE模型。组织中血红蛋白浓度和氧饱和度随时间的
实验目的:  视神经轴突损伤后难以再生仍然是临床上面临的关键问题。作为一种中枢神经,视神经轴突损伤后难以再生有着复杂的分子生物学机制。除了中枢神经元本身再生能力有限外,轴突损伤切断了生长因子沿轴突从脑靶区向视网膜神经节细胞(RGCs)运输,损害了RGCs的正常生理功能,并进一步促进RGCs凋亡,限制了轴突再生的潜力。因此运用材料学的方法,在损伤部位植入具有生长因子缓释功能的药物载体,弥补因轴突损伤
学位
目的:  开发在温和条件下制备蛋白质微胶囊的简单、普适的方法。对该蛋白质微胶囊进行物理和化学性质表征后,证实了该方法的有效性和蛋白微胶囊的多功能性,为蛋白质微胶囊的制备提供一种新的途径。  方法:  1.通过共沉淀法制备掺杂单宁酸的碳酸钙模板后将该颗粒加入各种类型的蛋白质溶液中进行孵育,随后通过交联剂(DMT-MM)进行交联,最后加入EDTA去除碳酸钙模板来制备各种类型的蛋白质微胶囊。通过多种表征
作为全球产科难题,仅我国孕妇早产(Preterm Birth,PTB)比例为5%~15%,早产儿病畸残及死亡率显著增加,临床上预测早产的诊治技术十分有限。因此需要更为准确的方法来确定早产的风险。在生物医学基础研究及临床诊断中,获得人体及生物体的形态和功能学信息主要依赖于各类成像技术。Mueller偏振光成像不仅能提供丰富的样品结构和光学信息,且对亚波长微观结构变化十分敏感。空间频域成像技术(Spa
实验目的:  三维泡沫Ni(3D NF)是一种可以直接用于无酶葡萄糖电化学检测的电极材料,但该材料的化学稳定性差,不能长时间重复使用。本论文采用石墨烯包覆的方式对3D NF材料进行改性,提升材料的稳定性,并进一步通过在电极表面原位沉积Au纳米粒子提升电极的催化性能,以构建检测性能优异、稳定性好、可重复使用的无酶传感电极,用于血糖的测定。  实验方法:  以3D NF为基底材料,通过高温化学气相沉积