基于谱特征和ELM的语音情感识别方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:zhouj1790
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能的迅速发展引领了新一代的科技革命,作为人工智能领域最活跃的几个方向之一,人机交互近年来也受到越来越多的关注。情感计算是人机交互的关键前提,为了实现自然的人机交互,语音情感识别横空出世,让机器准确识别并掌握情绪信息,具有很大的研究价值和应用价值。语音情感识别在心理咨询、安全驾驶、教育、刑侦都有应用。针对目前情感特征提取无法准确表达语音中情感信息的问题,本文提出了一种基于谱特征和ELM的语音情感识别算法(A method with spectral features and ELM,SF-ELM)。常用的特征提取算法都是将语音信号按照短时平稳状态进行提取,而实际上声信号本身是非线性不平稳的。该算法提出了一种新的融合特征Teager听觉Mel频率倒谱系数,在Mel频率倒谱系数和耳蜗滤波倒谱系数的基础上加入反映信号能量变化的非线性Teager能量算子,强调语音信号的非线性特征,并将新特征与基本情感特征集组合构成混合特征集,丰富了语音信号情感特征。该算法构建了极限学习机随机森林的分类模型,基分类器采用根据不同基本情感之间的混淆程度而建立的极限学习机决策树模型,有效降低了决策树弱分类性带来的错分风险。本文在中国科学院自动化研究所的CASIA中文语音数据库上验证了该算法的有效性,对开心、悲伤、惊讶、愤怒、恐惧和中性6种情绪都具有很好的识别分类能力,其中对开心、愤怒和中性三种情绪的识别率相较其他算法有较大提升。
其他文献
无线传感器网络(Wireless Sensor Networks,WSN)在众多领域有着广泛的应用,但由于其受到带宽限制、有限电池电量和动态拓扑等特性的影响易受到一系列安全攻击,尤其是虫洞攻击。虫洞攻击者通过对不在彼此通信范围内的节点建立伪造邻居关系并由此破坏网络功能。如何对虫洞攻击进行有效的安全检测并删除网络中的伪造邻居关系是无线传感器网络应用过程中亟需解决的问题。针对上述问题,本文提出一种基于
随着电子商务的发展,客户留言的价值逐步突显。从结构化、半结构的文本数据中获取高质量相关建议信息,呈现不可估量的商业发展前景。建议识别是自然语言处理中文本分类的一个应用场景,旨在利用自然语言处理技术,挖掘客户留言构成的自然文本,从而准确识别出哪些文本具有建议的属性,让商家聚焦这些建议内容,改进服务质量。本文从深度学习技术入手,探究如何建立有效的识别模型,如何利用文本蕴含的特征来增强建议识别模型的准确
二维金属硫族化合物具有新颖的电、光、磁、热特性,在超薄、透明、高集成度的光电子器件领域具有巨大的应用潜力。在二维材料及相关器件的研发中,探索新型的二维材料以及对其性质的探究是非常重要的研究方向,在此基础上开发新型器件将促进二维材料的实际应用。本文系统的研究了二维SnS与SnS2的生长工艺参数对材料光电性能的影响,主要研究结果分为以下两大部分:SnS是一种高度各向异性的硫族化合物,在偏振检测方面具有
随着能源的枯竭和环保意识的深入,人们逐渐意识到可持续发展的重要性。而水液压技术正符合人们的期望,在有望取代传统液压技术的道路上不断进步。但是由于水液压介质来源广泛,难免存在各种杂质颗粒,这将对水液压阀造成冲蚀磨损,严重影响到液压系统的稳定性和安全性。因此,本文针对水液压技术中的冲蚀磨损现象进行研究分析,分别从能量吸收、耐冲蚀材料和表面仿生结构三个方面对阀芯结构进行改进,运用仿真软件和冲蚀实验分析阀
教学风格是教师在长期教学过程中所表现出的个性化教学方法,学业自我效能感是个体在学习过程中对自身是否有能力实现目标的自信程度。在教学实践中,“如何教”比“教什么”更重要,教师的教学风格对学生的学业自我效能感与个性发展有重大影响。然而,当前对于教学风格与学生学业自我效能感的关系的研究多以高校师生为研究对象,而且多为理论研究。因此,探索初中英语教师教学风格与学生学业自我效能感的关系的实证研究具有重要意义
近年来,伴随着人工智能(Artificial Intelligence,AI)、物联网等领域的兴起,使得大数据的应用需求急剧增加,从而对存储器件的记录密度有了更高的要求。因为传统存储技术记录密度已经到达了物理极限,基于通过电子自旋相干操作进行调控的自旋电子器件开始逐步发展,这些器件不仅可以解决高功耗的问题,还可以突破目前速度和集成度的瓶颈。目前在自旋器件中最具优势的是具有读写速度快、功耗低且数据不
2007年《社会蓝皮书:中国社会形势分析与预测》表明,列于中国首位的社会问题就是“看病难、看病贵”。近十年来,我国人均医疗卫生费用的增长幅度早已超过人均国内生产总值的增长幅度。在既定的医疗保障体系下,百姓对于“看病难、看病贵”的呼声越来越高。D市也并不例外,就现有D市市级医院数据深入分析,医院收入药占比平均高达近35%,由此可见,患者医疗总费用趋高这种现实情况很大程度上源于药品利润较高,即医院收入
人脸表情识别(Facial Expression Recognition,FER)是指利用计算机技术获取人脸表情图像、检测人脸表情区域、提取表情特征和对表情特征进行分类的过程。由于人脸表情识别研究在计算机视觉领域占据着重要的地位,而且也是实现人机交互的关键技术,所以吸引着国内外学者的广泛关注和深入研究。目前,人脸表情识别技术的发展遇到了两个关键性难题:(1)人脸图像中头部姿态的偏转造成面部配准误差
烟草是我国非常重要的经济作物之一,特别是在云南、四川、贵州等地种植面积较大,为增加农民收入起到了非常重要的作用。由于自然条件、种植技术、生产条件、烟草种类等因素影响,各种植烟区生产出来的烟叶质量也有所不同。宜宾是四川重要的烤烟种植地区,2016年宜宾市烤烟种植面积5066平方公顷,烟叶产值达到1.7亿,但宜宾烟叶稳定性低、品质特征不突出,在加工生产方面满足不了工业配方要求。为进一步提高宜宾烟叶的质
多孔钛除有金属多孔材料的固有特性外,还具有耐腐蚀性,高强度等特点。因此在过滤分离、能量吸收、高效换热等领域,具有广阔的应用前景。本文以TiH2粉末为原料,选用NaCl为造孔剂,同时以Ti-6A1-4V纤维为原料,通过“压制+真空烧结”工艺分别制备了钛粉末多孔材料和钛纤维多孔材料,利用光学显微镜、扫描电子显微镜观察了两种多孔钛的孔结构。研究了造孔剂添加量、压制压力对钛粉末多孔材料孔隙率的影响规律,同