基于多特征融合的多级分类和DBN的语音情感识别技术研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:uuuuurzm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音作为人类日常生活中最重要的交流方式之一,其中蕴含着丰富的情感信息。语音情感识别技术的研究对于提高计算机的智能化和人性化、开发新的人机环境和促进心理学等学科的发展具有重要的现实意义。论文的主要解决问题及难点分析如下:(1)某一情感特征难以精确表达某种情感状态。情感易受说话人的语调、语速、音量、内容等各因素影响,目前大部分情感特征未能充分考虑情感信息的完整体现,何种情感特征能充分表达何种情感状态尚未有十分准确的理论依据,这都严重影响了情感的识别率。(2)如何构建合适的分类机制从而降低易混淆情感状态之间的误识率。某些情感之间表现出比较相似的特性,传统的利用SVM进行语音情感识别只是采用一级分类就将所有情感进行分类,导致易混淆情感之间的误识率较高。(3)DBN网络训练过程中,在建立精确的网络模型基础上,如何缩短训练时间。传统DBN训练中,学习率的大小是不变的。在有效降低目标误差的同时并没有考虑时间效率问题,实时性达不到要求。(4)单模态的语音情感识别采用的情感特征信息比较单一,识别性能和鲁棒性是有限的。在实际应用中,噪声等复杂背景对语音情感识别有着严重的影响。往往通过语音单一模态信息难以精确识别情感类型。本论文的贡献和创新点主要包括如下几点:(1)提出了基于MFCC的多特征融合。本文采用短时能量、基音频率、共振峰频率以及MFCC融合后的特征替代单一情感特征,从而弥补了情感特征匮乏的缺陷。由于融合后特征维数过高,存在无关或冗余特征,本文利用LDA降维方法,去除冗余信息,从而达到提高语音情感识别率的目的。(2)提出了一种多级SVM分类构造算法。由传统方法得出的混淆矩阵,本文引入混淆度的概念,从而提出了一种多级分类构造算法。即先将容易区分的情感分开,然后再对易混淆的情感进行细分类,逐级地判断出待识别语音的情感类型。(3)提出了基于自适应学习率的DBN。本文将动态学习率加入到网络学习过程中。学习率调整的标准是检测权值的修正是否有效减少目标误差,如果减少,可以对其增加一个量,相反如果没有减少,则应该减小学习率的值。(4)提出了语音信号和人脸图像多模态融合。分别提取能反映语音情感和人脸表情的特征,然后采用特征层融合和决策层融合两种多模态信息融合策略来实现多模态情感识别。实验结果表明,融合语音和人脸的情感识别率高于单模态的情感识别率。本文上述提及的研究成果将为语音情感识别的研究领域提供全面的理论参考与支持。
其他文献
上肢康复机器人技术是机器人技术与康复医学的结合,是最近几年迅速发展的新兴技术。利用康复机器人对运动功能障碍的患者进行康复训练可减轻治疗医师的负担及提高康复的效率,研究上肢康复机器人,对于康复医疗以及机器人技术起到了极大地推动作用。本文是针对被动训练模式下上肢康复机器人运动轨迹的研究,在5-DOF上肢康复机器人的实验平台上,提出了在康复训练过程中控制上肢康复机器人跟随人体健康上肢的运动轨迹带动患者患
近年来,随着科技的不断进步,多智能体系统的协调控制已经成为研究人员关注的热点问题。一致性问题是多智能体中的基础问题,也是最重要的问题。本文将多智能体系统状态分解出不一致向量状态,在此基础上本文章对多智能体系统分布式事件触发一致性控制进行了相关问题研究。其中,主要包括以下几个方面:一方面,我们对一阶分布式事件触发多智能体系统平均一致性进行了研究。将系统状态分离成平均一致状态与不一致状态向量矢量和的形
目前利用赤眼防治鳞翅目害虫已经在全国推广,应用赤眼蜂进行害虫防治具有安全、环保和使用方便等优点,在减轻害虫危害和农业可持续发展中起着重要作用。水稻生长的后期病虫害(如:稻瘟病、稻曲病、纹枯病和稻飞虱等)总是混合发生,且化学农药是主要的防治措施,此时释放赤眼蜂难免会与农药直接或间接接触。农药不仅对赤眼蜂有毒杀作用,还会降低赤眼蜂的羽化率、寄生力、雌性比例、寿命和搜寻能力,严重降低防治效果。生物防治与
研究表明,恶性疾病密切相关的生物活性分子主要通过表观遗传或转录等层面调控致病基因的表达。临床液体样品(尿样、血浆或细胞裂解液)中与恶性疾病相关的生物活性分子(微小RNA和DNA修复酶活性)的灵敏检测,对于研究疾病的发生机理、预防及药效监控有重要意义。然而这些物质在临床液体样品中丰度极低,经典探针检测灵敏度不够,如何开发高灵敏和高特异性的功能探针,是生物活性分子检测面临的瓶颈问题。DNA纳米编码技术
克氏原螯虾(Procambarus Clarkii)隶属于节肢动物门、甲壳纲、十足目、螯虾科、原螯虾属。在中国分布较广,是目前淡水养殖业中具有较好养殖前景的品种之一。自1970年起,我国克氏原螯虾开始进行人工养殖,但近年来,克氏原螯虾种质出现了退化,包括性早熟、规格变小、商品率低、抗病能力下降等极大的影响了克氏原螯虾养殖业的效益。要实现克氏原螯虾养殖业的可持续发展,迫切需要对克氏原螯虾进行资源保护
间苯二甲胺分别与4,4’-氧双邻苯二甲酸酐、3,3’,4,4’-二苯甲酮四甲酸二酐、3,3’,4,4’-联苯四羧酸二酐、4,4’-(六氟异丙烯)二酞酸酐和4,4’-(4,4’-异亚丙基二苯氧基)双(邻苯二甲酸酐)在间甲酚中通过一步法合成了5种聚酰亚胺(PI)。采用FTIR、1HNMR、DSC、TGA、UV-Vis对聚合物进行了表征。结果表明,所制备的PI特性黏数在0.36~1.44 dL/g,在酚
本文分别采用水热法和恒电位电沉积法制备了钴酸镍/氢氧化镍复合材料和石墨烯/氢氧化镍/氢氧化钴复合材料。利用红外光谱(FT-IR)、X射线粉末衍射(XRD)和X射线光电子能谱(XPS)技术对复合材料的结构进行了表征,采用扫描电子显微镜(SEM)观察了复合材料的形貌,并利用循环伏安(CV)、恒电流充放电(CP)、交流阻抗技术(EIS)研究了钴酸镍/氢氧化镍和石墨烯/氢氧化镍/氢氧化钴复合材料的电容性能
肿瘤标志物的灵敏检测对癌症的早期预警诊断、监测复发及判断预后均有重要临床意义。然而肿瘤标志物在临床液体样品(尿样、血浆或肿瘤细胞)中含量极少,如何开发具有高效输出信号强度的探针是肿瘤标志物检测面临的瓶颈问题。功能核酸纳米材料作为一种新兴的生物纳米材料,具有可编程性和携带多种功能单元分子的优势,在生物分析领域引起越来越多的重视。其中,基于“多价结合”策略构筑的功能核酸探针,可借助多倍单体重组的“整体
随着经济的快速发展和传统能源日益枯竭,光伏、风能等分布式清洁能源发电受到人们的广泛关注,而作为分布式发电主要载体的微电网成为主要研究方向。三相电压源型逆变器常作为微电网中衔接分布式发电单元重要组成部分,需要发展合适的控制方法对其调控以保证微电网的稳定可靠运行。在低压微电网孤岛运行模式下,电压、频率缺少大电网的支撑。因此,如何设计有效的控制方法保证分布式发电单元功率均衡分配,同时消除电压、频率偏差引
近年来,激增的互联网用户群体促进了网络应用与内容创作的高速发展。然而,庞杂的网络信息也带来了新的问题——“信息过载”。针对“信息过载”的问题,学者们提出了推荐系统的概念,它可以学习人们的偏好并将其与相关的信息实体建立潜在的兴趣关联,从而推荐他们可能感兴趣的信息。目前,推荐系统在众多互联网平台上都已得到了部署并产生了积极的效果。根据在Amazon网站的数据,该网站35%的订单来自推荐系统;在YouT