多模态特征融合的情感识别研究

来源 :南京师范大学 | 被引量 : 1次 | 上传用户:qiaomy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感识别在人机交互中具有重要意义。一般来说,人的情感主要通过面部表情、姿态表情和言语表情表现。而语音作为人类表达自身的最重要的通道之一,能够有效的表达情感,已被成功用于情感的自动识别中。然而,语音只是情感表达的一种方式,并未包含全部的情感信息,文本信息也能传递说话人的情感。因此,多模态特征融合的情感识别是一个重要的研究方向。本研究的研究目标是使用语音与文本特征融合的方式,来提高情感识别的准确率。基于此目标设计了如下实验:首先,对语音数据进行预处理,通过提取低层次声学特征,在低层次声学特征上应用了各种统计函数构建全局声学特征,并将其用于语音情感识别。用语音训练的识别模型作为基线系统与后续的识别模型进行比较。其次,对文本语句进行预处理,提取不同特征的提取,共生成3类特征,分别为词袋特征、词向量和句向量,用于文本情感识别,选择三类特征中识别准确率最高的文本特征用于后续与语音特征融合。最后,将语音与表现最好的文本特征进行特征融合进行情感识别,比较它们在IEMOCAP数据集上情感识别的性能。在特征融合时,采用了两种特征融合方式,分别为特征层融合和决策层融合。最终,本研究根据语音与文本特征融合后的情感识别结果与单语音通道的识别结果进行比较,同时比较融合方式对识别结果的影响。实验结果发现,语音与文本特征融合后训练的情感识别模型比单一模态特征训练的情感识别模型取得了更好的识别效果,得到了更高的识别准确率。具体来说,语音与文本特征融合后的情感识别模型比语音情感识别模型识别率更高,同时也比文本情感识别模型识别率更高;其次,决策层融合比特征层融合在情感识别中表现更好。通过决策层融合的语音和文本情感识别模型的识别率高于特征层融合的语音和文本情感识别模型。总体来说,相比于单模态的语音情感识别方式或单模态的文本情感识别来说,利用多模态特征融合的方式可有效提高情感识别准确率。
其他文献
从档案馆档案员手动为客户进行服务,到通过互联网平台对客户进行数据传输,再到可以让用户在移动设备上享受档案馆的精准服务,这一次次的提升推动了档案馆信息服务的发展。同
目的:评估经直肠多普勒超声扫查结合宫腔超声造影技术(TRS+SHG)对子宫内膜息肉的诊断意义。方法:收集149例经腹部和阴道超声(TVS)扫查诊断疑似子宫内膜息肉的患者资料,均行TR
再生混凝土骨料,就是将废弃混凝土破碎、清洗、分级后,形成一种代替传统矿料作为新拌混凝土的骨料。发展再生混凝土与其他材料结合形成新的结构如方钢管再生混凝土结构,将是
药物化学是药学专业重要的课程,而药学专业对培养学生的实验能力具有较高的要求。学生实验课的质量对掌握好本门专业课的知识起到至关重要的作用。笔者从药物化学实验室的建
面对煤炭清洁高效利用和现阶段电网的调度方式,汽包炉机组协调系统的控制性能还远未达到实际需求。从实际工程应用出发,在考虑汽包炉机组动态特性的基础上,以阶梯式预测控制
<正>近几年来随着素质教育的推进,为了全体学生得到全面发展的理念已得到大家的认同,教师总希望每个学生能学有所成,均衡发展,共同进步。然而事与愿违,事情不会总是朝着人们
2010年3月31日中国融券卖空的放松,标志着中国证券市场一直以来的单边交易模式宣告结束。融券卖空开放至今,不断的有企业调入或调出标的池。自最初90支上证50指数的成分股和
根据国外的事故统计资料,介绍了各种交通工具的事故概率以及放射性物质运输事故的情景和辐射后果。可以认为,放射性装运事故的概率较低,事故中放射性物质从货包中泄漏的概率更小
目的探讨营养护理干预对原发性高血压病患者临床疗效和生活质量的影响。方法选择60例原发性高血压病患者,随机分为对照组和观察组,每组30例。对照组采用降压药物治疗和常规护
目的:探讨EB病毒(EBV)感染与淋巴瘤基因组不平衡改变的关系,以及基因改变与临床表现、病理类型、疗效和预后的关系。方法:1、用免疫组化方法测定霍奇金淋巴瘤(HD)EBV潜伏膜蛋白(