音频信号情感识别及受众脑电信号的关联分析

来源 :东北电力大学 | 被引量 : 2次 | 上传用户:pygta
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人与自然,人与人的交流中,音频信号起了传递信号,表达信息的作用。不同情感的音频信号可能引发受众的不同体验,人类情感和表达不同情感的音频之间有什么量化关系,音乐厂商,唱片公司极其关注这个问题,他们期望以此获得唱片发行的成功或者对音乐、歌曲的发行作提前的预期避免损失;同时,探究人类情感,进行情感计算,也是进行人机交互,实现人工智能的一个热点。脑电信号,作为人类的一个典型生物信号,包含有大量的情感信息,能更客观的表示人类的情绪变化。近年来,随着对脑科学研究的不断深入,脑电信号的提取更加方便快捷,对脑电信号情绪特征的研究也引起了广大学者的兴趣。在此背景下,本研究广泛提取了不同情感音频信号及由其引发的脑电信号的典型特征,并利用特征提取,数据分析,机器学习等理论和方法,对不同情感的音频信号、以及由其引起的不同受众的脑电信号进行了量化分析,并对两者关联性作了评价。具体内容如下:(1)对语音情感方面,使用中科院的CASIA数据库;在音乐情感方面,利用T检验标注80首不同情绪(愤怒,喜悦,悲伤,平静)的音乐。提取语音信号的典型64维特征,同时利用Mirtoolbox工具箱提取音乐信号时域的均方差、波形、谱特征、音色、语调等特征的均值、方差、斜率、周期频率、周期振幅、周期熵、峰值、质心等138个统计特征。利用多种降维方法对上述特征降维,利用多种分类器识别验证上述降维前后的特征,结果证明了提取的语音信号的10维特征向量以及音乐信号的8维特征向量具有一定的普适性。(2)采集了8位大学生受众在听不同情绪音乐时的脑电信号,得到15组实验数据,提取12个电极脑电信号的线性特征和非线性特征,共计27维特征。然后,基于相关的特征选择(CFS)的方法选择与原始特征最密切相关但最小冗余的特征集。利用不同分类器检验原始特征集和所选特征集的识别率和召回率。最后,针对实验结果进行了详细的分析,得到对音乐情绪最具代表性的脑电特征并加以验证。(3)结合音频信号和脑电信号选择的最优特征,联合分析音乐信号特征和由其引起的脑电信号特征。最后选择20维的原音乐-脑电联合特征,GA+CFS降维后的6维特征,分别用BP,SVM,C4.5,LDA分类器对其进行识别验证。实验结果证明,经过GA+CFS降维的特征可以很好的对脑电情绪进行分类。在分类器性能上,LDA分类器或C4.5分类器比较优秀。其中BP分类器识别率皆在80%以上,但BP分类器在实际应用中受网络训练次数限制,建模速度较慢。(4)利用LabVIEW平台强大的可视化图形处理功能,同时利用Matlab节点进行数据计算,设计了一个情感识别系统,用于语音和音乐情感识别。
其他文献
现实生活的复杂性使得我们面对各种各样的非决定性事件.非决定性主要包括客观非决定性和主观非决定性.随机性是一种客观非决定性,概率论是研究这种非决定性的有效数学工具.主
预测控制技术是智能控制技术的一个重要分支,是基于实际工业控制过程而发展起来的计算机控制算法。在控制领域界,它一直备受人们的关注。基于预测控制本身具备的优点,如鲁棒
学位
在安防设备日益受到重视的今天,生物识别技术取得了巨大的发展,人脸识别技术作为生物识别方法中应用最广泛的技术之一,更是发展迅速。人脸识别门禁系统是人脸识别技术中的一
煤炭凭借其低廉的价格成为我国现阶段的主要能源之一,在工业领域起着举足轻重的作用。但是由于井下环境的复杂性,近年来煤矿安全事故频发,影响我国经济发展和社会稳定。而现
现在糖尿病患者越来越多,作为一种常见的内分泌疾病,糖尿病长久以来一直困扰着众多患者的日常生活。长期的糖尿病会带来一系列的并发症,甚至会带来生命危险。一个好的血糖预测算
学位
近年来,随着物联网系统和大数据技术的快速发展,使得时间序列的的收集变得简单快捷,同时收集到的时间序列数据也变得数据量巨大、非线性程度很高、数据结构复杂,传统的时间序列分析已经不能满足这种复杂数据结构的分析和预测,为了满足高度非线性数据结构的预测,新的预测模型的研究就显得尤为重要。深度学习的出现给高度非线性的时间序列数据的分析预测带来了希望,其中深度信念网络(Deep Belief Network,
学位
本课题在传统PLC的结构和工作原理基础之上,设计并构建了嵌入式软PLC的总体框架。具体将嵌入式软PLC系统分为开发系统和运行系统来研究实现。  开发系统运行于PC机,主要完成P
随着汽车电子和嵌入式技术的不断发展,汽车仪表正在逐渐向数字化、网络化和智能化方向发展。目前,CAN总线因为其低成本、高可靠性和实时性等特点成为应用于车身系统最重要的