基于特征选择的语音情感识别研究

来源 :江苏大学 | 被引量 : 18次 | 上传用户:shkarenwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着人们对人机交互兴趣的增加,情感识别逐渐成为一个研究热点。语音情感识别是指利用计算机分析特定说话人的情感状态及变化,进而确定其内心情绪或思想活动,实现人机之间更自然更智能化的交互。语音情感识别的研究对于增强计算机的智能化和人性化,开发新型人机环境,以及推动心理学等学科的发展,有着重要的现实意义,并最终产生很大的经济效益和社会效益。本文首先综述课题的研究背景,并分析目前国内外已提出的语音情感特征的提取、特征选择以及语音情感识别方法。在此基础上,提出了基于神经网络贡献分析的特征选择算法、基于误识率的情感类别混淆度计算方法和基于选择性特征的SVM决策树算法。具体内容如下:(1)基于神经网络贡献分析的特征选择算法。由于语音情感特征参数较多,存在无关特征和冗余特征。本文提出了基于神经网络贡献分析的语音情感特征选择方法,以此来减少冗余信息的影响,同时也降低了计算量,提高了识别速度。该方法将从时间构造、振幅构造、基音构造、共振峰构造、MFCC系数以及Mel频谱能量动态系数上提取的101个语音情感特征,通过神经网络贡献分析进行选择,同时采用聚类性分析对经过选择后的情感特征进行有效性分析,以此来验证所选择特征的有效性。(2)基于误识率的情感类别混淆度计算方法。在情感类别中,某些情感状态较为相似,难以区分,而某些情感状态差别较大,比较容易对它们进行分类。该方法通过SVM一对一算法得出情感间的误识率,根据误识率计算出情感间的混淆度,并提出组间混淆度的概念。通过计算情感状态之间的混淆度以及组间混淆度完成对情感类别的分组,保证将容易混淆的情感类别归为一组,以便进一步考察组内的情感类别细微差异。(3)基于选择性特征的SVM决策树语音情感识别方法。该方法针对不同语音情感特征对不同语音情感类别的贡献存在差异的特点,根据神经网络贡献分析法选择出对每种情感状态贡献比较大的情感特征。同时,根据类间混淆度,将容易混淆的情感归为一组,建立SVM决策树中间节点,对每组情感采用其各自的贡献较大的特征进行分类。此外,对每一情感语句只需提取六类情感状态贡献较大的情感特征的并集的特征,以此来降低计算量,提高识别速度。(4)采用Matlab和VC结合的开发模式,设计实现了基于选择性特征的SVM决策树语音情感识别原型系统,从实验角度验证了上述方法的有效性。
其他文献
足球机器人涉及计算机、人工智能、机器视觉、信号处理、无线通讯、机器人学等多个学科,是人工智能与机器人领域的研究热点,是一个极富挑战性的高科技项目。目前,研制足球机
随着计算机技术、工业以太网技术和现场总线技术等的快速发展,无轴传动技术引入套色印刷行业,并快速成为现代印刷机的主流驱动方式。本文以无轴凹版印刷机的套色监控系统为课
旋转机械是工业生产中应用最为广泛的一类机械设备。因而其故障诊断具有重要的现实意义。旋转机械故障诊断的关键是从旋转机械故障振动信号中提取故障特征,信号分析和处理是特
自然界不仅有智能的集成大者和统治者,同时还存在着那些让人类也叹为观止的生物群体智能现象。蜂巢之精美,蚁群之有序,雁队之和谐,这些群居生物所体现的社会性和分布式智能实现模
图像复原是图像处理中的重要内容,它的主要目的就是改善图像质量,研究如何从所得的退化图像中复原出真实图像。运动模糊恢复是数字图像处理的一个重要的研究方向,在现实生活
基于视频监控的图像型火灾探测技术,可以实现监控和火灾探测双重功效,不需要单独加装图像采集单元,节省成本,避免重复投资。与传统火灾检测技术相比不受空间高度、气流速度等
矿产资源是关系到国计民生的宝贵自然资源,是人类生产和发展的基本资源,采矿业是以自然资源为生产对象的古老产业。目前,绝大多数矿山企业还处在劳动密集性阶段,信息化程度很
学位
本文依托于某高校PLC实验室建设中模块化加工实验系统虚拟仿真设计而开展的研究工作。根据PLC逻辑控制实验室仿真实验的建设要求和目的,考虑到高校的实验室状况以及社会对自
能源互联网借鉴互联网思维和理念构建新型信息-能源融合网络,通过分散协同的管理和调度,实现能量的双向按需传输和动态平衡,可以最大限度地适应新能源的接入。能源路由器是能