基于遗传优化的多级SVM语音情感识别

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:mzl521fnn1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言是人类交流信息的主要媒介,它不仅包含丰富的语义信息,而且承载丰富的情感信息。如何使计算机从语音信号中识别出说话人的情感状态,从而实现自然人机交互,具有重要的研究意义。针对语音情感识别中识别速度慢以及精度低的问题,本文提出通过构建二叉树结构的多级SVM对多类情感进行分类的方案,并使用遗传算法进行特征降维,以进一步提高语音情感识别系统的识别性能。本文首先对语音信号进行预加重、加窗分帧、端点检测等预处理后提取语音能量、基音周期、共振峰以及MFCC等常用的情感特征,然后通过构建二叉树结构的多级SVM对多类情感进行分类,该模型采用先将容易区分的情感分开,进行粗分类,然后对容易混淆的情感进行细分类的“先易后难”原则,逐层实现对多类情感的分类。在包含7种情感的柏林情感语料库上进行实验,结果证明该模型在保持SVM高效分类优势的同时,还发挥了二叉树结构高效计算的特点。由于不同特征对情感的区分能力不一样,并且特征维数太高在建模时容易出现过拟合现象,导致建模时间长,识别精度低,因此可以通过对提取的情感特征进行优化筛选后对分类模型进行训练,以进一步优化二叉树结构的多级SVM。本文使用遗传算法进行特征降维,即从提取的若干特征中筛选出关键特征,该方法是一种自适应的全局最优解搜索方法,并且不改变所选特征的数值,能构造出较好的模型。同样在柏林情感语料库上进行实验,结果证明使用降维后的情感特征对分类模型进行训练,能有效提高系统的识别率。深度置信网络作为一种深度学习结构,它的特点是首先利用贪心无监督学习逐层训练,为网络获得较好的初始点,然后利用有监督学习优化整个深层架构,使得网络具有较强的数据抽象能力和分类能力。因此本文最后使用深度置信网络进行了语音情感识别实验,在相同的数据集上得到了有效的分类结果。
其他文献
二维条码与一维条码相比,它不需要依赖数据库,存储信息量大,可以表达多种多媒体及文字信息,同时它还可以嵌入加密机制,具有纠错能力。快速响应矩阵码(QR码)是一种矩阵二维条
众所周知,当前中国面临着严重的环境问题,严重的雾霾问题影响着社会的各方各面,包括社会出行、社会安全以及工业生产,其影响是多方面的,而且短时间内无法完全解决。环境的治
学位
随着计算机与移动通信技术的快速发展,越来越多的用户享受移动终端软件提供的服务。而数字集群系统是专门用于指挥调度和紧急通信的专用移动通信系统,能够使系统内的用户进行
随着计算机技术和思维科学研究、人工智能技术的迅速发展,图像处理正朝着数字化、结构化和智能化的方向大步迈进。构建类似人类的视觉系统来处理图像信息、理解外部世界是目
在应变测量领域,现有光纤光栅系统的研究侧重于系统的复用能力与测量精度,而针对系统应变测量频域带宽与响应速率的研究较少,限制了光纤光栅传感系统在高速动态应变测试领域
图像分割在数字图像处理中有着重要的地位,是从图像处理到图像分析的一个关键步骤;它是为了进一步对图像进行分析、识别、压缩编码等处理的图像预处理环节,其分割结果的准确性对
随着我国经济的持续发展和群众生活素质的显著提高,交通堵塞、交通事故率升高、交通管理技术落后、交通环境恶化等问题已愈加严重,在这种背景下,智能交通系统ITS利用现有的交通
近年来,随着互联网教育的快速发展,幼儿教育的信息化管理与服务也随之普及。然而,目前的幼教系统重在提供便捷的园所管理和办公平台,却常常忽略了家长与学校互动服务的重要性
随着钻井技术的发展,需要了解井下的信息越来越多,而原先的电缆传输无法满足随钻测量的要求。所以,电磁波随钻测量技术作为气体井中一种新兴的技术,越来越受钻井行业的关注。随钻