半监督判别分析的跨库语音情感识别

来源 :声学学报 | 被引量 : 0次 | 上传用户:cr15mo3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对训练样本与测试样本来自不同语音情感数据库造成特征向量空间分布不匹配的问题,采用半监督判别分析减小二者的差异。首先寻找有标签的训练样本和来自另一个库的部分无标签训练样本之间的最优投影方向。基于一致性假设即相近的点更有可能具有相同的类别,利用p近邻图对无标签训练样本相近点之间的关系进行建模,从而获得无标签样本的分布信息。在保证无标签样本间流形结构的同时,使所有训练样本类间散度和类内散度的比值达到最大,从而得到最优的投影方向。采用两组实验进行验证,第1组用eNTERFACE库训练去测试Berlin库,识别率为51.41%,第2组用Berlin库训练测试eNTERFACE库,识别率为45.76%,相比未采用半监督判别分析的识别结果分别有了13.72%和22.81%的提高,说明该算法的有效性。通过实验前后数据的可视化分析,说明利用半监督判别分析确实减小了不同库之间特征向量空间分布的不匹配问题,从而提高跨库语音情感识别率。 Aiming at the mismatch of spatial distribution of feature vectors caused by different speech emotion databases from training samples and test samples, semi-supervised discriminant analysis is adopted to reduce the difference between the two. First, look for the optimal projection direction between a labeled training sample and a partially unlabeled training sample from another library. Based on the consistency hypothesis that similar points are more likely to have the same category, the p-nearest neighbor graph is used to model the relationship between similar points in unlabeled training samples to obtain unlabeled sample distribution information. While ensuring the manifold structure between the unlabeled samples, the ratio of the divergences and the divergences of all kinds of training samples is maximized so as to obtain the optimal projection direction. Two groups of experiments were used to verify that in the first group, Berlin library was tested by eNTERFACE library, the recognition rate was 51.41%. In the second group, the eNTERFACE library was trained and trained with Berlin library, the recognition rate was 45.76%. Compared with the semi-supervised discriminant analysis The recognition results have been improved by 13.72% and 22.81% respectively, which shows the effectiveness of the algorithm. Through the visual analysis of the data before and after the experiment, it shows that the semi-supervised discriminant analysis does reduce the problem of mismatch of the spatial distribution of eigenvectors among different databases, so as to improve the emotion recognition rate of cross-bank speech.
其他文献
在高校的计算机教育中,学生主体性的学习能力、创新能力以及综合实践能力备受重视,为充分发挥学生在高校的计算机教学中的重要能力,高校教师正在朝着实际教学最大化程度地改
呼盟是内蒙古自治区的小麦主要产区,每年所需的种籽量很多.而小麦的繁殖倍数又很低,一般只是播种量的10倍左右.因此,新培育出的优良品种或是提纯复壮了的品种,不可能尽快地
基于泛雅学习与培训平台,开展电工基础课程的线上与线下混合式教学实践探索.电工基础课程具有较强的理论与实践融合特点,与生活实际息息相关,借助泛雅平台可实现线上教学与线
在现代专业技术中,3D动漫制作技术具有重要地位。现阶段,为了提高3D动漫制作质量,通常会融合其他技术,其中VR技术应用较为广泛。对此,本文探讨了3D动画技术和VR技术关系探讨,并提出两种技术融合方法。
实现思想政治教育与技术技能培养的有效融合,已成为高职院校人才培养与教学改革的重要任务.《python编程基础》课程作为一门专业必修课程,是软件技术专业学生的专业教育入门
塑料薄膜保温全旱育苗(旱做床,旱管理)是我省稻区近年来开始采用的一种新的育苗方法。可分为常规窄床旱育苗和启闭式宽床旱育苗。常规窄床旱育苗播幅1米,床长10米,净播种面
近年来,人们对高职教育方面的关注力度逐渐加大,高职院校学生们的体育教学模式受到了人们的广泛关注,作为对学生身体素质发展有着重要联系的一门课程,需要高职院校的教师进行
随着我国教育改革的不断深入,对高职院校计算机动漫专业提出了更高的要求,计算机动漫专业作为计算机教育的重要学科之一,高职院校有必要在信息时代的背景之下,寻求科学合理的
目的:通过观察裴氏软肝消痞丸(PRGXP)对小鼠移植性肝癌H22瘤组织中P27、Bcl-2表达的影响,探讨裴氏软肝消痞丸对荷瘤小鼠免疫系统的调节、抑制肿瘤的作用,分析其治疗原发性肝癌的作
长期以来浙江电视台十分重视各项管理工作,自1993年底起又先后推出一系列新的管理措施,并在某些方面有所突破。 为了加强宣传管理,该台制订了《磁带管理条例》;实行节目监制