基于语音信号的情感识别研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:epwangke96
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音情感识别是社会信号处理研究的重要内容,其目的就是研究如何使计算机能通过人的语音来判断人的情感。该研究涉及两个重要步骤:如何抓住语音中的情感特征和如何对特征进行良好的情感识别。本文将针对语音信号的情感特征提取和分类问题开展研究。   在提取语音的情感特征方面,传统研究主要集中在韵律特征、全局统计特征和时域特征上,而本文使用的情感特征包括基音、共振峰、语速、能量、mfcc、E250等,覆盖了韵律特征和音质特征,全局统计特征和短时时序特征,时域特征和频域特征,从而使特征中包含较全面的情感鉴别信息。   在语音信号的情感识别方面,应用了偏最小二乘回归分析,考虑到偏最小二乘回归作为线性分类器的局限性,本文又采用了核偏最小二乘回归方法,将可能呈非线性分布的原始数据映射到核空间使之呈线性分布,然后再进行偏最小二乘回归。不过向高维特征空间的投影带来了新的问题,高维特征数据往往包含较多的冗余和相关信息,考虑在后续处理前先对它进行降维去相关,由此引入核主成分分析偏最小二乘回归。又因为样本数据通常包含噪声,得到的回归模型往往不精确,且样本容量越小这种不精确越明显,为了解决这个问题,本文在核主成分分析偏最小二乘回归的基础上又进一步提出稀疏核主成分分析偏最小二乘回归,在求解KPCA的特征方程时,通过附加惩罚项来使样本系数收缩稀疏,从而实现样本选择的功能。   在对全局统计特征的实验里,本文对比研究了k近邻、高斯混合模型和偏最小二乘回归、核偏最小二乘回归、核主成分分析偏最小二乘回归、稀疏核主成分分析偏最小二乘回归等语音情感识别方法。在对短时时序特征的实验里,本文采用了传统的隐马尔可夫模型进行分类研究,并与基于全局统计特征的实验结果作了比较分析。   本文基于matlab平台,针对柏林的公开语音情感库EMO-DB,独立完成了对整个语音情感识别系统从前端数据处理、特征提取到后期情感识别的整个流程研究。  
其他文献
化学热消融是一种新型肿瘤治疗方法,通过将化学反应物注入肿瘤组织处,使其在肿瘤靶区组织内发生化学反应而释放热量,从而对癌细胞进行高强度的原位靶向热消融。针对这一新方法中
矩形毛细微槽群热沉内,液体工质可以在固液汽三相接触线附近的薄液膜区域产生高强度的蒸发,能够被用来实现极高传热系数和热通量的换热过程,在大功率激光器、微电子器件以及
抗细菌污着和抗菌界面的研究在生物医学、生态环境以及工业应用领域有十分重要的应用前景,业已成为国际学术界的研究热点。特别是聚合物高分子材料构建的功能化界面,由于它们
近年来中国资本市场积极备战股指期货,其中经过了经济理论研究、法律制度破冰、监管机构架设、投资者风险教育、交易系统测试等多个环节,可谓“万事俱备,只欠东风”。虽然目
Tm∶YAG激光器的输出波长在2μm附近,处于人眼安全谱段,能被水强吸收,同时它的大气消光比低,可以用石英光纤传输,以上优点使其在医疗、激光遥感、激光测距、光电对抗等众多领域得
当今能源的匮乏已经称为全世界重大议题,一般的过程工业在能源使用过程中存在着许多不合理之处,能耗巨大,本文主要从能量过程优化的角度研究一般过程系统的节能。文章首先对国内
随着计算机硬件技术的飞速发展,图形处理单元GPU近年来呈几何级数增长。凭借其强大的浮点计算能力、流式并行架构以及灵活的可编程性,GPU的应用从图形学领域扩展到科学计算等
自贡市有农民工约91万人,其中市外就业64万人、市内就业27万人,抓好农民工疫情防控和返岗服务工作尤为重要.自贡市人社局及相关部门认真贯彻落实市委市政府关于切实做好农民
期刊
该文首先客观地提出了对未来压力容器工程技术发展的根本要求,围绕着这些根本要求,探讨了压力容器工程技术应如何从全方位去满足这些要求;并进而对"钢复合材料构造的压力容器技
在新冠肺炎疫情防控期间,为保障辖区重点企业用工及人员返岗,成都市高新区就业部门建立了24小时重点企业用工调度保障机制,坚持从“帮助老员工返岗”和“促进新员工招募”两
期刊