情感说话人识别及其解决方法的研究

被引量 : 0次 | 上传用户：iflytekmilk

【摘要】

：

说话人识别技术是使用语音中所包含的说话人特有的个性信息为生物特征,自动进行身份识别的过程。它被认为是最自然的和最经济的生物认证技术,具有广泛的应用前景。传统的说话

【作者】

：

单振宇

【发表日期】

：

2010年期

【关键词】

：

说话人识别情感说话人识别情感语音情感拓展中性情感模型转换混合模型降维

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

说话人识别技术是使用语音中所包含的说话人特有的个性信息为生物特征,自动进行身份识别的过程。它被认为是最自然的和最经济的生物认证技术,具有广泛的应用前景。传统的说话人识别系统在训练和测试语料都为中性语音的时候,已获得了非常出色的识别性能。然而,当用户提供的语料包含不同情感类型的语音时,由于说话人情感状态改变引起的发音方式的变化,导致训练和测试语音的特征分布不匹配,使得基于传统的说话人识别方法的系统性能急剧下降,我们把这种测试或训练语料中包含情感语音的说话人识别称为情感说话人识别。在研究了情感说话人识别技术最新进展和情感因素影响的基础上,本文紧紧围绕如何提高训练语音和测试语音之间的匹配程度这个问题,从情感拓展和情感屏蔽角度给出了有效的关键算法,构建了情感说话人识别系统的解决方案。本文的主要贡献总结如下：1.深入分析了情感因素对说话人识别系统的影响文中分析了情感因素对基频和频谱分布的影响；分析了不同情感语音在特征层和模型层上对说话人个性信息的影响；分析了人耳对情感因素的鲁棒性；分析真实环境中情感因素影响存在的普遍性；分析了情感因素对说话人识别系统性能的影响。2.研究了基于通道补偿的情感规整方法在分析了情感、噪音和通道三个问题之间的异同后,发现解决通道噪音问题的很多思路和方法都可以应用在情感说话人识别中。冗余属性投影和隐藏因子分析是两种提高通道鲁棒性的方法,我们考察了其用于情感规整时的性能。3.提出了两种基于中性情感模型转换算法的情感拓展方法在实验验证了不同说话人的情感表达方式是一致的这个假设的基础上,提出了中性情感模型转换方程,建立了中性模型和情感模型的转换关系。提出了基于高斯分量和基于参数的方法来求解该转换方程,通过它可以实现中性模型到情感模型的转换,从而让系统熟悉情感语音的分布。4.提出了一种基于频谱平移的情感拓展方法频谱平移方法通过改变语音帧的功率谱来合成各种类型的情感语音。该方法和多状态模型的结合使用,有利于提高系统的情感鲁棒性。实验结果表明采用该方法合成的情感语音比中性语音更接近说话人真实的情感语音。它的最大优势是能很方便的和传统的说话人识别方法相结合,应用到现有的说话人识别体系中。5.提出了一种基于得分选择的情感屏蔽方法基于得分选择的情感屏蔽方法适用于测试语音是情感和中性语音混合的情况。在分析了不同情感比率下说话人识别系统的表现后,文中给出了两个结论：情感比率和识别性能成反比；中性特征在自身中性模型上的得分分布在较高的区域。以此为基础,通过得分选择的方法来剔除情感语音帧,降低测试语音的情感比率,提高系统性能。6.提出了一种基于混合模型降维的方法来加速情感说话人识别自适应方法对提高情感说话人系统性能有很大的帮助,但是高阶的通用背景模型需要极大的计算量,影响了其在真实环境中的应用。文中提出了一种基于混合模型降维的方法来降低通用背景模型的阶数,以此来提高系统的运行速度。

其他文献

美国公立高中能力建设研究

公立高中,作为美国学校教育体系中具有重要转折意义的教育阶段,肩负着帮助每一位学生胜任后续教育及工作的使命；能力建设,作为教育改革中的一项重要策略,自20世纪70年代末获得

学位

美国公立高中能力建设要素策略

赏识教育在初中英语教学中的可行性研究

21世纪教育已不是传统的教育了,教育开始向多元化发展。《英语课程标准》在实施建议的部分中提出了其中这两条的教学建议：面向全体学生,为学生全面发展和终身发展奠定基础；关注

学位

赏识赏识教育赏识教育教法初中英语教学

高层剪力墙住宅实例对比分析

本文针对某建筑工程高层剪力墙结构,对高层剪力墙结构优化前后方案整体性能对比,分别从结构模型对比、结构动力特性、结构变形特性、结构内力特性进行了对比分析,经过优化设

期刊

高层建筑结构优化剪力墙

监督管理过失犯罪研究

“监督过失犯罪”理论来源于日本,理论根源为“新新过失论”,也即“畏惧感说”。“畏惧感说”在理论界仍存争论,但其作为解决公害犯罪和重大责任事故犯罪理论基础的地位逐渐

学位

监督管理过失畏惧感说犯罪构成注意义务因果关系

孝妇河流域水资源管理法律问题研究

随着经济的飞速发展,能源问题已经是所有国家都面临的难题,水能作为不可再生资源,对它的管理更是全世界需要思考和解决的问题。以流域为单元对水资源进行统一管理已被世界上

学位

孝妇河流域水资源管理法律

哈蒙式电站空冷系统内表面的腐蚀与防护探讨

针对太原第二热电厂2×200MW采暖供热机组哈蒙式空冷系统内表面腐蚀严重的现状，本文立足现场具体情况，从腐蚀机理分析入手，通过对多种防护技术的深入研究，提出了可行的防护方案。

期刊

腐蚀防护表面空气冷却系统

FIDIC合同下调价公式在实践中的应用

物价上涨是全球普遍存在的问题。合同周期较长的项目,其项目效益受物价因素影响的风险更大,应用好合同条款中的调价公式是规避这一风险的有力工具。结合肯尼亚内罗毕——西卡

期刊

FIDIC合同条款调价公式物价指数应用

优化教法　培养能力──谈《猫》的教学

优化教法培养能力──谈《猫》的教学闻柯《猫》是语言大师老舍的一篇散文。作者以６００字左右的篇幅，把猫的古怪性格及满月小猫的可爱形象描述得栩栩如生，并寓爱描之情于言语之中。

期刊

《猫》优化教法品词析句

比较广告法律制度研究

比较广告作为广告活动中一种特殊的形式,在为社会公众带来丰富而与众不同的商品或服务信息的同时,也对传统的法律制度发出了挑战。一方面,比较广告的优势在于对消费者的劝说

学位

广告比较广告法律制度

对南京医科大学临床医学生部分课程考核试卷、试题质量的分析

目的(1)通过对试卷试题的分析,了解教师在试卷编制中存在的问题,寻求提高出卷质量、优化考试的途径,使试卷编制逐步由经验型走向理论指导型;(2)通过试卷分析发现教学方法中的

学位

教育测量医学教育课程考核试卷分析

情感说话人识别及其解决方法的研究

与本文相关的学术论文