基于基音参数规整及统计分布模型距离的语音情感识别

来源 :声学学报 | 被引量 : 0次 | 上传用户：douzixia

【摘要】

：

提出一种根据基音提取的频率分辨率确定自适应窗口的改进Parzen窗方法估计基音概率密度,兼顾了基音统计分布模型在低频段的高分辨率和高频段的平滑;提出利用不同性别的基音分

【作者】

：

王治平赵力邹采荣

【机构】

：

东南大学无线电工程系,东南大学无线电工程系,东南大学无线电工程系南京 210096,南京 210096,南京 210096

【出处】

：

声学学报

【发表日期】

：

2006年01期

【关键词】

：

基音提取参数规整统计分布模型距离语音情感识别 statistical model 识别率性别差异最近邻方法频率分辨率特征参数低频段均值汉语

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

提出一种根据基音提取的频率分辨率确定自适应窗口的改进Parzen窗方法估计基音概率密度,兼顾了基音统计分布模型在低频段的高分辨率和高频段的平滑;提出利用不同性别的基音分布规律的性别区分算法,对于长句可以达到98%的识别率;通过分析基音均值、方差、统计分布模型在性别上的差异,对基音参数进行基于性别差异的规整;引入规整后的基音均值和基音方差,以及基音统计分布模型距离作为情感特征参数;最后利用K最近邻方法对汉语情感语料进行识别。利用常规方法提取的参数最后得到的识别率为73．8％,而使用经过性别差异规整的基音参数和基音统计分布距离的识别率提高到 81％。 An improved Parzen window method to determine the adaptive window based on the frequency resolution of pitch extraction is proposed to estimate the pitch probability density, which takes into account the high resolution of the pitch distribution model and the smoothing of the high frequency band. The regular gender-discriminating algorithm can achieve a recognition rate of 98% for long sentences. Based on gender differences in pitch mean, variance and statistical distribution model, gender-based warping of pitch parameters is introduced. Pitch variance and distance distribution of pitch statistical distribution model as emotion parameters. Finally, K-nearest neighbor method is used to identify Chinese emotional corpus. The final recognition rate of the parameters extracted by the conventional method is 73.8%, while the recognition rate of the pitch parameter and the pitch distribution using the gender difference regularity is increased to 81%.

其他文献

和谐社会视阈下服务型政府的构建

摘要构建社会主义和谐社会是一项复杂的社会工程，需要社会各个方面的共同努力。构建和谐社会有许多方式方法，建设公共服务型政府是构建社会主义和谐社会的重要举措之一。本文从和谐社会视阈下，阐述构建服务型政府的必要性、途径以及措施。　　关键词服务型政府和谐社会　　中图分类号：D630 文献标识码：A　　一、相关概念阐述　　（一）和谐社会的内涵界定。　　和谐社会，作为重要的政治概念在党的决议上被明

期刊

服务型政府和谐社会

金属橡胶材料声学参数理论计算及实验研究

研究了用于理论分析金属橡胶材料吸声特性的声学参数.依据金属橡胶材料是均匀、各向同性的多孔材料条件,推导出金属橡胶材料有效声速、特性阻抗、传播常数等声学参数的理论计

期刊

金属橡胶材料声学参数理论计算公式实验研究特性阻抗结构常数各向同性多孔材料传播常数理论模型计算不同结构参数有效声速吸声特性理论分析参数

OPPO充电速度更快,小米快充名不副实

测试结果显示,除小米Note外,其余几款快充手机的充电速度的确比不支持快充的手机要快,其中采用了VOOC闪充技术的OPPO R7的充电速度更快。随着手机的功能越来越多、屏幕越来越

期刊

续航能力充电时间OPPO快速充电芯片厂商电池容量锂离子蓄电池蓄电池组直流输入输出电压

矢量拖曳线列阵声呐流噪声的空间相关性研究

根据湍流边界层脉动压力谱的Corcos模型,采用频率-波数域上的二维谱分析方法对矢量拖曳线列阵声呐拖缆护套管内的流噪声场进行了研究,得到了流噪声声压和振速的一般表达式.在

期刊

以全面预算管理为核心的企业内部控制研究

现代企业追求经济效益的同时,也应当规避风险,加强企业内部控制,促进企业健康平稳的发展.全面预算管理是企业内部控制重要的组成部分,两者之间相辅相成,本文通过探索全面预算

期刊

全面预算管理企业内部控制

供电公司人力资源管理

加强对电力企业人力资源的管理,对提升供电企业的服务水平和质量具有很大的作用。本文针对供电企业中广泛存在的耗费大量的人力物力进行员工培训却效果甚少等问题,根据相关的

期刊

供电企业人力资源员工培训体系构建

高次谐波体声波谐振器谐振频率分布研究

基于由谐振频率分布提取压电薄膜参数的方法,研究影响高次谐波体声波谐振器(HBAR)谐振频率分布的因素.对多种HBAR进行模拟计算,模拟结果显示,变化基片对薄膜的声阻抗比值会引

期刊

高次谐波体声波谐振器谐振频率分布研究频率分布有效机电耦合系数薄膜参数阻抗比频率间隔频率变化模拟结果模拟计算电极并联谐振显示提取基

语句的基频曲线预测

基频曲线预测是文语转换系统中韵律控制的重要内容。基于决策树的分析,本文提出了一个采用三个控制参数,修改一组归一化的音节基频曲线模板,从而生成连续语流基频曲线的预测

期刊

基频曲线一个音节整体预测控制参数语音合成系统文语转换系统韵律控制预测模型曲线预测连续语流合成语音动态目标标准误差自然度准确率连续性

丹棱-思濛扇积物中的漫洪相粘土层

为探究吕家坨井田地质构造格局,根据钻孔勘探资料,采用分形理论和趋势面分析方法,研究了井田7

期刊

金融机构可疑交易报告制度有效性研究

本文对可疑交易报告制度在我国的实施情况进行了阐述,运用FATF新标准对我国新出台的可疑交易报告制度进行了有效性评估,基于成本收益的视角在宏观和微观层面上对我国可疑交易

期刊

可疑交易报告制度金融情报成本收益有效性

基于基音参数规整及统计分布模型距离的语音情感识别

与本文相关的学术论文