基于基音参数规整及统计分布模型距离的语音情感识别

来源 :声学学报 | 被引量 : 0次 | 上传用户:douzixia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种根据基音提取的频率分辨率确定自适应窗口的改进Parzen窗方法估计基音概率密度,兼顾了基音统计分布模型在低频段的高分辨率和高频段的平滑;提出利用不同性别的基音分布规律的性别区分算法,对于长句可以达到98%的识别率;通过分析基音均值、方差、统计分布模型在性别上的差异,对基音参数进行基于性别差异的规整;引入规整后的基音均值和基音方差,以及基音统计分布模型距离作为情感特征参数;最后利用K最近邻方法对汉语情感语料进行识别。利用常规方法提取的参数最后得到的识别率为73.8%,而使用经过性别差异规整的基音参数和基音统计分布距离的识别率提高到 81%。 An improved Parzen window method to determine the adaptive window based on the frequency resolution of pitch extraction is proposed to estimate the pitch probability density, which takes into account the high resolution of the pitch distribution model and the smoothing of the high frequency band. The regular gender-discriminating algorithm can achieve a recognition rate of 98% for long sentences. Based on gender differences in pitch mean, variance and statistical distribution model, gender-based warping of pitch parameters is introduced. Pitch variance and distance distribution of pitch statistical distribution model as emotion parameters. Finally, K-nearest neighbor method is used to identify Chinese emotional corpus. The final recognition rate of the parameters extracted by the conventional method is 73.8%, while the recognition rate of the pitch parameter and the pitch distribution using the gender difference regularity is increased to 81%.
其他文献
摘 要 构建社会主义和谐社会是一项复杂的社会工程, 需要社会各个方面的共同努力。构建和谐社会有许多方式方法, 建设公共服务型政府是构建社会主义和谐社会的重要举措之一。本文从和谐社会视阈下,阐述构建服务型政府的必要性、途径以及措施。  关键词 服务型政府 和谐社会  中图分类号:D630 文献标识码:A  一、相关概念阐述  (一)和谐社会的内涵界定。  和谐社会,作为重要的政治概念在党的决议上被明
研究了用于理论分析金属橡胶材料吸声特性的声学参数.依据金属橡胶材料是均匀、各向同性的多孔材料条件,推导出金属橡胶材料有效声速、特性阻抗、传播常数等声学参数的理论计
测试结果显示,除小米Note外,其余几款快充手机的充电速度的确比不支持快充的手机要快,其中采用了VOOC闪充技术的OPPO R7的充电速度更快。随着手机的功能越来越多、屏幕越来越
根据湍流边界层脉动压力谱的Corcos模型,采用频率-波数域上的二维谱分析方法对矢量拖曳线列阵声呐拖缆护套管内的流噪声场进行了研究,得到了流噪声声压和振速的一般表达式.在
现代企业追求经济效益的同时,也应当规避风险,加强企业内部控制,促进企业健康平稳的发展.全面预算管理是企业内部控制重要的组成部分,两者之间相辅相成,本文通过探索全面预算
加强对电力企业人力资源的管理,对提升供电企业的服务水平和质量具有很大的作用。本文针对供电企业中广泛存在的耗费大量的人力物力进行员工培训却效果甚少等问题,根据相关的
基于由谐振频率分布提取压电薄膜参数的方法,研究影响高次谐波体声波谐振器(HBAR)谐振频率分布的因素.对多种HBAR进行模拟计算,模拟结果显示,变化基片对薄膜的声阻抗比值会引
基频曲线预测是文语转换系统中韵律控制的重要内容。基于决策树的分析,本文提出了一个采用三个控制参数,修改一组归一化的音节基频曲线模板,从而生成连续语流基频曲线的预测
为探究吕家坨井田地质构造格局,根据钻孔勘探资料,采用分形理论和趋势面分析方法,研究了井田7
期刊
本文对可疑交易报告制度在我国的实施情况进行了阐述,运用FATF新标准对我国新出台的可疑交易报告制度进行了有效性评估,基于成本收益的视角在宏观和微观层面上对我国可疑交易