一种适于说话人识别的非线性频率尺度变换

来源 :声学学报(中文版) | 被引量 : 0次 | 上传用户：dahaneralpha

【摘要】

：

传统的非线性频率尺度变换虽然能够反映人类听觉系统(HAS:Human Auditory System)的感知特性,但不能区别对待语音中包含的语义和个性特征,在表达说话人个性特征方面并不充分

【作者】

：

俞一彪袁冬梅薛峰

【机构】

：

苏州大学电子信息学院,

【出处】

：

声学学报(中文版)

【发表日期】

：

2008年05期

【关键词】

：

说话人识别系统非线性频率尺度变换个性特征短时谱最小二乘法多项式曲线识别性能听觉系统拟合技术感知特性测试条件误识率增强语音语义训练

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

传统的非线性频率尺度变换虽然能够反映人类听觉系统(HAS:Human Auditory System)的感知特性,但不能区别对待语音中包含的语义和个性特征,在表达说话人个性特征方面并不充分。通过分析语音信号不同频带短时谱对说话人识别性能的影响,采用最小二乘法多项式曲线拟合技术,提出了一种非线性频率尺度变换。实验表明,与传统的Mel、Bark和ERB频率尺度变换相比,在同样的训练与测试条件下,平均误识率分别降低70.5%,60.8%和70.5%。这一结果说明,本文提出的非线性频率尺度变换有效地增强了短时谱的说话人个性特征,能够提高说话人识别系统的性能。 Although the traditional non-linear frequency scale transform can reflect the perceptual characteristics of human auditory system (HAS), it can not discriminate the semantic and individual features contained in the speech, and it is not sufficient to express the speaker’s personality characteristics. By analyzing the effect of short-time spectrum in different frequency bands on the performance of speaker recognition, a nonlinear frequency scale transform is proposed based on least square polynomial curve fitting technique. Experiments show that under the same training and testing conditions, the average misclassification rate is reduced by 70.5%, 60.8% and 70.5%, respectively, compared with the traditional frequency scaling of Mel, Bark and ERB. This result shows that the nonlinear frequency scaling proposed in this paper can effectively enhance the speaker’s personality characteristics of short-time spectrum and improve the performance of speaker recognition system.

其他文献

浅海中内波对匹配场时间相关的影响

利用一次夏季浅海水文实验资料,数值仿真研究有线性内波和孤立子内波存在条件下的匹配场时间相关性。考察和总结了有内波存在时不同声源频率、声源深度和内波幅度等参数对匹

期刊

妨害传染病防治罪的司法适用

摘要伴随着全球化进程的提速，传染病这种带有地域性特征的病毒也慢慢的向着全球扩散传播开来，国际上为此也加强了对传染病的认识和关注，并给予了重视。但是我国对传染病防治上的规定及司法适用并不十分完善。因此，本文结合罪责刑相适应原则、相关构成及刑事责任对我国司法中的传染病防治罪的研究，以促进我国对传染病防治更深刻的认识。　　关键词妨害传染病防治罪罪责刑相适应原则犯罪构成刑事责任　　中图分类号：

期刊

妨害传染病防治罪罪责刑相适应原则犯罪构成刑事责任

时间分辨光声量热法研究碳氧血红蛋白的光解反应

为了解血红蛋白与其配合物的结合与解离过程中,各反应分子的结构变化和能量变化的动力学过程以及作用机理,本文利用光声量热法测量了碳氧血红蛋白的光解反应的焓变和结构体积

期刊

时间分辨光声量热法碳氧血红蛋白光解反应体积变化光声信号脉冲激光力学参量结构变化弛豫过程实验系统焓变压电换能器超声换能器作用机理时间

如何促进农村信用社支持当地经济发展

农村经济是我国国民经济中的一个重要组成部分。作为服务农村、农民、农业的地方性金融机构——农村信用社，更是对支持其当地的经济发展有着不可或缺的作用。但是由于各方面的原因，使得农村信用社在支持当地经济的发展中面临一些困难。这就要求农村信用社及时做出调整，立足自身优势，创新对当地经济的服务，从而更好的为农村经济发展服务。笔者就此展开叙述，希望能对农村信用社支持当地的经济发展有所帮助。　　我国农村经济的发

绿色

美术课上，老师说，　　绿色是生命，　　可以让花草树木茁壮成长。　　音乐课上，老师说，　　綠色是歌谣，　　可以让鸟儿找到快乐的家。　　科学课上，老师说，　　绿色是魔法师，　　可以让沙漠变成绿洲。　　品德课上，老师说，　　绿色是和平的使者，　　可以让饱受战争之苦的人们不再流离失所。　　语文课上，老师说，　　绿色是希望，　　播下种子，收获成熟。　　原来，　　绿色如此美妙，　　却又无穷无尽。　　（本诗获首

期刊

声速不均匀介质热声成像的声场仿真

为了精确表示声速不均匀介质热声成像的声场,提出了一种时域有限差分(FDTD)仿真方法.先用FDTD将热声成像的基本方程离散化,给出描述热声成像的离散差分方程;再对电磁波脉冲进

期刊

声速差不均匀介质热声成像仿真方法飞行时间时域有限差分高频电磁波实验条件声场两次修正计算误差基本方程仿真研究成像算法差分方程准确度

《嫌疑人X的献身》中的理性推理背后的人性拷问

摘要：《嫌疑人X的献身》是一部将理性与感性完美结合的长篇推理小说，被誉为日本作家东野圭吾的巅峰之作。作为推理小说，《嫌疑人X的献身》中的文字鲜加雕琢，叙述平静简练，情节诡异迷离，故事架构几近匪夷所思，精妙设计的诡计使得小说有着强烈的悬疑性和可读性，乃至读者和研究者多聚焦于其中反常理的悬疑设置方式。洞察贯穿逻辑缜密的本格推理过程始终的人性因素，分析作品中各人物间的情感关系及其对于悬疑破解的影响，探

期刊

嫌疑人X的献身亲情爱情友情主题

全固态中波广播发射机的维护管理分析

随着广播电视行业的快速发展,全固态中波广播发射机在中波广播工作中的应用范围愈加广泛,逐渐取代传统的电子管发射机,有利于保障广播的效果。为了确保全固态中波广播发射机

期刊

广播发射机中波固态全固态中波广播维护管理发射设备管理分析电子管设备管理使用水平

声表面波介质表面受力条件下的波速变化研究

为了计算力负载直接作用在声表面波传播表面时波速的变化特性,通过有效材料系数将负载引入,并用广义Green函数计算声速,得到了数值计算的结果,并用声表面波谐振器进行了实验.

期刊

声表面波谐振器介质表面受力波速变化质量负载实验表面波传播直接作用谐振频率线性关系数值计算加载方式函数计算材料系数波的传播灵敏度计

自适应分组成对比较法:原理及种子的选择

声品质主观评价实验中,大样本量的成对比较实验由于评价时间随样本数量的平方增长而变得难以实现,为此本文提出了自适应分组成对比较法.该方法不仅可以有效减少评价工作量并

期刊

自适应分组成对比较法数学原理种子选择主观评价实验样本选取样本数量算机仿真实现方法平方增长经验公式比较实验子样本准确度样本量小实

一种适于说话人识别的非线性频率尺度变换

与本文相关的学术论文