语音增强算法比较研究及其在特征提取中的应用

来源 :山东大学 | 被引量 : 0次 | 上传用户：WYH5198

【摘要】

：

【作者】

：

李玮琦

【出处】

：

山东大学

【发表日期】

：

2020年11期

【关键词】

：

语音增强减谱法自适应滤波法评价指标基频提取

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语言是人类社会文明发展的产物,在现代社会中语音的作用也不再局限于日常交流,而被应用在许多方面。但是在实际应用的过程中,环境噪声的影响是不可避免的,严重干扰了语音信号的采集与识别,同样也令许多语音处理系统性能骤减,因此,我们需要对噪声污染的语音信号进行语音增强处理。随着深度学习理论的成熟和人工智能的发展,出现了越来越多的基于深度学习的语音增强算法,然而受限于数据集和模型的高要求,运算量也相对较大,因此,对于传统算法的优选和改进研究对现有产品系统提高抗噪性能仍然是很有必要的,具有现实应用价值。在实际应用中,既要考虑算法对于语音时频信息保留的完整度,又要考虑硬件电路中的功耗问题,因此从降噪效果和运算量两方面来对比研究各类算法具有十分重要的意义。由于各类语音增强算法都有其优点和缺点,因此在不同的噪声环境下,力求通过研究找到提高系统性能、降低系统功耗的语音增强方法。本文首先从理论上对多种语音增强算法做分析,包括基本减谱法以及多窗谱减谱法,改进减谱法,自适应滤波法,维纳滤波法,改进的小波包语音增强算法。基本减谱法从语音信号的频域层面分离语音信号和噪声,其组织结构简单且运算量比较小,是容易实现的语音增强算法;多窗谱减谱法是对减谱法的改进,使用多个正交的数据窗取平均来求取谱值,得到的结果误差较小;改进减谱法对基本减谱法的改进则集中于噪声的功率谱估计,引入了端点检测和符合人耳的听觉感知特性的Bark子带划分,使得算法对于噪声的功率谱估计更为准确;自适应滤波法可以根据不同时刻的信号特点自动调节权值和参数,能够适应噪声和信号的随机性,实现最优滤波,其性能远远超过固定参数的滤波器;维纳滤波法基于最优均方误差准则来得到增强的语音信号,通过设计一个线性时不变系统,使得输出信号尽可能逼近所期望的信号;改进的小波包法基于小波包语音增强原理,对于小波去噪阈值的确定进行了改进,结合人耳听觉感知原理,更准确的估计其特征。然后对于语音增强在特征提取中的应用做了相应的研究,以基频提取为例,对从谐波角度进行基频提取的谐波和法进行了原理介绍和算法复现,谐波和法具有很好的基频提取性能。在实验中,对纯净的语音信号加入不同类型,不同强度的噪声,包括平稳噪声和非平稳噪声,在Matlab环境下分别用各类算法进行语音增强,对比分析各类算法的语音增强性能。对语音增强性能的评价方法包括降噪效果和运算量,其中降噪效果包含客观指标和主观指标:客观指标采用信噪比增益、分段信噪比,主观指标是语音增强后人耳测听语音信号的正确率。对于运算量的统计则是选取同样的一段语音,统计代码运行阶段算法进行语音增强处理的时间,探究不同算法在不同的噪声环境下的语音增强性能,运算量的大小。通过实验的对比研究发现:第一,在降噪效果方面,综合各个噪声环境下的情况,自适应滤波法,改进减谱法和改进小波包法表现最好,相比于其它三种算法性能提升较大,基本减谱法和多窗谱减谱法差别不大,维纳滤波器法性能最差;第二,在运算量方面,由于基本减谱法运算量最小,以此为基准对其它五种算法进行量化,多窗谱减谱法的运算时间最长,为基本减谱法的18.65倍,其次是自适应滤波法,为11.43倍,第三是改进小波包法,为9.4倍,接下来是改进减谱法,为8.32倍,最后是维纳滤波法,6.77倍;第三,结合降噪效果和运算量的对比结果,改进减谱法运算量相比自适应滤波法运算量减少了 1/3,而降噪效果却大体相当,总体来看实现了降噪效果和运算量的折中,在保证降噪效果的同时也减少了功耗;最后,将改进减谱法语音增强用于语音特征提取,即对有/无降噪处理的带噪语音信号分别用谐波和法做基频提取,其结果与纯净语音的基频提取结果作对比,以检验语音增强对特征提取的改进,实验结果证明改进减谱法作为基频提取前的预处理,能够很好保留语音特征的准确性。上述研究结果对实际语音信号处理系统的性能改进有参考价值,但仍需结合具体系统的硬件和软件环境作后续试验测试和完善。

其他文献

爆炸荷载下高强混凝土板损伤的PZT监测

通过实验验证利用压电陶瓷智能骨料对高强混凝土结构在爆炸超动态荷载作用下进行健康监测的有效性,采用在两块C60高强混凝土板中预埋智能骨料,并在板上方同一位置施加不同药

会议

PZT压电陶瓷高强混凝土板主动检测小波包能量分析

融资融券对股市流动性和波动性的影响研究

虽然融资融券在英美等国家的发展已比较成熟,但是,关于其对流动性和波动性的影响却始终存在着较大的争论,对此进行更深入的研究,有助于厘清其对市场效率的具体影响,尤其像我

学位

融资融券流动性波动性双重差分模型

漫话律诗绝句的叙事

<正>五七言古体诗,特别是篇幅较长者,往往含有叙事的内容,这是众所公认的。那么,五七言律绝能否叙事?是否也存在叙事的现象?则似乎尚有怀疑;对于有的人来说或者是从未考虑过

期刊

《全唐诗》文学叙事王靖献

从《傅雷家书》看音乐人的音乐之路与人生之路

几千年来,我们一直在歌功颂扬母爱,以至于一度产生父爱在孩子教育中缺席的错觉。苦心孤诣的教子篇《傅雷家书》的出版,不仅填补了父爱的缺位,而且论述了作为音乐家的音乐之路

期刊

《傅雷家书》音乐家音乐之路人生之路启示

广场舞参与者多元化行为特征及动机演变的质性研究

在中国老龄化社会趋势中,老年孤独是当前老年人健康生活面临的突出问题。广场舞最初是古代的统治阶级用来宗教祭祀的一种仪式方式和手段,之后,这种形式逐渐演变为祭祀仪式。

学位

中老年广场舞参与者多元化行为特征动机演变

山西：上半年商品房销售面积及销售额均降

<正>据2019年8月6日《经济参考报》:山西省统计局最新公布的数据显示,今年上半年,山西省商品房销售面积932.4万平方米,同比下降7.8%,其中商品住宅销售面积862.5万平方米,同比

期刊

商品房销售销售面积销售额商品住宅

李始叶螨对甲氰菊酯和速螨酮的抗性选育及交互抗性研究

以从零星种植的苹果树上采集的李始叶螨为敏感种群 ,在室内分别用甲氰菊酯、速螨酮对李始叶螨的敏感种群进行抗性培育。结果表明 :以抗甲氰菊酯的李始叶螨种群抗性增长最快 ,

期刊

李始叶螨甲氰菊酯速螨酮抗性培育交互抗性

对外汉语初级阶段教师非言语行为研究

非言语行为不仅在人们的日常生活和交际中有着不可忽视的作用,在对外汉语教学中同样有很重要的作用。随着对外汉语教育事业的不断发展,越来越多的学者开始关注并且探索对外汉

学位

对外汉语初级阶段非言语行为调查启示

生物医用钛合金的相图热力学研究

材料设计和新材料开发是材料研究的热点,其中相图被称为材料设计的“索骥图”,它可以直观反映材料成分、结构和性质之间的关系,在材料研究领域有着举足轻重的地位。本工作以生物医用钛合金中关键材料体系(Ti-Zn二元系、TiAl-Zr三元系和Ti-Nb-Hf-C四元系)为研究对象,目的是通过关键实验、耦合第一性原理和相图计算(CALPHAD,CALculation of PHAase Diagram)方法,

学位

钛合金热力学相图第一性原理计算相图计算

毒死蜱和甲氰菊酯对家蚕毒性与安全评价研究

通过食下毒叶法和接触法测定了毒死蜱和甲氰菊酯对家蚕的毒性。结果表明:食下毒叶法对2龄起蚕的LC50(48h)分别为:毒死蜱2.3322mg/kg桑叶和甲氰菊酯0.1522mg/kg桑叶,其浸渍桑

期刊

毒死蜱甲氰菊酯家蚕毒性安全评价

语音增强算法比较研究及其在特征提取中的应用

与本文相关的学术论文