基于补偿相位谱的单通道语音增强算法改进

来源 :江苏科技大学 | 被引量 : 1次 | 上传用户:liguiming321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过语音传递信息是人类生活中最重要、最有效、最方便的一种常用信息交换形式。在这个信息化的时代,语音中所包含的信息量起着至关重要的作用。但是,由于现实生活中周围无时无刻都存在着各种各样的噪声,因此语音增强技术有着举足轻重的地位。语音增强技术在国内、外已经作为语音信号处理中十分重要的研究课题,并且已经做了大量的研究工作。对此,本文在介绍改进的单通道语音增强算法之前,先从语音增强的研究背景及意义、研究现状及发展趋势,还有语音增强研究的分析难点这几个方面进行了阐述,为了使文章脉络更加清晰,还对语音增强的一些理论基础进行描述,例如:语音信号特性、噪声特性、预处理、两种经典的语音增强算法、一种用于实验比较的频带划分方式以及评价语音增强算法优劣的主、客观评价方式等。在以往经典谱减法的语音合成过程中,都是采用原始的带噪语音相位谱与语音幅度谱相结合,然而最新的心理声学研究表明,语音的相位谱与语音的可懂度也有较大的联系,于是传统相位谱补偿算法提出了一种对相位谱进行修正的方式,其是对带噪语音复频谱进行加性相位谱补偿。本文提出了一种利用等效矩形带宽(ERB)尺度划分改进的补偿相位谱语音增强算法,此算法是在传统相位谱补偿算法的基础上进行改进的,算法中的噪声估计幅值是通过使用ERB尺度进行多带谱减法后计算得到的,而改进的补偿相位谱是对初次增强的语音复频谱进行加性计算。与此同时,改进的算法也将ERB尺度划分应用于补偿相位谱中初次增强的语音算法中,本文中的补偿相位谱是在经过基于ERB尺度划分的多带谱减法初次增强后的语音复频谱上进行加性计算。从利用Matlab构建仿真环境进行的改进后算法,在客观评价、主观分析语谱图以及直观听觉感知的主观评价上来看,本文提出的算法都有明显优于四种对比增强算法的地方。除此之外,本文还针对传统的相位谱补偿函数中的补偿常数因子进行了改进。由于对传统补偿相位谱语音增强算法进行了改进,先前传统算法中由实验经验得出的补偿常数已经不再适用,而且使用常数无法对不同情况下的背景噪声进行灵活补偿。于是将原先固定的补偿常数改进成一个根据分段信噪比的变化值而相应改变的补偿因子,这就弥补了无法对带噪语音相位谱进行灵活补偿的问题。本文改进的此算法能够灵活的根据各个频带中噪声不同的变化对带噪语音的相位谱进行补偿,以此与先前得到的利用ERB尺度划分临界频带的改进补偿相位谱语音增强算法相结合。从客观评价的仿真结果和主观评分的结果表明,在特定信噪比与特定噪声的情况下,本文提出的自适应补偿因子的算法处理效果有着明显的提高,其余情况下也有着不亚于原算法的表现。
其他文献
随着海洋技术的不断发展,人类开始在各种海况下进行复杂的海上作业,海洋环境中船舶的不规则运动给海上作业的安全性带来不利影响,此时利用主动运动补偿技术可以极大地降低危险。过桥装置是一种在安装母船与搭接目标之间形成一条平稳海上通道的重要海洋装备,有效地补偿母船在海浪干扰下的运动对过桥末端位置的干扰影响,可以更好地控制搭接距离以减少作业危险,更快地完成搭接任务以提高作业效率,因此针对过桥装置进行主动运动补
经穴—脏腑相关,即体表—内脏相关,是针灸理论的核心内容之一,是指导中医诊断和治疗的重要理论基础。它反映了经穴与五脏六腑之间的一种双向性联系,经穴-脏腑彼此相系的整体
目的:本课题通过益气化瘀解毒方联合TACE(经肝动脉灌注化疗栓塞术)治疗中晚期原发性肝癌的真实世界研究,初步评价该方案的临床疗效,为临床提供科学证据。方法:病例来源于201 6年1月-201 9年9月在湖南省中医药研究院附属医院肿瘤科及湘雅医院介入科住院患者,按照纳入及排除标准,共纳入104例患者,试验组采用益气化瘀解毒方联合TACE方案,对照组予单纯TACE治疗,对2个队列患者的PFS、瘤体、中
目的:本实验研究以本课题组前期构建及鉴定的新型结核病疫苗菌株(B/R菌株)为研究对象,比较研究BCG菌株、H37Ra菌株和B/R菌株对T细胞免疫记忆的影响,探讨研究B/R菌株的抗结核免疫保护作用及其机制,为B/R菌株作为新型结核病疫苗菌株提供理论依据。方法:1.疫苗菌株的制备:BCG、H37Ra菌和B/R菌株分别接种于改良罗氏培养基上,培养3周,制备成1?107CFU/m L菌悬液。2.动物分组及
本文通过对赵廷来长篇小说《丛林万里》的分析研究,从文学地理学的角度,从三个方面论述了其中所描写的西安形象:一、赵廷来、《丛林万里》和中国;二、《丛林万里》中的西安形象;三、《丛林万里》中西安形象的艺术价值。《丛林万里》是赵廷来的一部以中国为背景,讲述了韩国企业家的故事。该书于2013年出版后,引起热烈反响。在此之前,赵廷来为了《太白山脉》、《阿里郎》的创作,曾经数十次来到中国采风,并将自己对于中国
多环芳胺(PAAs)是一类非常重要的有机物质,具有极高的经济价值和广阔的工业应用需求。其中,萘胺是非常重要的精细化工材料,在染料合成、分析试剂、荧光指示剂、聚氨酯等方面都
本次翻译实践的源文本来自于剑桥大学出版社2014年出版的《话语与知识:社会认知视角》(Discourse and Knowledge:A Sociocognitive Approach),作者是荷兰语言学家、话语分析家Teun A.van Dijk。该书从认知、文化和社会情境等多个维度阐述了人们如何在知识的基础上创造和理解话语,旨在初步构建话语和知识的理论体系。本次翻译实践涉及该书的第二章节,该章
教育经济学研究近四十年来在我国有长足发展,但与国际研究前沿相比仍显落后。因此,教育经济学前沿英语文献汉译对不能有效英语阅读的国内相关领域学者非常必要。《代际教育流动性和经济发展水平》是《欧洲经济评论》2019年7月第116卷发表的一篇教育经济学论文。根据委托方要求及该论文特点,报告作者以Newmark(1981)提出的交际翻译理论为指导,充分考虑了汉语译文的目标读者。在该理论指导下,本报告以这篇论
本翻译实践报告所选的作品《旗驼》是蒙古族作家格日勒其木格·黑鹤所著,是以当代学生们日常不多见、关注度不高的内蒙古草原骆驼为主线的动物文学作品,全书共约4.5万字,按照作品中主人公白驼的出生、成长到经历过程分为八个部分,翻译后译文约5.2万字。该作者的很多作品都是以草原为背景,围绕着与草原密不可分的动物以及与这些牲畜共命运的游牧民族,用其细腻的文字、感人至深的故事情节,描述着独特的草原气息。通过本作
射流非预混火焰广泛的存在于实际燃烧设备中,其中火焰的稳定性影响着燃烧设备的安全运行,而火焰的结构也往往决定着燃烧设备的尺寸,通常燃烧室中存在热伴流氛围,这些特性在此氛围中又有着不同的变化,目前热伴流情况下不同条件对火焰的影响规律还不明确,因此研究不同条件下射流火焰的稳定性与形态变化有着重要的理论意义和实际应用价值。针对此实验设计并搭建了热伴流实验系统,主要包括射流燃烧器、气路系统、加热系统和数据采