基于深层神经网络的语音增强算法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户：iamformywish

【摘要】

：

在语音信号处理系统中,感兴趣的语音通常会被背景噪声干扰,严重损害了语音的质量和可懂度,作为前端处理模块,语音增强算法成为众多学者的研究焦点,多种语音增强算法已被提出

【作者】

：

任相赢

【出处】

：

天津大学

【发表日期】

：

2004年期

【关键词】

：

深层神经网络语音增强自编码特征综合特征多目标

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在语音信号处理系统中,感兴趣的语音通常会被背景噪声干扰,严重损害了语音的质量和可懂度,作为前端处理模块,语音增强算法成为众多学者的研究焦点,多种语音增强算法已被提出用于噪声抑制,主要包括基于信号处理的方法、基于统计模型的方法和基于模型训练的方法等。在这些方法中,基于信号处理的方法,谱减法和维纳滤波法是两种最具有代表性的算法,当正确估计背景噪声时,该类方法能取得较好的语音增强性能,然而,在现实环境中,尤其是在低信噪比的条件下,由于噪声的随机性和突变性,使得噪声很难被准确估计,导致增强性能大大下降,同时易引入“音乐噪声”;基于统计模型的方法,虽然在低信噪比的条件下也可以取得比较好的增强性能,但是考虑到噪声与语音间的相互关系非常复杂,需要一些信号间的独立性假设以及对特征分布的高斯性假设,然而这些假设通常是理想的,在未知的不匹配噪声条件下,其性能恶化;基于模型训练的语音增强方法在低信噪比、复杂背景噪声条件下表现出了更好的效果。基于深层神经网络的语音增强就是近年来兴起的一种基于模型训练的方法,深层神经网络依靠对复杂特征优秀的抽象和建模能力,在语音信号处理领域引起了广泛的研究,基于深层神经网络的语音增强方法几乎无任何前提假设,可以很好地学习到从带噪语音特征到纯净语音的复杂非线性映射函数。本文基于深层神经网络在语音增强中的应用,分别从两个不同的角度,即声学特征和训练目标,提出了三种改进的基于深层神经网络的语音增强算法,借以解决基于深层神经网络语音增强中特征提取和目标函数优化等问题,提高增强语音性能。本文先是在TIMIT语料库和Noisex-92噪声库上仿真,对所提出的算法进行性能测试,然后利用语音监听设备采集现实环境中的带噪语音,对提出的三种算法进行实测,与传统的语音增强算法以及现有常用的基于深度学习的语音增强算法相比,本文提出的算法在增强语音可懂度、感知效果和语音质量等方面都取得了较好的效果。

其他文献

探索改革开拓新思路确立一流出版大目标——上海人民出版社三年迈出三大步

上海人民出版社面对市场的激烈竞争,以改革、开拓、求实的精神,在出书和经济增长两个方面三年迈出了三大步。图书销售码洋1994年从上年的880万元上升到4500万元,1995年达到60

期刊

开拓新思路探索改革邓小平理论出版社经济增长年度指标“五个一”工程学科定位图书销售资产经营

历史题材图书畅销英伦

从近期英国畅销书排行榜的走势来看,历史类图书在非小说排行榜上一枝独秀。其中最耀眼的就是安托尼·比沃尔的《斯大林格勒》。该书一举获得3项大奖,包括英国奖金额最高

期刊

历史题材图书非小说主要战役二次世界大战斯大林格勒保卫战英伦畅销书创作手法历史图

台湾中华书局顺应时势面临转型的抉择

据台湾媒体报道,老字号的台湾中华书局最近将位于重庆南路的门市迁往南港。此一举动是否意味着中华书局将有新的经营方针和目标?报道说,中华在走过40多年后,一方面由于时代更

期刊

中华书局顺应时势转型台湾出版方向经营方针媒体报道传统与创新市场变化本土文学

中央电视台“生活”节目播出儿童读物出版的误区

中央电视台第二套经济台《生活》节目,9月1—2日分两次播出了有关儿童读物的节目。一次就儿童读物书价过高,指出出版社和书店拿得过多。一次就内容,指出85％家长不满意内容有不

期刊

儿童读物节目播出中央电视台误区书价《生活》分两次书店科普杂志无版权

首部《中国传播史》在武汉出版

由武汉大学新闻学院李敬一撰写的《中国传播史》(先秦两汉卷)日前在武汉出版,它的出版标志着我国首部传播史专著诞生,这对我国新闻学和社会学的研究起到了一定的推动作用。

期刊

传播史传播历史传播思想武汉先秦两汉传播学中国化传播观念传播问题社会学新闻学院

荀子逻辑思想研究

荀子所处的战国,正是“礼崩乐坏”、奇辞异说纷起的时代。荀子继承了孔子的“正名”思想,在对墨、名两家思想批判的基础上,形成了他独特的“名”、“辞”、“辩说”的逻辑思

学位

荀子名辞辩说

提高转炉渣体积安定性的实验研究

转炉渣具有高碱度的特点，当碱度大于2时转炉渣中的氧化钙将有部分以游离氧化钙（f-CaO）的形式存在。f-CaO是造成转炉渣膨胀的主要因素。在熔融态加入不同比例的高炉渣，结合SEM分析

期刊

转炉渣熔融态游离氧化钙压蒸安定性BOF slag smelt state free-CaO steam test stability

社厂双方都要重视图书的排印装质量

图书的排印装质量是整个图书质量的重要组成部分,对实现图书的社会效益和经济效益有着举足轻重的作用。近年来,各家出版社和排印装厂根据新闻出版署的要求,在加强图书排印装

期刊

印装质量视图图书生产图书质量色不匀透印错码抓质量错装好质量

智利作家阿言德诠释“财富”——《财运之女》出现中国形象

已有8年未有小说新作问世的智利作家伊莎贝·阿言德(Lsabel Allende),今年以《财运之女》在文坛展现,试图在小说创作中再攀高峰。《财运之女》的时空虽然挪移至19世纪,

期刊

作家中国形象心路历程小说创作美国加州19世纪环境冲击字里行间天堂之门金宝山

我国民族出版工作成绩显著

改革开放以来,我国民族出版事业不断发展,从1981年到1994年的14年间,我国共出版民族文字图书4万多种,发行量达5.3亿册,一个结构和布局比较合理,出版、印刷、发行比较齐全的民

期刊

民族出版工作成绩民族文字图书民族语言文字民族地区少数民族出版系统电子出版《福乐智慧》国家图书奖

基于深层神经网络的语音增强算法研究

与本文相关的学术论文