基于深层神经网络的语音增强算法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:iamformywish
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在语音信号处理系统中,感兴趣的语音通常会被背景噪声干扰,严重损害了语音的质量和可懂度,作为前端处理模块,语音增强算法成为众多学者的研究焦点,多种语音增强算法已被提出用于噪声抑制,主要包括基于信号处理的方法、基于统计模型的方法和基于模型训练的方法等。在这些方法中,基于信号处理的方法,谱减法和维纳滤波法是两种最具有代表性的算法,当正确估计背景噪声时,该类方法能取得较好的语音增强性能,然而,在现实环境中,尤其是在低信噪比的条件下,由于噪声的随机性和突变性,使得噪声很难被准确估计,导致增强性能大大下降,同时易引入“音乐噪声”;基于统计模型的方法,虽然在低信噪比的条件下也可以取得比较好的增强性能,但是考虑到噪声与语音间的相互关系非常复杂,需要一些信号间的独立性假设以及对特征分布的高斯性假设,然而这些假设通常是理想的,在未知的不匹配噪声条件下,其性能恶化;基于模型训练的语音增强方法在低信噪比、复杂背景噪声条件下表现出了更好的效果。基于深层神经网络的语音增强就是近年来兴起的一种基于模型训练的方法,深层神经网络依靠对复杂特征优秀的抽象和建模能力,在语音信号处理领域引起了广泛的研究,基于深层神经网络的语音增强方法几乎无任何前提假设,可以很好地学习到从带噪语音特征到纯净语音的复杂非线性映射函数。本文基于深层神经网络在语音增强中的应用,分别从两个不同的角度,即声学特征和训练目标,提出了三种改进的基于深层神经网络的语音增强算法,借以解决基于深层神经网络语音增强中特征提取和目标函数优化等问题,提高增强语音性能。本文先是在TIMIT语料库和Noisex-92噪声库上仿真,对所提出的算法进行性能测试,然后利用语音监听设备采集现实环境中的带噪语音,对提出的三种算法进行实测,与传统的语音增强算法以及现有常用的基于深度学习的语音增强算法相比,本文提出的算法在增强语音可懂度、感知效果和语音质量等方面都取得了较好的效果。
其他文献
上海人民出版社面对市场的激烈竞争,以改革、开拓、求实的精神,在出书和经济增长两个方面三年迈出了三大步。图书销售码洋1994年从上年的880万元上升到4500万元,1995年达到60
从近期英国畅销书排行榜的走势来看,历史类图书在非小说排行榜上一枝独秀。其中最耀眼的就是安托尼·比沃尔的《斯大林格勒》。该书一举获得3项大奖,包括英国奖金额最高
据台湾媒体报道,老字号的台湾中华书局最近将位于重庆南路的门市迁往南港。此一举动是否意味着中华书局将有新的经营方针和目标?报道说,中华在走过40多年后,一方面由于时代更
中央电视台第二套经济台《生活》节目,9月1—2日分两次播出了有关儿童读物的节目。一次就儿童读物书价过高,指出出版社和书店拿得过多。一次就内容,指出85%家长不满意内容有不
由武汉大学新闻学院李敬一撰写的《中国传播史》(先秦两汉卷)日前在武汉出版,它的出版标志着我国首部传播史专著诞生,这对我国新闻学和社会学的研究起到了一定的推动作用。
荀子所处的战国,正是“礼崩乐坏”、奇辞异说纷起的时代。荀子继承了孔子的“正名”思想,在对墨、名两家思想批判的基础上,形成了他独特的“名”、“辞”、“辩说”的逻辑思
转炉渣具有高碱度的特点,当碱度大于2时转炉渣中的氧化钙将有部分以游离氧化钙(f-CaO)的形式存在。f-CaO是造成转炉渣膨胀的主要因素。在熔融态加入不同比例的高炉渣,结合SEM分析
图书的排印装质量是整个图书质量的重要组成部分,对实现图书的社会效益和经济效益有着举足轻重的作用。近年来,各家出版社和排印装厂根据新闻出版署的要求,在加强图书排印装
已有8年未有小说新作问世的智利作家伊莎贝·阿言德(Lsabel Allende),今年以《财运之女》在文坛展现,试图在小说创作中再攀高峰。 《财运之女》的时空虽然挪移至19世纪,
改革开放以来,我国民族出版事业不断发展,从1981年到1994年的14年间,我国共出版民族文字图书4万多种,发行量达5.3亿册,一个结构和布局比较合理,出版、印刷、发行比较齐全的民