基于修正离散余弦变换的音频增强技术

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:huangping118
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于网络上共享的音频资源经常会混入各种噪声,导致这些音频资源的质量参差不齐;另外,随着数字化进程的加快,许多珍贵的旧唱片等也采用数字化的存储方式,然而在这个过程中经常会引入噪声,严重影响其音质。如何增强这类音频的质量是目前亟待解决的一项课题。  本论文主要针对音频信号中的咝咝(Hiss)噪声、谈话(Babble)噪声、办公室(Office)噪声、街道(Street)噪声、车内(Volvo)噪声和削波(Clip)失真的去除展开研究,提出了几种音频增强算法,并最终实现了一套基于AAC码流的音频增强算法。  在Hiss噪声去除方面,考虑到MDCT系数的高阶系数主要为噪声成分,本文引入了修正的绝对中值标准差(Modified Median Absolute Deviation,MMAD)来估计Hiss噪声。本文首次利用修正的离散傅里叶变换(Modified Discrete FourierTransform,MDFT)系数进行人耳听觉掩蔽阈值的计算,并将参数软阈值方法与掩蔽阈值和掩蔽参数相结合来消除音频信号MDCT系数中的Hiss噪声。同时,结合实际应用,提出了一种基于AAC码流的Hiss噪声抑制算法,有效去除了音频信号中常见的Hiss噪声。  在典型噪声(Babble、Office、Street、Volvo)抑制方面,由于音频信号中弱信号成分对其音质有很大的影响,所以本文引入修正的加权递归平均算法(Modified Weighed Recursive Averaging,MWRA)来保护含噪音频信号中的弱信号成分,防止其被估计成噪声成分。考虑到音频信号有很强的掩蔽能力,本文引入了人耳听觉模型,并结合自适应的β阶高斯统计模型,提出了一种基于MDCT的典型噪声增强算法,有效抑制了MDCT系数中的典型噪声。为了能够用于去除网络音频信号中的典型噪声,将前述的典型噪声增强算法与AAC编解码器相结合,本文提出了一种基于AAC码流的典型噪声抑制算法。  在削波(Clip)失真修复方面,本文首次在频域根据MDCT系数提取相关音频特征,并将这些特征用来训练Fisher最优投影方向和分类阈值;然后利用Fisher线性判别方法进行Clip检测以及利用子带包络码书映射的方法来修复MDCT系数中的Clip失真;最后本文将该算法应用到AAC编码器中,提出了一种基于AAC码流的Clip修复算法。  主客观测试结果表明,本文所提出的音频增强算法能获得较好的噪声消除效果,并且增强音频的感知质量有明显的提高,算法性能优于参考算法。
其他文献
随着近年经济的飞速发展,人们生活水平的提高,我国的建筑耗能与日俱增,中国的能源出现严峻的考验.建设成为节能型社会已成为迫在眉睫的任务.本文首先对建筑工程中应用暖通空
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
学位
异质结双极晶体管(HBT)具有高输出功率、优异的高频特性、较宽的线性和高的效率,广泛适于功率放大器、雷达、通讯及电子战系统、微波振荡器和A/D转换器等应用,并扮演着越来越重
真菌是种类繁多、分布广泛的真核生物,它们不仅具有多样的形态结构和生存方式,而且能够产生结构新颖多样的活性次生代谢产物,是药物候选化合物的重要来源之一。植物内生真菌是指
第三代半导体材料中,GaN材料具有击穿电压高、迁移率高、电子饱和速度大等优良特点。近年来AlGaN/GaN HEMT的研究已经取得很大的进展,但应力诱导的压电问题一直是AlGaN/GaN HEM
Fc受体(FcR)是一种表达在免疫细胞表面的受体分子,由多亚基构成,通过与免疫球蛋白(Ig)的Fc段结合引起包括炎症因子释放和吞噬作用等体液和细胞免疫反应。本研究采用RACE技术首
心肺听诊技能训练教学系统是针对医学模拟教学和临床技能培训而开发的便携式医学教学系统,改变了过去用射频和特制听诊器来模拟心肺听诊的过程。本系统采用低功耗的MSP430单片
羊肚菌(morel)为羊肚菌属(Morchella)所有种类的总称,是世界公认的一类珍贵、稀有食(药)用真菌。羊肚菌是国际上最重要的贸易真菌之一,亦是我国重要出口创汇野生食用菌。羊肚菌
病毒感染宿主的最终结果决定于病毒与宿主之间的复杂的相互作用。一方面,宿主可以通过免疫系统的作用来抑制病毒的侵染和复制。先天性免疫系统(Innate Immunity System)是宿主