会议电话中的实时回声消除算法研究与实现

来源 :东南大学 | 被引量 : 1次 | 上传用户:JunKao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网产业的高速发展,各种新型通信设备层出不穷,极大的便利了人们的生活。VoIP会议电话凭借其优质、廉价、便捷的优势,一经推出,便迅速获得了大批用户的青睐。在会议通话中,麦克风和扬声器之间的声耦合使得回声现象比较严重,这极大的降低了用户体验,为保证通讯效果,必须对回声进行有效的消除。本文在深入研究经典回声消除算法的基础之上,结合当下热门的深度学习技术,尝试性的将深度学习网络应用在回声消除上。本文主要研究内容如下:(1)介绍了回声消除的研究背景和意义,并从理论研究和系统硬件方面对国内外回声消除相关技术的研究历史与现状进行了总结。(2)介绍了经典回声消除算法结构。首先对声学回声消除的基本知识进行了介绍,包括声学回声产生原因、会议电话工作模式和语音信号的预处理。然后详细介绍了常用的经典回声消除算法结构,主要介绍了线性自适应滤波、非线性后滤波处理、双端检测这几个关键模块。这些经典算法为本文后续章节提出的算法提供了架构支持。(3)介绍了常用的深度学习算法及其在语音分离领域的应用。首先介绍了语音常用特征参数的计算(如短时平均幅度、短时过零率、基音周期、美尔倒谱系数等)。然后阐释了模式识别、机器学习和深度学习基础理论以及它们之间的联系与区别。接着介绍了几种常用的深度学习算法。最后介绍了当下深度学习技术在语音分离领域的应用,这些应用是本文后续研究的启迪之源。(4)提出了一种基于DNNs的回声消除结构。该结构用DNNs神经网络来代替经典算法中的自适应滤波器表征回声路径特性,通过对DNNs神经网络的训练,学习参考信号到回声信号之间的映射关系,从而可以根据参考信号,映射出回声信号,继而进行消除。本章首先介绍了该结构各个模块的原理,然后介绍了实验数据库和训练、测试数据集的制作方式,最后通过仿真验证了该结构的有效性。(5)提出了一种基于LSTM-RNNs的回声消除结构。该结构主要分两部分,一部分用于学习参考信号特征和回声信号特征之间的映射关系,另一部分用于学习期望增益和参考信号特征、近端信号特征之间的映射关系。本章首先介绍了在处理时序数据方面性能出众的循环神经网络(RNNs),并介绍了两种为解决长时依赖问题而提出的两种改进版的RNNs结构LSTM和GRU。然后详细介绍了本章提出的结构的各个模块原理。最后通过仿真验证了该结构的有效性。(6)总结了所做工作,重点包括对经典算法的研究和借鉴深度学习在去混响、语音增强领域的应用而提出的两种利用深度学习网络进行回声消除的架构。最后从算法的泛化性、实用性等方面对未来工作进行了展望。
其他文献
日新月异的现代生活让人们对能源的需求越来越大,而传统的化石能源的枯竭,促进了风能、潮汐能、太阳能和地热能等新能源的崛起。此时人们迫切的期待一种新型的能量储存转化设
2008年,百年一遇的金融危机席卷全球,中国企业也不能置身事外。在陶瓷行业,面对产业结构调整、原材料价格上涨、环保整治、通货膨胀、房地产业疲软,以及劳动力成本递增等诸多利空
将逆流漂洗工艺应用于4-乙酰基-2-氨基苯甲醚生产上,可使生产过程中产生的硫酸浓度为2%的硝化废水,浓缩成浓度为30%-40%的浓废酸,可供化肥厂综合利用生产硫铵肥料,从而实现生产废水零排
利用Cu^+-Na^+离子交换技术制备了BK7玻璃平面光波导,在632.8nm波长的耦合光下测量了波导的有效折射率,根据反WKB方法确定折射率分布轮廓,近似符合高斯分布。求出了所制备玻璃平
今年10月13日至19日,中国艺术研究院、中国工艺美术馆、中国工艺美术学会等单位联合举办的“中国传统工艺美术精品大展”在北京民族文化宫举行,来自全国各地的2000多件传统工艺
对于轨道成网条件下的城市,围绕轨道交通实现公交导向发展具有良好的基础。而城市自行车交通作为城市交通体系的重要组成部分,既能解决公交出行“最后一公里”的接驳问题,更能减少不必要的机动车出行,为城市交通的可持续发展提供活力和动力。但轨道成网条件下的城市自行车交通体系尚待完善,路网结构及基础设施尚待优化,无法实现其功能定位。因此研究轨道成网条件下的城市自行车交通组织方法对完善出行链、优化交通结构、提高公
摘 要 本文用碳热还原法制备了纳米氮化硅粉体,研究了纳米氮化硅颗粒的表面形貌及其电子自旋共振谱。  关键词 纳米氮化硅粉体,碳热还原法    1 前 言    目前世界上研究最多的氮化硅的制备方法主要有硅粉直接氮化法、碳热还原法、热分解法、低氨气压下燃烧合成法和气相反应法。本文利用碳热还原法制备了纳米氮化硅粉粒。    2 纳米氮化硅粒子的制备      用SiO2碳热还原氮化法制备Si3N4粉体
新媒体传播在虚拟社会拓展公众参与渠道的同时,也对领导干部的网络执政带来巨大挑战:国家安全威胁日益凸显、社会政治秩序面临冲击、社会价值观念发生混乱迷失、舆情传播格局日
采用普通精馏与加盐分相技术回收异丙醇。测定了异丙醇-水-氟化钾体系在恒温(40℃)时的液-液相平衡数据,并用Pitzer理论和Wilson方程对液-液相平衡数据进行了理论计算。结果表明:计算
目的:丙泊酚作为一种常用的静脉麻醉药已经被发现其直接或间接抑制肿瘤细胞增殖和迁移,发挥了抗肿瘤效应。因此,丙泊酚可能成为肿瘤手术麻醉药物较好的选择。然而其对骨肉瘤