基于深度学习的多通道回声消除方法研究

来源 :洪依 | 被引量 : 0次 | 上传用户:glosslee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
21世纪是智能信息产业的高速发展时期,各种智能音视频会议的出现极大地便利了异地办公或跨区域沟通等活动,回声消除作为保证会议通话质量的重要环节也得到了广泛关注。然而因为传统的基于自适应滤波的回声消除算法存在收敛速度慢、计算复杂度高、双讲检测精度不够高等问题,对非线性声学回声处理能力也有限;传统的单麦克风设备因为采集范围小,空间真实感差等不足也难以满足实际需求。为解决以上问题,本文借助深度神经网络强大的非线性建模以及自学习能力,构建高效的多通道回声消除方法。本文主要研究内容如下:(1)首先针对传统自适应滤波回声消除算法的不足,借助RNN(Recurrent Neural Networks)处理时序信号的优势,构建一种基于LSTM(Long Short-Term Memory)的回声消除网络替代传统的自适应滤波算法,并由单通道扩展到多通道回声消除中,最后通过实验验证了基于深度学习的LSTM多通道回声消除方法可以更有效地消除回声。(2)提出了一种基于ECA-CRN(Efficient Channel Attention-Recurrent Convolutional Networks)的多通道频谱掩蔽回声消除方法。该方法借助多层卷积神经网络构建编解码器,加强网络对不同层次特征的提取能力,克服LSTM结构中全连接层参数冗杂、难以提取某些局部不变特征的缺点,同时在编解码器中融入通道注意力ECA-NET(Efficient Channel Attention Network),提升网络对重要特征的关注,另外结合自适配归一化(Switchable Normalization),使网络能根据不同分布的输入信号自适应选择合适的归一化。最后通过和其它方法的结果对比,验证了ECA-CRN方法具有更好的回声消除性能,能够有效提升语音的听觉质量。(3)提出一种基于MP_U-Net(Magnitude Phase_U-Net)的多通道频谱掩蔽回声消除方法。该方法采用全卷积结构,改进了ECA-CRN中LSTM模型参数量大以及计算速度缓慢的不足,同时采用幅值和相位相结合的频谱掩蔽算法,有效地避免了单独使用幅值掩膜而产生的相位失真问题,另外添加低模型复杂度的通道注意力模块,进一步提升网络的性能。最后在单讲和双讲下的实验结果均表明,基于MP_U-Net的方法相较于其它深度学习方法能够取得更好的回声消除效果。
其他文献
单招,即单独招生,是高校对那些具有艺术或体育专项才能并达到一定标准的考生,通过降低高考文化分而录取他们的招生制度。这是我国高考制度的重要组成部分。艺术化地处理此题材的角度是展示在这一背景下参与其中的学生的命运及反思个体成才的模式。影片以体育特长生网球运动员胡立强为拍摄对象,截取从2020年03月到2021年08月他两次冲击二级运动员证并最终成功的这段经历为影片的内容,以时间为线索,展示他的成长经历
学位
南昌市在《国民经济和社会发展第十四个五年规划》中提到公共文化服务水平需提升,强化公共文化服务供给能力,积极推进公共文化服务城乡一体化,让文化建设成果惠及全体百姓。公共文化服务是政府应履行的文化义务,与群众的美好生活需要也密切相关。近年来南昌市从政策引导、财政支持、增加优质文化产品供给等多方面下功夫,一定程度上推动了公共文化服务发展。但文化发展形势苟日新、日日新,南昌市公共文化服务高质量发展情况如何
学位
近些年来,由于目前我国社会工业化建设进程的不断加快,城市人口数量进行逐步增加,进而引起城市规划用地不足的问题;而随着城市人口的不断聚集,越来越多的低收入人群选择到城中村居住,城中村问题开始引起人们的关注。城中村是我国城乡双重体制和改革开放特殊背景下的城乡环绕现象。随着城中村问题的不断累积,城中村所存在的建筑规划失控、社会治安混乱的问题逐渐暴露,这不仅增加了城市管理的难度,而且也在一定程度上破坏了城
学位
第七次全国人口普查数据显示,我国人口老龄化程度进一步加深,其中65岁及以上人口比重达到13.5%,距离“深度老龄化”已近在咫尺。老年群体不断壮大,随之带来的是老人身心健康、晚年医疗保障等问题,尤其是农村老人,在乡村振兴的大背景下,农村各项基础设施不断完善,农民的基本生活有了较大的改善,但我国农村社会保障制度远远跟不上老龄化的步伐,致使以家庭为主的养老方式受到了冲击,农村老人的精神文化生活问题亟待关
学位
随着本科教学的侧重点逐渐从追求学科的完备性转移到满足社会的需求性,成果或目标导向教育(Outcome-based Education,OBE)的人才培养模式日益受到教育界的认同与普遍接受。而如何使传统以职能为导向的教学质量管理体系适应这一新的教学理念,成为OBE模式顺利推行而必须研究解决的关键问题。为此,本文将质量科学的质量管理体系理论应用于本科教学的质量管理,系统研究基于OBE人才培养模式下的本
学位
当前有机涂料是最常用且经济有效的防腐蚀手段之一,但其高分子成膜物本身的分子结构以及所形成薄膜的半透性、内部缺陷等使得有机涂层在服役期间不可避免地遭受外界机械损伤、腐蚀介质渗透以及化学侵蚀作用而失效。研究表明将氧化石墨烯(GO)纳米片分散到有机涂层中能构成“曲折路径”有效延缓腐蚀性介质到达金属基体表面,从而提高涂层抗渗透性。而另一方面导电聚合物聚苯胺(PANI)具有独特的活性防金属腐蚀特性,且其作用
学位
机会网络是一种通过节点移动实现通信的自组织网络,可应用于野生动物追踪、水下救援探险、偏远地区网络覆盖等场景。不同于普通的网络,机会网络的演化极其复杂,具有节点连接稀疏、网络拓扑变化频繁等特点。链路预测是机会网络研究的热点问题之一,通过分析网络的拓扑结构及节点属性,提取网络演化的特征,以估计节点间链路存在的可能性,为上层路由协议的设计提供支撑。本文提出一种基于Graph SAGE的机会网络链路预测模
学位
振镜系统是一种高精度、高速矢量的伺服控制系统,是实现激光雷达扩束的重要基础部件。然而激光雷达复杂多变的工作环境,导致振镜系统在扫描的过程中容易受扰动和噪声等不确定性因素的影响,降低激光扩束的准确性。为了克服这些不利因素,本文开展了如下研究:(1)围绕振镜系统位置跟踪扫描的设计目标,完成了振镜控制系统的总体设计,并建立了振镜伺服系统的数学模型,为后续振镜位置跟踪控制算法的研究奠定基础。(2)在连续时
学位
近年来,随着经济文化的繁荣发展,旅游景点和地铁站等公共场合都出现聚众的情况,人数管理也因此变得越来越重要。人流量监测是用于统计特定区域的人数,它是人流量控制和救援营救等措施的基础。本文提出了一种基于商用Wi Fi的人流量监测方案,该方案相对于传统的人流量监测方案,有着易部署、低成本和适用性强等特点,同时无需被监测人员佩戴任何智能设备,真正做到无源监测,实现智能感知人流量的目标。在大数据和人工智能的
学位
诚信,不仅是个人品质和道德的彰显,同时也是社会正常运转的关键要素,其已然成为代表市场主体交易活动的名片。但随着中国经济高速发展,社会不断进步,与经济和社会发展不相匹配的信用制度成为阻碍进步的掣肘。为了解决我国社会经济主体信用缺失的问题,失信惩戒制度以其高效性、低成本、便捷性的优势迅速成为地方政府青睐的新型治理方式。但与此同时,我们不应忽略其所具有的两面性。近年来,失信惩戒制度实施中频频出现过罚不相
学位