多声源及噪声环境中的语音分离及后处理技术研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:dvvicky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在语音交互场景中,目标说话人的语音通常会受到其他人声、外界噪声等多种声学因素的干扰。针对存在噪声和多声源的复杂声学场景,语音分离算法可以将麦克风接收到的混合信号中的各个声源分离。在分离后再利用后处理降噪算法抑制残留噪声,可以达到提升语音质量的效果。非负矩阵分解是一种盲源分离算法,它将混合信号分解为字典原子矩阵和系数矩阵,再通过对混合信号字典原子进行分组实现声源的分离。在多通道场景中常利用声源的空间信息对字典原子进行分组,因此在噪声环境中对声源空间信息的准确估计就尤为重要。U型网络是常用的全卷积网络之一,是一个具有跳过连接的编码器-解码器网络。然而传统的U型降噪网络通常对频域信号的幅度谱进行处理,这就导致对相位信息的忽略,并且简单的跳过连接可能使编码器和解码器之间交换的特征中存在的语义差距。本文针对上述问题,分别对基于非负矩阵分解的语音分离技术和基于U型降噪网络的后处理技术展开研究,主要的研究内容和创新点如下:首先,本文提出了基于频率滑动广义互相关和非负矩阵分解的语音分离算法。该算法利用频率滑动广义互相关,减小噪声的影响,进而得到准确的声源信号的到达时间差。之后通过将声源的估计到达时间差与混合信号的字典原子相结合,对字典原子进行分组,进而实现语音分离。实验证明,与传统的非负矩阵分解算法相比,该算法在噪声环境中语音分离的性能具有显著的提升。其次,本文提出了基于跳过卷积的时域降噪网络,该网络通过重新采样、计算和组合不同时间尺度的特征,将每个跳过连接替换为多个卷积模块,并且与时序卷积网络相结合,增强输出的语音质量。实验证明,本文提出的网络性能优于传统U型降噪网络,其不仅具有明显提升的噪声抑制能力和语音质量增强能力,并且很好地减少了语音失真。
其他文献
近年来,随着环保要求的逐渐提高,含磷的阻垢剂和缓蚀剂的应用受到限制,因此开发高效绿色的无磷阻垢剂和缓蚀剂对于循环水系统的运行具有重要意义。本文以淀粉为基体合成了一种三元阻垢缓蚀剂,并测试了其阻垢缓蚀效果。测试结果表明,该三元阻垢缓蚀剂具有较好的阻垢缓蚀效果,并且易生物降解,具有较强的应用潜力。
期刊
无人机(Unmanned Aerial Vehicle,UAV)因具有高灵活性、易部署和低成本等特点,其在无线通信系统中的应用已受到广泛关注。随着无线传感器及微电子等技术的快速发展,无线传感器网络(Wireless Sensor Network,WSN)的应用领域逐渐拓展,如应用于环境监测及智能家居等领域。WSN中传感器节点(Sensor Node,SN)从环境中感知数据,进而将数据传输至汇聚节点
学位
无人机(Unmanned Aerial Vehicle,UAV)作为空中基站能够给用户提供灵活按需的通信服务,是未来无线通信领域的关键技术。通过优化UAV部署,以增强地面无线网络覆盖、减少能耗等开销,对于增进用户体验质量(Quality of Experience,Qo E)、提高经济效益具有重要意义。目前已有大量工作研究了通信UAV部署,但仍存在以下问题:1)目前研究基于用户需求服从非时变先验分
学位
叶片作为风力机捕获风能的核心部件,它的安全性和可靠性对机组的运行起着至关重要的作用。现有的检测技术还不能便捷且有效地检测出叶片早期故障,因此本文首先对基于声音事件检测的风力机叶片故障检测的可行性进行了研究,由于声音事件检测算法不能泛化使用不同设备录制的样本,本文又对录音设备不匹配下的风力机叶片故障检测进行了研究。针对现有风力机叶片故障检测方法还存在检测成本高、检测效率低、数据收集困难的问题,本文提
学位
文章提出利用阻垢剂预防或减少隧道排水系统结晶病害这一思路。首先,通过文献调研了目前阻垢剂的研究进展,总结了常见的阻垢剂种类,并对未来阻垢剂的发展方向进行了深度剖析;随后,将目前普遍认为的阻垢剂阻垢机理归纳为:螯合作用、晶格畸变作用、分散作用、再生-自解脱膜假说、阈值作用;最后,介绍了隧道排水系统结晶堵塞病害的形成过程及特点,分析了阻垢剂在隧道排水系统中的应用难点,为下一步阻垢剂的应用提供基础。
期刊
随着互联网技术的不断发展,网络媒体中产生了海量的文本数据。这些文本数据中蕴含大量有价值的信息,如何高效、快速地从海量的评论文本中挖掘信息,吸引了众多研究人员的关注。文本情感分析可以从文本数据中挖掘出用户的观点和态度,不仅可以为企业或用户提供丰富和有价值的信息,而且可以及时监控舆情的发展。方面级情感分析任务作为文本情感分析的一个重要研究方向,能够更加细粒度地对带有情感色彩的评论文本进行情感极性分析。
学位
报纸
双目视觉测量技术作为计算机视觉和图像处理相结合的热门研究课题,其通过两台参数相同的相机对同一物体进行拍摄得到图像并获取同名点在左右图像中的视差,根据视差计算同名点的三维坐标进而完成测量。在双目视觉测量领域中多采用基于点特征的图像匹配算法获取同名点对,于是,本文对基于点特征的图像匹配算法以及双目视觉测量技术展开研究。论文具体内容概括如下:1.在图像匹配算法方面,为克服传统线性滤波在构建尺度空间时容易
学位
随着无线语音通信技术的快速发展,人们对语音交互的体验需求逐渐增高。尤其在近几年全球新冠疫情爆发期间,人们的工作学习大多通过远程会议系统来进行沟通交流。在通话时语音信号常受到声场环境中噪声的干扰,导致语音质量和可懂度降低。麦克风阵列技术作为一种主流的语音增强技术,相比于单通道语音增强算法,它能够利用空间信息,从而对非期望方向的噪声有更好的抑制效果。因此为了缓解远程会议系统在噪声声场环境下的语音通话质
学位
在全球气候变化背景下,近年来极端降雨频发。城市人口和资产高度集中,一旦发生超出设防标准的暴雨洪水,则有可能影响整个生命线系统的正常运行,甚至危及人员生命安全。上海市受特殊地理位置和气候条件影响,极易受到台风、洪涝和风暴潮灾害及遭遇组合的影响。利用已有的上海城区洪涝仿真模型,模拟分析了郑州“7·20”特大暴雨在上海城区分别以徐汇区、黄浦区和浦东新区世纪大道为暴雨中心的3种情景重演的内涝风险分布。结果
期刊