监督性语音分离中训练目标的研究

来源 :内蒙古大学 | 被引量 : 5次 | 上传用户:zhangnnnnnn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音分离是指从带有噪声的混合语音信号中提取出需要的目标语音信号,应用于鲁棒性语音识别、助听器设计和移动语音通信等领域。当前的语音分离技术在真实场景中的语音分离性能仍有待进一步提升。语音分离问题按照通道数分为单通道和多通道语音分离,本文主要研究单通道语音分离问题。语音分离问题可以被看做一个监督性学习问题,通过监督性学习算法加以解决。而对于监督性语音分离算法,训练目标是其中的关键环节之一,对分离性能有着重要影响。目前最常用的训练目标有理想二值掩蔽和理想浮值掩蔽,二者都是在假设纯净语音与噪声相互独立的条件下成立,在真实场景中难以满足。而复数域上的理想浮值掩蔽和相敏掩蔽考虑了语音信号的相位信息,不易于估计,因而实际分离效果仍不甚理想。相较于这些常用的时频掩蔽,本文所采用的优化浮值掩蔽,考虑了纯净语音与噪声间的相关性,符合真实场景中语音分离的条件。本文将其与监督性语音分离技术相结合,以优化浮值掩蔽作为分离目标,提出了解决语音分离问题的新方案。本文在多种噪声环境和信噪比条件下进行了仿真实验,并与几种目前常用训练目标进行对比分析,实验结果表明,本文所提出的方法进一步改善了语音分离的效果,更加适用于真实场景中的语音分离问题。考虑到优化浮值掩蔽是基于纯净语音与噪声的相关性信息,本文中进一步对更具有挑战性的不同人声之间的语音分离做了仿真实验,实验结果表明本文提出的分离方法对于不同说话人语音的分离同样具有性能优势。单通道语音去混响问题也是语音信号处理领域的研究重点之一。近年随着深度学习的推进,研究者们将深度学习应用于语音去混响问题,取得了不错的效果。本文将提出的语音分离方法用于实现语音去混响,实验结果表明去混响效果得到了一定程度的提升。
其他文献
Hadoop是当今应用最为广泛的开源云计算平台,主要由Hadoop分布式文件系统(HDFS,Hadoop Distributed File System)和MapReduce框架组成。   当前Hadoop分布式文件系统采取的
足球机器人比赛是近年来国际上兴起的一种高科技竞赛活动。足球机器人分为两大系列:FIRA系列和RobCup系列。足球机器人是集机器人学、智能控制、数据融合、计算机技术、无线
近几年,3D游戏产业已从国外逐步走向国内市场,且发展势头趋于猛进。很多大公司都已转手投资游戏产业,希望在市场上能够赢得一席之地,毕竟这是个新兴产业,在国内还处于初期发
随着CAD/CAM的迅速发展,人们对产品的几何外形设计提出了更多更高的要求,用于产品几何外形设计的曲面光顺和过渡曲面构造方法受到了极大的重视和广泛的研究,已成为当前的研究热
近年来,随着网络的快速发展,各行业、各领域越来越多地利用计算机网络来进行数据存储、传递和交换,用户对信息的安全保护需求愈益迫切。由于椭圆曲线密码体制(ECC)所具有的诸
BitTorrent是最流行的文件共享协议,作为P2P技术的主要应用之一,多年来取得了极大成功。在BitTorrent中,激励扮演着重要角色,它鼓励用户上传资源,以便获得较短的下载时间。然
目前移动网络已经成为智能终端获取信息资源的主要方式之一,而移动网络数据传输过程中产生的尾能耗,是导致智能终端能源效率低下的关键因素,因此合理有效地降低智能终端的尾
在基于J2EE的应用开发中,架构是技术实现的关键,随着J2EE的不断发展,涌现出大量的开源轻量级框架。而一些企业在应用开发中要求对架构的设计在追求尽量缩短研发周期、降低研
近年来,非均衡数据的分类问题引起了众多研究学者的关注和讨论。在地质勘探领域,岩石数据呈现非均衡特征的情况也多有发生,加上复杂储层存在勘探难度大等问题,传统的计算机辅
随着遥感信息技术的快速发展,对地观测产品种类日益繁多,遥感影像空间与时间分辨率等大幅提升。如何从海量的遥感数据产品中提取有用信息是近年来遥感地学研究中的热点问题,其中水体信息的提取可以广泛地用于农业生产、水资源保护与监测、防灾减灾等应用中。然而,当前水体信息提取难以达到大规模的应用水平,主要问题在于遥感数据存在着数据量大、种类复杂等特点,对于海量数据的处理需要消耗大量的计算资源与时间。同时由于遥感