基于CASA的语音分离技术及应用研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:zdbzdb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,随着智能电子产品的广泛流行,语音技术尤其是自动语音识别技术也迎来了新的研究热潮。在现实环境中,语音信号通常会受到各种噪声的干扰,降低了信号的质量以及识别度,从而导致了语音技术不能很好的应用和推广。为了解决这个问题通常会考虑利用降噪技术,传统降噪技术虽然经过多年的发展,但大部分是基于统计特性的,并且被处理的语音需要满足一定的约束条件,因此仍然有很多难以解决的问题。人类听觉系统对语音信号的感知力远远超过了现在的声音信号处理水平,研究人员对人类的听觉系统进行了研究,希望用机器模拟人类听觉系统对语音信号的感知过程,计算听觉场景分析(Computational Auditory Scene Analysis,CASA)就是这类研究中的一种典型方法。研究人员利用CASA理论开发出了一些语音除噪系统,其中比较成功的系统是Hu-Wang系统,这些系统能够将语音信号从含有噪声的混合音频信号中分离出来。本文对CASA的相关理论技术以及基于CASA的语音分离系统进行了研究,并对具有代表性的Hu-Wang语音分离系统提出一些改进的方法,论文主要包括下面几项工作:1.提出了一种利用基于单位帧内高低频能量比来约束混合线索的分段算法。在高频区域,语音信号不会存在较高的能量,如果此区域受到噪声干扰,则分离线索也会受到相应的干扰,从而影响时频单元的分段效果。因此以提高时频单元在分段环节的合并效果作为改进方向,提出了一种基于单位帧内高低频能量比约束混合线索的分段算法。实验表明此算法能够有效提高系统的分离性能。2.将音质客观评价系统和CASA系统相融合。语音分离的性能评测标准通常是信噪比,但信噪比提高,并不意味着人对语音质量的感知效果会相应提高。因此本文尝试把音质客观评价系统和CASA系统相融合,以达到在提高语音分离信噪比增益的同时也能够提高音质感知的效果。实验表明此方法能够较好的提高分离结果的语音质量。3.基于CASA技术的改进语音分离系统设计与实现。将上述两种改进方法融入语音分离的相关环节,设计完整的分离系统,实现对目标语音信号的分离,达到语音降噪和提高语言质量的目的。
其他文献
随着计算机技术的不断发展,人们在信息时代面临着越来越多的数据,如何发现隐藏在众多数据中的内部信息成为人们研究的热点问题。传统的数据库管理系统已经不能满足人们从数据库
本文主要研究图论及其应用中两个方面的问题:1、缺省n-可扩图:2、求赋权Halin图任意给定两点之间最优Hamilton路的有效算法。 论文的第一章介绍了文中所涉及的相关概念和术
在高温超导磁悬浮车运行过程中,列车悬浮高度是列车运行的一个关键数据,关系到列车运行安全的大问题,必须实时的检测。磁悬浮列车具有极高的速度,这就要求对磁悬浮车的悬浮高度进
WLAN是指采用无线传输媒介的计算机局域网。随着WLAN技术的飞速发展,无线局域网的安全问题成为大家关注的一个焦点,由于WLAN采用公共的电磁波作为载体,因此对越权存取和窃听的行
随着现代科技的高速发展,报纸、书籍、科技文献等以文字为载体的信息大量涌现。尤其是在计算机和国际互联网络高速发展的带动下,每天都会有不断涌现的海量信息。为了能从这些海
Web服务作为下一代Web的标志性技术,能够有效地解决企业集成环境中存在的软件接口复杂、难以升级和集成等方面问题,并使得服务供求双方有机地形成商业供求链。单个Web服务难
智能化是计算机发展的必然趋势,无论是计算机控制,还是商用民用软件,都要求含有越来越高的智能因素,因此人工智能的研究越来越受到重视。20世纪80年代,基于结构演化的人工智能理论
近几年来,在“211工程”及相关计划的推动下,数字化校园建设也有了重大进展。各大高校在网络基础设施、信息系统建设方面日益完善。一方面,这些信息系统都是各个部门根据自己的
本论文研究工作的背景是四川省网络通信技术重点实验室的与核工业部九院的合作预研项目:无人机战术网络(UAS-TN-Unmanned Aerial System Tactic Network)。UAS-TN是一种特殊的
本论文研究的是为四川省某商业集团建立一个企业应用系统的集成平台,为该集团的各应用系统提供工作流服务。此集成平台称为工作流平台(Workflow Platform,WFP),亦称工作流管理系