基于计算听觉场景分析的单通道混合语音分离算法研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:dragonunderwater
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技水平的发展,人机交流的需求也随之大大增加,语音交流作为最为方便直接的交互方式,在实际应用环境中却常常受到各种噪声的干扰,使其应用受到限制。相比机器,人类即使利用一只耳朵也能在嘈杂的环境中有效地分辨出目标声源的信息,利用计算机技术对人类感知语音信息的过程进行模拟仿真,即为计算听觉场景分析(Computational Auditory Scene Analysis,CASA)。基于CASA的语音分离系统对混合语音的先验信息要求不高,适用性较强,激起了人们极大的研究兴趣。本文对CASA的理论知识进行了深入了解,在此基础上,对基于CASA的传统单通道语音分离系统进行了改进,主要工作如下:(1)以谐波特点为分类线索的CASA语音分离算法最终分离结果的好坏与基音估计的准确程度有着密不可分的关系,而传统的基音检测算法在较强的噪声干扰下性能不佳。针对这一问题,提出了一种基于多分类支持向量机的基音检测算法。该算法使用语音信号的静态帧级特征对多分类支持向量机进行监督训练,计算出各帧语音可能的几个基音大小作为对应的基音候选值,并使用主体延伸法对得到的候选基音进行处理,在候选基音中选取合适值连接起来得到被测语音的基音频率估计曲线。实验结果表明,该方法可以有效提升低信噪比环境下的基音检测率,为CASA语音分离系统提供了一个更好的分类依据。(2)针对传统基于自相关函数的CASA分离算法在噪声干扰下会舍去过多的语音信息的问题,提出了一种改进算法。该算法以一种对噪声干扰具有鲁棒性的频域特征为特征线索,代替传统的相关函数计算各个时频单元的周期信息,将这些周期信息与用本文所提基音估计算法检测到的主导基音进行匹配性测试,标记各个语音分量。实验证明,更加准确的主导基音会提高CASA语音分离系统的性能,同时使用本文提取的频域特征可以保留更多的语音信息,使合成的目标语音有着更高的可懂度,同时也有利于后续的语音信号处理。
其他文献
目的:通过对结肠息肉患者临床资料的回顾性分析,了解本地区朝鲜族和汉族人群结肠息肉的发病特点及影响因素,更好的为临床诊治结肠息肉提供参考。方法:收集2012年1月~2016年12
总结了颈静脉留置针在临床中的应用,包括在急救中的应用;在院前急救中的应用;在外伤的应用;在大面积烧伤患者休克期抢救中的应用;手术抢救中应用;在上消化道大出血患者输液中
科技馆是现代社会发展起来的新型教育机构。它所承担的是非正规教育,是学校教育的重要补充,是公众学习科技、体验科技的重要场所[1]。作为科技馆主要功能的科普展览教育,是弘
课堂教学中的教学语言是教师表达思想、传递情感、讲授知识、塑造学生美好心灵的基本工具。在课堂教学中,它对培养学生的学习能力、提高教学效率起着至关重要的作用。因此,教
[目的]研究添加葡萄糖和明胶对纤维素分解菌筛选的影响。[方法]采用培养液富集,结合改良刚果红平板直接分离法筛选和分离纤维素降解菌。[结果]培养基中添加少量葡萄糖可以促
<正> 当代美国著名的社会学者伊恩·罗伯逊曾经作过这样一个测算,他说:“如果我们把地球上自从有生命以来的全部历史压缩为一年,那么,直到这一年的12月31日夜里11点53分才出
目的:探讨重型颅脑损伤去骨瓣减压术(Decompressive Craniectomy,DC)后并发脑膨出的临床特征,为减少或避免脑膨出的发生提供临床依据。方法:回顾84例重型颅脑损伤DC后并发症脑
目的了解某高校已婚女职工各种妇科疾病的发病情况,有针对性地进行健康教育,以减少妇科疾病的发生。方法对合肥市某高校530名女教职工进行妇科常规、宫颈刮片、妇科彩超、乳
物权效力优先是物权的基本效力,也是物权有别于其他权利的特征。物权相互之间的优先效力并非物权效力优先原则之内容。从物权的绝对性原则中,不能解释出物权效力优先,物权优先于
基于民俗旅游资源开发过程中出现的各种问题 ,有识之士疾呼保护民俗文化的背景下 ,本文从参与民俗旅游资源开发的主体出发 ,探讨各个主体在民俗资源保护中的责任 ,同时提出一