基于计算听觉场景分析的单声道语音分离

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yaoye_1108
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在自然环境中,一个典型的听觉场景中含有听觉噪声,例如环境噪声、音乐声以及其他人的说话声。噪声干扰目标语音给许多语音技术的应用带来了相当大的困难。单声道语音分离是指在单个信道情况下从混合语音信号中分离出目标语音。计算听觉场景分析是可以完成该分离任务的一种新方法,也是语音信号处理领域的研究热点。本文主要研究基于计算听觉场景分析的单声道语音分离问题。对听觉分割、高频时频单元标记和听觉重组后二值模的平滑处理等问题进行分析研究,提出一些改进的方法,并进行实验对比。本文的主要研究内容如下:(1)为了提高高频区域时频单元标记和听觉分割的准确性,本文提出了一种改进听觉组织的单声道浊语音分离算法。在组织阶段中,首先该算法利用不同的特征对高频和低频中的时频单元进行标记。采用增强包络自相关函数标记高频区域的时频单元。然后,利用起始和截止分析得到听觉片段,该方法可以有效地将语音和噪声分割到不同的片段。根据已经分离的浊语音二值模将这些片段选择性地重组到目标流中。系统评估表明,该算法优于原来的系统。(2)语音分离其实就是估计二值模,然后利用二值模从混合语音中合成目标语音。由于噪声的干扰降低了听觉线索提取的准确性,使得二值模中包含许多较小的噪声片段和破损的目标片段,导致合成的目标语音质量下降。结合形态学的二值图像处理方法,本文提出了基于掩码平滑的改进语音分离方法。该方法首先对二值模进行开运算操作,去除听觉流中噪声片段;然后进行闭运算操作修复破损的目标片段,获得丢失的目标单元。系统评估表明,经过平滑处理之后,合成目标语音的质量有所提升。
其他文献
语文是学生学习理解和运用祖国语言文字的课,是学生听、说、读、写的综合实践课,是引导学生提高语文综合素养的课。总之,语文是学生用来说、讲、读、写、用的必然工具。其中阅读
随着人们对无线通信业务需求的不断增长,不同体制、不同协议和不同应用场合的无线通信系统和网络结构层出不穷,日益增长的频谱需求与有限的频谱资源之间的矛盾也越来越突出,
汽车衡作为衡器的重要分支,具有称重范围广、测量速度快、便于控制计算等优点,广泛应用于仓储贸易、交通运输、工矿企业等部门。现有汽车衡受到偏载误差与线性度误差的影响,称重结果准确度有待提高;同时,汽车衡称重数据获取不易,称重系统处于小样本状态。针对这些缺点,在国家自然科学基金项目“大型衡器偏载误差机理与多传感器称重融合方法研究”的支持下,本文开展汽车衡称重误差补偿方法研究:利用汽车衡先验知识,构建一种
2000年1月-2001年10月,新股市场化发行改革受挫,导致我国证券市场遭受重大损失。目前,我国股权分置改革尚未完成,大量国家股法人股未流通,人民币在资本项目下不可自由兑换,投
Caspase-6(CASP6)是caspase家族中effector caspase的一员。除了作为细胞调亡的执行者的经典功能外,最新的研究发现caspsae-6在一些神经退行性疾病,如阿尔兹海默氏症和享廷顿氏
5G牌照提前发放是2019年赵国民心中最重要的一件事,意味着一个重要的战略机会来了.“国家在做重大经济结构转型,传统产业也在‘互联网+’,互联网、大数据、人工智能、区块链,
期刊
随着经济的发展和社会的进步,肥胖已经成了普遍影响人类健康的因素,可以引发很多疾病,如心血管疾病、糖尿病等;同时,影响人类的生育能力,造成生育障碍甚至不孕不育。瘦素是199
如果没有见过李莎萍本人,你可能想象不到,这位行事利落、征战茫茫戈壁的企业家,其实是一位干练中不乏柔和的女性.在10多年的中高层管理岗位上,她摸索出了一套从基层管理到中
期刊
作为全球变化的重要组成部分,外来植物入侵已成为世界性的环境问题。我国华南地区由于丰富的雨热资源以及频繁的人类活动,成为外来入侵植物入侵危害最严重的地区之一。五爪金龙
葡萄是在世界上被大量种植栽培的果树种类之一。由于栽培种植的时间长,种植量大,从而导致了众多的种群和品种群。使得其种类众多,种内变异也非常普遍,变异也很大,加上种间的自然杂