【摘 要】
:
人工智能技术不断更新迭代,并向日益丰富的应用场景渗透,人机语音交互技术日益不可或缺。然而外界环境的多变、噪声的干扰往往会严重影响语音交互性能,特别是强噪声、单通道
论文部分内容阅读
人工智能技术不断更新迭代,并向日益丰富的应用场景渗透,人机语音交互技术日益不可或缺。然而外界环境的多变、噪声的干扰往往会严重影响语音交互性能,特别是强噪声、单通道条件下,从而阻碍语音技术的真实应用,因此一个好的前端语音分离模块尤为重要。近年来有监督语音分离技术取得了重要的研究进展,其中主流的有监督学习算法包括基于计算听觉场景分析、基于非负矩阵分解和基于深度学习的源分离算法。本文研究内容包括基于非负矩阵分解以及基于神经网络的有监督语音两种分离算法,具体内容和创新成果示下:首先,本文重点关注基于非负矩阵分解的语音分离方法,并在目前方法上进行改进和优化,研究出基于卷积非负矩阵部分联合分解的强噪声单声道语音分离算法。通过基音检测算法得到混合信号的语音起始点,再据此确定混合信号中的纯噪声段,最后将混合语音频谱和噪声频谱实现卷积非负矩阵部分联合分解,获得语音基矩阵,进而获得分离的语音幅度谱和时域波形信号。实验结果表明:在不同噪声类型和噪声强度条件下,本文提出的卷积非负矩阵部分联合分解的语音分离均取得较好的效果。其次,本文研究了基于深度聚类的监督性语音分离算法和网络框架,在此基础上,提出一种基于门限卷积深度聚类的语音分离方法,充分利用卷积神经网络其多层次的非线性结构强大的特征学习能力,且擅于发掘语音时频单元中的时空结构信息的优势。该算法允许对语音频谱的上下文特征建模,考虑语音信号的时频依赖性和局部特征,有利于提升语音分离的性能。实验结果表明:该方法不仅取得较好的分离效果,还在保证语音性能的前提下,提升运算效率。最后,本文将所做的具体内容进行了总括,并针对本文内容做出进一步部署。
其他文献
[目的]分析新型农村合作医疗制度的实施对于提高农民卫生服务利用状况的作用和影响程度。[方法]利用中国健康与养老追踪调查数据,采用回归分析法分析个人因素、经济因素、新
<正> 草莓是营养丰富的保健水果,颜色艳,口感好,果实中所含的鞣花酸具有抗癌效果,温室草莓果实成熟期,一般在每年的2~4月间,这时正值水果淡季,很受人们青睐,温室草莓栽培容易,
2012年8月30日国家发展和改革委员会、卫生部、财政部、人力资源和社会保障部、民政部、保险监督管理委员会正式公布《关于开展城乡居民大病保险工作的指导意见》,开展城乡居
四年来首次盈利,海马汽车躲过退市风险。受大环境影响,2019年,绝大多数车企都不好过,利润大幅下滑。而曾被深交所发出退市风险警示的海马汽车却在2019年扭亏为盈。近日,海马
在中国企业“走出去”的时代大背景下,对外翻译的需求也越来越大。本实践报告涉及的《巨鲨专业显示器用户手册》的翻译实践就是在这样的背景下产生的。该实践是笔者的第一次
垃圾填埋场的渗滤液渗漏是周围地下水环境的主要威胁之一。以冕宁县漫水湾垃圾填埋场为例,预测垃圾渗滤液对浅层地下水环境的危害程度,通过Modflow和MT3D模拟分析了正常工况
国际干散货航运业是世界航运业的重要组成部分。世界干散货运输船队在世界海运船队中占有极其重要的地位,特别是在大宗货物运输方面。对一个国家或地区而言,其干散货航运业的发
晚第四纪气候演变有3个主要阶段:最后间冰期、大理冰期和冰后期。最后间冰期分3个暖期和2个冰期,最高温高于现在4℃。大理冰期分3个副冰期和2个副间冰期,最低温低于现在8—13
英语科目普遍存在于我国各级教学之中,虽然在教学内容和教学层级方面存在不同,但是教育教学过程中遇到了一定的困难。而信息技术在教学领域的普遍应用,对传统的教学模式产生
为了研究温度对煤体吸附甲烷性能的影响,采用WY-98B型吸附常数测定仪,选取了含气量较高矿井的3种煤样,进行了不同温度下吸附甲烷的等温线测试,并据此拟合出了温度与Langmuir