基于计算听觉场景分析和语者模型信息的语音识别鲁棒前端研究

来源 :自动化学报 | 被引量 : 0次 | 上传用户:yuanhongsheng1982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统抗噪算法无法解决人声背景下语音识别(Automatic speech recognition,ASR)系统的鲁棒性问题.本文提出了一种基于计算听觉场景分析(Computational auditory scene analysis,CASA)和语者模型信息的混合语音分离系统.该系统在CASA框架下,利用语者模型信息和因大子最大矢量量化(Factorial-max vector quantization,MAXVQ)方法进行实值掩码估计,实现了两语者混合语音中有效地分离出目标说话人语音的目标,从而为ASR系统提供了鲁棒的识别前端.在语音分离挑战(Speech separation challenge,SSC)数据集上的评估表明,相比基线系统,本文所提出的系统的语音识别正确率提高了15.68%,相关的实验结果也验证了本文提出的多语者识别和实值掩码估计的有效性.
其他文献
<正>京东商城,拥有6万员工,其中8成是基层蓝领员工。如何培训这样的员工群体?移动互联网时代,该如何利用互联网思维开创人才培养新模式?有两组数据可以印证京东的变化:过去我
从盘锦河蟹壳制备甲壳素,后者用盐酸水解,再纯化得到D-氨基葡萄糖盐酸盐,同时研究了其对羟自由基(·OH)清除作用和对超氧(O2-·)自由基的抑制效果。
利用2005年全国1%人口抽样调查数据,分析了我国东南部十一个省份就业者基于户籍制度的收入差异。户口类型对于工资的影响可以被不同户口类型人群的教育回报差距所解释。不同
本文针对企业目前普遍存在的、对战略有效沟通重视不足的问题,强调了战略沟通对于企业战略实施的意义,进而提出如何有效地进行战略沟通。
内部审计作为企业内部控制的重要组成部门,在企业治理结构中的地位不容忽视。我国内部审计工作起步较晚,虽已取得一定的成绩,但是仍存在内部审计独立性差、内部审计人员整体
目的:优化菌株Bacillus cereus SG03在10L发酵罐中产胆固醇氧化酶的工艺条件,为该菌株的进一步应用提供依据。方法:在10L发酵罐中,通过单因素实验,分别考察了培养液起始pH、
为了探讨银杏叶提取物对肉鸡免疫性能的影响,试验将360只1日龄雏鸡随机分为4组,每组设3个重复,每个重复30只。对照组饲喂基础日粮,试验1~3组分别在基础日粮中添加0.15%、0.30
为了在北京鸭W1品系选育过程中应用体尺指标选育肌内脂肪及屠体性能,试验测定了北京鸭W1品系30只公母鸭体尺指标与肌内脂肪含量及屠体性能指标,并进行了相关分析。结果表明:
网络体育赌博是指人们拿足球、篮球等比赛结果、球员以及相关的事实通过网络进行赌博的行为。网络赌博是一种新的形式,更加具有隐蔽性。2014年巴西世界杯期间,网络体育赌博俨
随着近年来我国展会业的大力发展,我国已成为世界级展会的举办大国.展会业的信息化、智慧化转型是互联网 + 产业发展的必然导向.文章基于物联网和 RFID 技术为展会业提供-个智