【摘 要】
:
语音活动检测(Voice Activity Detection,VAD)是语音前端特征处理的一个重要环节,它直接影响到后续处理的效果和效率。主流的模型VAD对训练数据的依赖度过高,在不同场景下需要
【机 构】
:
北京市互联网信息办公室,讯飞智元信息科技有限公司,上海大学机电工程与自动化学院
论文部分内容阅读
语音活动检测(Voice Activity Detection,VAD)是语音前端特征处理的一个重要环节,它直接影响到后续处理的效果和效率。主流的模型VAD对训练数据的依赖度过高,在不同场景下需要重新训练不同的模型,这带来的数据标注的工作量是非常惊人的。一种自适应建模的VAD方法结合了能量VAD和模型VAD的优点,成功地解决了这个问题。它对每一条语音在线地训练出语音和非语音模型,根据每一帧在模型上的似然度得分给它们打上标签,经过平滑后就可以很好地找到语音的起点和终点。实验结果表明,该方法取得了很好的效果,F1指标相比传统能量VAD提升了0.031,说话人分离错误率下降了0.45%。
其他文献
马钢第一钢轧总厂中板线二辊区域辅传动由模拟量控制系统改造为西门子数字量传动系统。介绍了改造原因、设备功能、传动系统选型依据及具体调试方法。
<正>当前和今后一个时期,全省各级政研会组织要深入贯彻党的十八大、十八届三中、四中全会精神和习近平总书记系列重要讲话精神,主动适应新常态,着力巩固全省人民团结奋斗的
<正>美国是新媒体的发源地,美国的档案学教育与档案学研究起步也比较早。同时,美国出台一系列档案相关法律保障公众知情权,优化档案网站的服务质量,美国档案网站的信息传播也
2008年12月30日,国家环境保护部正式批准了《本钢节能减排结构调整项目环境影响报告书》(环审[2008]614号文)。至此,本钢建设千万吨级精品板材基地的重大系列建设项目获得了环保
诚信是饭店在经济社会中生存与发展的前提,更是提高饭店服务竞争力的关键。饭店职业经理人作为饭店的核心人物,其诚信程度直接关系到饭店的前途与命运。因此,构建饭店职业经
在经济全球化的背景下,创业是促进经济增长的新动力。而只有在政府的大力支持下,创业之路才能更加顺利。因此,我们需要建立一个政府和企业有效沟通的机制,使得政策顺应新创企
<正>一、互联网档案的出现按照美国加州大学2003年的一项研究结果,2002年在互联网的各类网页中大约有92PB的信息,其中,在公众比较容易获得的表层网页中有167TB的信息。美国国
基于深度神经网络(Deepneuralnetwork,DNN)的语音活动性检测(Voiceactivitydetection,VAD),忽略了语音帧特征在时间上的相关性,随着信噪比的降低性能会明显下降。本文提出了
善对程序正义的功能理论是罗尔斯正义理论的重要组成部分。罗尔斯将其分为完善程序正义、不完善程序正义及纯粹程序正义。善与实质正义具有一致性,善对程序正义具有批评和校
目的探讨自卑自信通过临终尊严对晚期癌症患者生命意义感影响的机制。方法采用多中心抽样方法,运用临终尊严量表、生命意义感量表(MLQ)和中国人个性测验自卑自信分量表(CPAI)