语音识别中基于i-vector的说话人归一化研究

来源 :现代计算机(专业版) | 被引量 : 0次 | 上传用户:kingwaaaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
i-vector是反映说话人声学差异的一种重要特征,在目前的说话人识别和说话人验证中显示了有效性。将i-vector应用于语音识别中的说话人的声学特征归一化,对训练数据提取i-vector并利用LBG算法进行无监督聚类.然后对各类分别训练最大似然线性变换并使用说话人自适应训练来实现说话人的归一化。将变换后的特征用于训练和识别.实验表明该方法能够提高语音识别的性能。
其他文献
随着世界经济一体化进程的加快,国际集装箱运输市场正进入一个新的发展与竞争时期,我国集装箱运输业在新的发展环境下,正面临着新的、更加激烈的市场竞争.因此,如何正确把握
《三字经》历来被公认为中国古代流传最广、影响最大的幼学启蒙教材之一。清朝建立后,《三字经》满、蒙文本相继问世,对满、蒙民族居住地区教育的发展以及满、蒙民族的文化与
采用推拿手法治疗小儿迁延性腹泻,根据小儿脾常不足的特点,就其虚实夹杂的病理特征,通过手法对特定穴位的刺激以补虚泻实,能改善胃肠之血运,减缓肠蠕动,增强消化酶与抗体的分
运用遗传算法解多目标问题,结果往往会陷入局部最优。引入传统算法求得的外部种群,提出基于随机扰动的RDMOGA遗传算法。将新算法用标准多目标测试函数进行测验,并与韩丽霞提出的NMOGA算法进行对比,实验结果表明,新算法表现出良好的搜索性能。
"一带一路"倡议的实现离不开语言的铺路,而复合型、多元化的跨学科人才是"一带一路"建设的支点和关键。"一带一路"愿景与目标的实现离不开创新创业人才、海外高端人才、非通
为了能够将哲学逻辑中的公理系统运用到行为时序逻辑的研究中。对行为时序逻辑公式的语义进行形式化定义.从语义和语法两方面研究行为时序逻辑公理系统和具有自反性质的线性时
在赛车运动中,有个叫“漂移”的术语。它通常靠改变前后轮的速度差,使车体在转角时产生重量转移,进而高速过弯。速度,是赛车手的终极之梦,也是能量与质量的恒比。
期刊
受到功耗和温度的限制,传统的单核处理器性能难以提升,多核计算成为新的处理器模式。然而现有的多线程程序设计是以单核处理器为基础发展而来,无法高效利用多个处理核心来提升性
文章认为,司法责任制定原意的出发点是规范司法行为,落脚点是明确司法责任范围,强调保护检察官依法履职的权利并重。责任追究的基准应同时满足主体适格、客观存在失范办案行