【摘 要】
:
本文依托于单位自选项目,以研制多路话音实时处理的语种识别系统为总体目标,根据单位实际业务需求,在对比分析目前主流语种识别技术的基础上,重点研究基于锚模型的GSV-SVM i
论文部分内容阅读
本文依托于单位自选项目,以研制多路话音实时处理的语种识别系统为总体目标,根据单位实际业务需求,在对比分析目前主流语种识别技术的基础上,重点研究基于锚模型的GSV-SVM i语种识别系统,同时对该系统后端分类算法进行优化并予以FPGA实现,为该系统能够实时处理多路话音提供可靠保障。本文主要研究工作及贡献如下:1、在分析基于GSV-SVM的语种识别系统关键技术基础上,根据其SVM核函数特殊的表达形式,提出一种与之等价的识别系统。同时将后验概率引入SVM的得分输出,并对SVM两种常用分类策略进行研究,结合实验结果及有关文献结论,选择了快速Pairwise Coupling法作为等价系统的后端分类算法,从而确立了本文语种识别的基线系统;2、提出一种基于Model Pushing的锚模型区分性训练算法。针对引入锚模型的基线系统,该算法通过结合Model Pushing算法思想,构建出更具语种区分性的锚空间,使GSV维数降低并抑制了GSV中说话人信息的干扰,从而使SVM训练时间得以缩短。实验结果证明了锚模型区分性训练算法对提高语种识别系统的有效性;3、结合上述两种改进算法,针对基于Model Pushing的区分性锚模型GSV-SVM语种识别系统的实时处理需求,提出了一种矩阵合并优化算法以降低该系统后端分类器的FPGA实现难度,并从识别性能、精度、资源占用率以及实时处理四个方面对分类器的FPGA实现进行了测试验证。结果表明,经优化后采用FPGA实现的后端分类器能够完成多达826路话音的实时处理,且与基于Visual Studio2010平台的软件识别性能几乎一致,满足了系统多路话音准确识别及实时处理的需求。
其他文献
Teletext是一种在不增加额外带宽的基础上,在电视频道中传输一些文字和简单图像信息的标准。在此标准下,电视服务提供商可以在电视信号中提供节目导航信息,生活服务信息,即时新闻
本文从微观层面深入探讨票据融资(主要指银行承兑汇票)与信贷之联系规律,提出重塑商业银行票据融资与信贷业务之关系,实现两种业务的优势互补和协同发展。
润滑油营销已进入品牌竞争,应加强对润滑油市场的分析,有针对性的建立品牌意识并加强品牌市场的培养,营造竞争发展优势。
人类科技的发展历史中,总是与电磁频谱的开发利用紧密联系在一起的。米波,分米波,厘米波段已经能够得到越来越广泛的应用。于此同时,人们已经把对微波频谱的研究推向毫米波和亚毫
随着集成能力的飞速发展,片上网络(NoC)的能耗问题日益突出。基于电压岛的片上网络低能耗设计以能够大幅度降低片上能耗而受到广泛关注。目前,针对该设计的研究处于起步阶段,仍存
乾县于1993年被批准成为省级历史文化名城,是咸阳市渭北人口稠密市县之一,在快速城市化和西部大开发双重背景下,城市人口迅速集聚,城市化需求加快,同时面临城市发展和历史文
日前,教育部印发通知,要求开展幼儿园“小学化”专项治理工作。通知要求,对于幼儿园提前教授汉语拼音、识字、计算、英语等小学课程内容的,要坚决予以禁止;对于幼儿园布置幼
目的:本文旨在以全科医生岗位胜任力要求为基础,对全科医师规范化培训学员参培过程中的基本情况、临床实践培训及认知状况进行研究比较,分析培训中对全科医生岗位胜任力培养的影响因素,进而发现培训中存在的问题与不足,为进一步优化全科医师规范化培训质量、提高全科医师规范化培训效果提供一定理论指导。方法:采用王晶等人于2016年构建的全科医生岗位胜任力指标体系,自制调查问卷,于2018年对山西省11家全科医师规
七年级人教版生物学教材P.14探究'非生物因素对某种动物的影响'中选用的动物为鼠妇、黄粉虫和金鱼。在具体教学过程中笔者发现:我校由于地处新疆南疆,气候干燥,鼠妇
目的 探讨耳声发射和自动听性脑电反应联合进行新生儿听力筛查的效果。方法 选取2016年1~12月来我院门诊进行听力筛查的足月新生儿300例作为研究对象,将其按照就诊顺序奇偶性