双模态车载语音指令识别系统在线学习方法

被引量 : 0次 | 上传用户:cxcqjf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文的双模态车载语音指令识别系统,利用视觉信息辅助语音识别,可以在一定程度上提高噪声环境下语音识别系统的识别率。但在实际应用中,说话人以及车载周边环境的改变会使系统性能下降。尤其在高噪声(车速80km/h以上)的环境下,系统的正确识别率会显著下降,双模态车载语音指令识别系统要走向实用,就必须克服这种不鲁棒的问题。在语音识别系统采用在线学习方法,一方面可以降低不同说话人语音差异对系统造成的负影响,另一方面,可以提升系统对车载环境的适应性,增强在噪音环境中识别系统的稳健性。因此,在线学习技术的意义显得十分重要。本论文采用在线式+有监督式的方式,利用少量的在线学习数据来提高系统性能,很好的解决了说话人和环境差异的问题。主要工作包括以下三个方面:1.讨论并研究了两种基于模型的在线学习算法:最大后验概率(Maximum a Posteriori,MAP)和最大似然线性回归(Maximum Likelihood Linear Regression, MLLR)。通过实验,与初始系统的识别性能进行对比,发现不论使用哪种算法都能使系统有明显的改善。其中MAP具有良好的渐进性,但收敛性较差,MLLR在很大程度上改善了收敛特性,但其渐进特性却不如MAP。2.提出并实现了结合MAP和MLLR两种算法的综合渐进在线学习方法。首先对两种算法分别讨论其优缺点,并通过实验,发现结合了两种算法优点的综合渐进在线学习方法,其效果优于单独任何一种方法。然后针对系统音视频双模态的特殊性,本文采用了两种不同的学习策略,一是对听觉语音和视觉语音分别进行在线学习,将学习后的语音模型和视觉模型组合成一个新的双模态模型;另一个是对听觉信息和视觉信息在特征层上融合,然后对融合后的双模态信息进行在线学习,直接训练出一个新的双模态模型。实验结果表明,后一种策略能够更好的克服车载噪音对识别系统的影响,增强系统在不同说话人不同环境中的鲁棒性。3.设计并实现了在线学习系统。完成了系统中的人机语音对话式交互处理模块,以及双模态在线学习模块。实验表明该模块可以有效地降低外界语音的干扰,并对系统的在线学习起到监督式作用。
其他文献
<正>~~
<正>《普通高中语文课程标准(实验)》在"关于选修课程的设计与教学"中明确要求:"高中语文选修课程是在必修课程基础上的拓展与提高,有的侧重于实际应用,有的着眼于鉴赏陶冶,
目的 :探讨灵芝孢子内脂质对小鼠肝癌的抑制作用及其对肝脏的保护作用。方法 :动物试验观察灵芝孢子内脂质对移植性小鼠肝癌的抑制作用及其对 D-氨基半乳糖所致肝脏损害的保
本文阐述了橡胶微粒对热塑性树脂的增韧机理,以及核-壳弹性体对塑料共混物性能的影响。其目的是为合成抗冲改性用核-壳弹性体提供参考。
"新好莱坞"的出现促成了美国电影的显著变化.当代美国电影中并不全是商业片,有艺术追求的严肃影片才是更值得我们注意的创作倾向.美国电影也很注重政治和"潜移默化".
Pukuizi为棕榈科植物蒲葵Livistona chinensis(Jacq.)R.Br.的种子。春季采收,除去杂质,晒干。[性味]味甘,苦;性平;有小毒。[功效]活血化瘀,软坚散结。 Pukuizi is the seed
自1954年美国BELL实验室研制出世界上第一块效率约为6%的太阳能电池以来[1],太阳能电池研究和应用已经取得长足进展,从第一代硅太阳能电池到第二代薄膜太阳能电池[2]到再到第
开展大学生法治教育是建设社会主义法治国家的必然要求。当前,高校大学生法治教育,受客观环境和主观因素的影响。因而,应以问题为导向,端正大学生权利义务观念、增强大学生法
<正> 敷脐疗法是把药物制成适当的剂型,如药粉或药膏,敷在肚脐上,外用纱布、胶布固定以治疗疾病的一种方法,简称“脐疗”。此法属于外治法中敷贴法范畴,历代医家对其治病有独
应用纸层析—分光光度计法对发酵液中L-谷氨酰胺进行了定性分析和定量测定,确立了L-谷氨酰胺定量测定条件。研究结果表明,该法对测定L-谷氨酰胺含量具有较高的准确度和精密度