嵌入式平台语音识别技术的研究

被引量 : 0次 | 上传用户:cainubaijiazi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,在嵌入式平台,像手机、平板、穿戴数码、汽车电子等,语音识别方案受嵌入式设备计算速度和存储能力的限制,大多选用云语音识别方案,例如Google云语音识别、科大讯飞云语音识别等,而云语音识别效果又与嵌入式平台网络状况以及云语音识别服务器计算能力相关。因此,针对嵌入式平台来说,基于云的语音识别方案存在识别延时大、识别结果情景相关性不强的问题。本论文主要工作是研究适合嵌入式平台的语音识别方案,达到高精度、快速度的语音识别效果,并具备一定的口音抗拒能力,满足嵌入式平台语音识别的应用需求。论文针对嵌入式平台语音识别面临的4个核心问题(计算能力、词汇量、识别速度、说话者口音),从现有的3种语音识别解决方案(专用语音识别芯片级、语音识别开发平台级、云语音识别级)着手,提出了基于专用语音芯片的本地语音识别和云语音识别辅助的混合语音识别方案。论文分别研究了嵌入式平台下,基于LD3320的本地语音识别方案和基于Google的云语音识别方案的性能。测试结果表明:单纯基于LD3320的本地语音识别平均识别准确率为87.2%,但识别指令个数不能超过50,而单纯基于Google的云语音识别准确率受说话者口音及语音词汇频度影响很大,而且识别延时不稳定且依赖网络状况。WIFI网络状况下识别延时0.3s~3s,而手机2G网下延时4s~14s不等。针对嵌入式平台本地语音识别和云语音识别的特点,提出利用“动态多场景切换”机制解决识别指令个数限制,利用“近音映射”机制解决说话者口音问题,组建以基于LD3320的本地语音识别为主、Google云语音识别为辅的混合语音识别系统。最后,通过智能安防机器人平台测试,验证了混合语音识别方案的可行性以及语音识别效果的鲁棒性。测试结果显示:该混合语音识别系统较单纯基于LD3320芯片的语音识别方案性能要好,识别率从87.2%提高到95.8%。
其他文献
在多种民族乐器中,二胡作为众多传统乐器中的一种,其作为中国传统民族乐器的典型代表,有它本身独特的韵味。其中,在弦乐乐器的多种演奏技法中,快弓作为难度较高的一种演奏技
综合国力日益增强,我国的建筑设备、建筑材料和建筑技术均获得了很好的发展,在公路建设当中,沥青混合料温拌技术越来越普及,该技术在操作性、减排、降耗方面的优势较为明显。
本文从工作自主性出发,探索了个体层面上工作自主性对员工创造力的影响机制,探索由工作自主性到员工创造力的中介传导变量。由员工的心理角度分析,将内部工作动机作为工作自主性
<正>投资要理性,无论是哪个级别的资产配置,都要以自我认知为前提,对所投产品有充分的了解。又到了年终奖发放季,大家在翘首以盼资金到账的同时,是不是也该用心考虑一下新年
<正>一、自组织的涵义自组织系统理论是20世纪60年代末期开始建立并发展起来的一种系统理论。它研究的对象主要是自组织系统(生命系统、社会系统)的形成和发展机制问题,亦即
<正> 随着质量技术监督管理体制改革的逐步到位,为适应当前和今后质量技术监督工作的需要,组织开展职业培训教育活动,提高行政执法人员的素质,已成为各级质量技术监督部门的
分级阅读兴起于西方,由儿童出版界引入我国。它致力于阅读能力和文本难度的匹配,体现了"以儿童的认知能力为中心"的西方教育理论的精髓。我国当下儿童汉语分级阅读研究存在着
目的分析小脑发育不良性神经节细胞瘤的M RI及MRS表现,提高对其认识。资料与方法回顾性分析6例经手术及病理证实小脑发育不良性神经节细胞瘤的M RI以及M RS表现,并结合文献复
梳理了智能终端、移动卫星通信、汽车电子以及焊机等多种设备对元器件小型化的需求,简要分析了光器件、小型天线,以及封装、无源集成等技术融合中元器件小型化的发展趋势与技
改革开放以来,中国大陆成为台湾最大的贸易伙伴。随着世界经济环境的变化,闽台之间的贸易发展势头越来越迅猛,交流合作更加密切。在此背景下,为更好地促进台商企业及海峡西岸地区