基于卷积神经网络的中文声学模型的识别效率优化与实现

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:gugugou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人工智能(Artificial Intelligence,AI)技术飞速发展,自动语音识别作为一种AI关键技术一直备受关注。如今,随着神经网络研究热潮的兴起,研究人员使用卷积神经网络(Convolution Neural Network,CNN)参与声学模型建模,并解码各个隐马尔科夫模型(Hidden Markov Model)状态的后验概率,形成CNN-HMM声学模型(下文简称CNN声学模型)。相比于传统声学模型,CNN声学模型拥有更好的识别效果,但是当中文CNN声学模型部署在语音识别系统中并连续识别海量音频数据时,基于CPU(中央处理单元)处理器的中文CNN声学模型面临着识别效率低的问题,因此如何提高中文CNN声学模型的识别效率是目前语音识别领域亟需解决的问题之一。本课题基于科大讯飞股份有限公司“基于卷积神经网络的声学模型效率优化”项目。经过分析研究,本文将从以下三个方面优化中文CNN声学模型在CPU处理器上识别解码效率:利用AVX2指令集系统加速声学模型解码速度、给出一种8bit定点优化方案来解决浮点语音数据运算缓慢的问题、优化卷积运算方法提高CNN声学模型卷积运算效率,最后对中文CNN声学模型进行上述三种优化来共同提高识别效率。针对上述优化方案,本文进行了模块测试和系统测试,并分别对比了优化前后的测试结果以验证优化方案的有效性和可行性。模块测试的结果表明,优化后的中文CNN声学模型可明显提升识别效率。同时,本文将优化前后的中文CNN声学模型分别部署到相同的语音识别系统中进行系统识别率和识别效率测试,系统测试的结果表明,使用优化后中文CNN声学模型的语音识别系统的平均识别效率相对提升77.58%,并且优化后语音识别系统平均字识别精确率的下降范围维持在1%以内,符合项目预期指标要求。最后,本文对优化后的语音识别系统进行了连续10多个小时的系统稳定性测试,测试结果表明,部署优化后中文CNN声学模型的语音识别系统能够长时间稳定工作,并且内存占用正常。综上所有测试结果表明,在基本不影响识别率和保证语音识别系统可以稳定运行的前提下,本文针对中文CNN声学模型给出的效率优化方案有效可行。目前,上述优化方案已应用于科大讯飞车载语音识别系统中。
其他文献
目的:通过观察康泰胶囊对家兔胆汁流量的影响及对胆囊炎豚鼠胆囊病理变化的影响,探讨该药对胆囊炎的治疗作用。方法:采用在体引流家兔胆汁,比较前后胆汁流量;采用盐酸林可霉
<正>作为省级射击队,肩负着为国家射击队发掘、培养苗子的重任,由于射击项目本身是一项投资大、消耗大的体育项目,怎样多发掘、培养国家有用之才,而减少人才浪费,下面是我在
文章针对新课程改革争论的焦点问题——客观主义与建构主义教育理论的本质特性进行了简要辨析,并从中西方社会文化心理、教育思想生成机制、传统思维方式三大差异着眼,分析了
<正>在过去的二十年里,射频消融(RFA)受到国际社会的广泛关注,随着技术和产品的进步,经皮射频消融治疗各种器官实体瘤成为可能。RFA在医学领域的应用由来已久。1990年McGahan
目的:研究补肾活血法治疗膝关节骨性关节炎的疗效。方法:选择100例膝关节骨性关节炎患者,随机分为治疗组和对照组,每组各50例,治疗组给予补肾活血汤治疗,对照组给予扶他林片
目的:通过检测PICC置管肿瘤患者血浆中的组织因子(tissue factor,TF)、C-反应蛋白(C-reactive protein,CRP)、炎症因子(IL-1β、IL-6、IL-8),了解TF与CRP、炎症因子对预防PIC
<正>2011年新版《语文课程标准》中关于小学诗歌教学的目标梯度性非常明显:小学低年级要求"背诵优秀诗文",中年级提出"诵读优秀诗文,注意在诵读的过程中体验情感,展开想象,领
2011年版语文课程标准颁布后,随着新课程改革的不断推进,我们可以发现当前小学语文教师在课堂教学中出现的一些干扰行为,比如语言干扰、表演干扰、评价干扰、媒体干扰等等。
城市建设中,高层建筑已经成为提高土地利用率的建设主体,目前房屋建筑工程趋向高层、超高层发展,其结构形式多采用框架(框剪)结构。但因设计和施工疏忽而造成的质量问题也屡见不鲜