基于FPGA的本地语音识别研究与实现

来源 :成都理工大学 | 被引量 : 1次 | 上传用户:XX200003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别作为人工智能重要分支,在通信、工业等多个领域备受关注。目前语音识别设备广泛采用语音芯片集成的方式,但是大多数设备必须联网使用,限制了设备使用场地。因此,基于本地语音识别芯片的研究逐渐受到重视。在语音识别芯片设计中,FPGA以其强大的性能,丰富的硬件资源和现场可编程等优势受到了设计者的青睐。但是现在的研究大多集中在如何使用FPGA对深度学习算法加速,或者实现深度学习算法,对涉及本地语音识别整体实现的研究还不多。针对这一问题,本课题研究在FPGA上实现本地语音识别功能。使用基于全局平均池化层的卷积神经网络算法,并提出了简化Softmax层的算法,在保证识别效果的同时以减少FPGA的资源消耗。采用流水线加并行的处理方法加快语音识别速度。本课题研究工作主要包括以下方面。第一,研究了国内外人工智能语音识别技术发展现状和最新成果。在对现有大多数语音识别设备存在的不足进行分析后,提出了利用FPGA实现语音识别的预处理、特征提取、模式匹配等以解决离线语音识别芯片中相关问题的设计方案。第二,利用FPGA实现本地语音识别系统的硬件搭建。进行了总线架构以及各部分组件之间的数据通信电路设计,系统包括电源模块、FPGA核心模块、INA217放大模块、AD73311数模转换模块、AT24C02存储模块、RS232接口与JTAG接口模块。第三,卷积神经网络模型搭建与识别率对比。本课题搭建了三种神经网络模型,一种是传统的卷积神经网络,一种是基于全局平均池化的卷积神经网络,一种是本课题对Softmax层算法简化后的基于全局平均池化的卷积神经网络。对三种模型的识别率进行对比,数据表明三种算法在识别率上差距很小。第四,利用Vivado集成开发环境进行RTL级代码设计,实现了语音识别的预处理、特征提取与模式匹配。将外设模块通信协议与AMBA总线协议相结合。提出了采用流水线加并行的处理方法来加快运算速度,在卷积过程中使用行运算的方法来进行实时处理,并对三种卷积神经网络算法的FPGA资源用量进行对比,数据表明本文提出的算法能够大幅降低FPGA资源用量,加快语音识别速度。第五,在Modelsim下搭建UVM验证环境对AMBA_UART、AMBA_IIC、AMBA_SPI、单个卷积核以及单个全局平均池化模块进行单独仿真。对整体系统进行测试,结果表明系统达到了80%以上的识别准确率。本课题使用FPGA完成了本地语音识别系统,具有快速,离线,资源占用较少的特点对本地语音识别芯片的设计有一定的参考价值。
其他文献
目的:通过使用生肌象皮膏换药,观察其对于肛周脓肿术后创面愈合的临床疗效。方法:随机选择2019年3月至2020年3月在天津中医药大学第一附属医院肛肠科住院行肛周脓肿手术治疗的患者,将符合诊断纳入标准的患者通过随机数字表随机分配为治疗组与对照组,每组30人,共60例。两组均采用相同术前检查、术前准备、手术方式、术后常规用药及护理,治疗组术后换药采用生肌膏纱条敷药,对照组术后换药采用碘伏纱条敷药,每日
第一部分特发性黄斑前膜术后视力的影响相因素分析及预后评估目的:分析特发性黄斑前膜术后视力的影响因素及预后评估。方法:将2015年1月至2019年1月期间在本院眼科行23G玻璃体切除术和内界膜剥除联合超声乳化白内障吸除及人工晶状体植入术的IERM患者47例(47眼)纳入研究。术后随访超过6个月,观察患者手术前后BCVA、CFT、EZ完整性、EIFL分级、EIFL厚度及外核层厚度,按照术后BCVA分为
图像是人类获取信息的重要途径之一,也是人类认识客观世界的重要载体。但是图像在获取、编码、传输及存储的过程中会受到各种电子器件的噪声污染及环境的影响,导致图像出现退化的问题。因此,需要对图像进行去噪处理,为后续的图像分割、识别等操作带来方便。在水下进行图像采集时,由于水体对光线具有吸收和散射的作用及水体中含有的各种微粒悬浮物,使得水下成像会发生严重退化,水下图像偏绿色或蓝色,出现色彩失真,同时也会出
出租车作为城市交通系统中的重要运载工具,因其覆盖范围广,速度快,舒适和安全的特点而受到越来越多出行者的青睐。随着人们社会活动的丰富以及大数据、物联网与精密定位技术的发展,在出租车运营过程中获得数量巨大且优质的出租车载客数据,这些数据不仅是出租车运营中载客的相关记录,还蕴藏着城市居民出行规律、城市结构及其他社会问题。通过各种数据分析与挖掘手段对出租车载客数据进行深入探究,对于智能交通、城市规划、出租
目的通过病例对照研究方法分析和探讨引起甲状腺结节的相关危险因素及现代中医病因,为甲状腺结节的预防和治疗提供理论依据,为医护人员对患者进行卫生指导与临床护理提供实践依据。方法选取2019年3月1 日~2019年12月31日期间北京中医药大学东直门医院内分泌科门诊病人、体检科人群和北京中医药大学国医堂中医门诊部病人为调查对象。根据制定的纳入、排除和剔除标准,选取200例患有甲状腺结节的患者为病例组,按
约旦首都安曼是约旦及其周边地区的主要政治,经济,社会和文化中心。该市面临着与周边国家不稳定的政治局势有关的众多人口挑战。安曼的区域和当地移民离开家园到首都寻找更好的生活。这导致了随机和独一的人口分布。与其他地区相比,某些地区人口众多,基础设施和服务的压力更大。政府致力于根据100城市抗灾力框架(CRF)解决这一挑战。2014年12月,安曼以成员身份加入了该组织,致力于实现以下四个目标:卫生与福利,
有吉佐和子是日本现代著名的女性作家,她一生创作了大量优秀作品,曾获得日本女性文学奖、艺术节文部大臣奖等多个奖项,在日本文学史上留下了不可磨灭的足迹。有吉有着很深的中国情结,她深受父亲的影响,自幼喜爱中国文化,曾七次访问中国,受到周恩来总理的接见,亲身体验了人民公社的生活,发表了有关中国的报告文学。她创作了《墨》、《崔敏壳》、《落阳》、《孟姜女考》、《有吉佐和子的中国报告》等中国题材作品,这些作品不
当前,为鼓励见义勇为、匡扶社会正义,我国民事立法中新增了“好人条款”。在紧急情势下,自愿、主动地去帮助他人摆脱危险本是受道德调整的行为,但当前将其纳入法律调整的范围,对救助人予以倾向性的保护,免除救助的后顾之忧,一定程度上能实现鼓励救助的价值目标,然而,绝对免责的规定是否合理尚需论证。本文基于我国当前的立法和司法现状,通过分析紧急救助行为的法律性质,借鉴国外的立法经验,对我国紧急救助免责提出一些完
本文致力于分析华为在乌克兰智能手机市场的营销策略。论文介绍了营销策略形成的理论基础,讨论了定义“营销策略”概念的各种方法和形成企业的营销战略的必要性,这在使企业适应市场条件下不断变化的外部和内部环境方面发挥着重要作用。本文分析了营销策略的类型及其形成原则。本文对全球智能手机市场进行了研究:分析了全球智能手机市场的数据,揭示了全球智能手机市场的主要趋势和趋势。对华为手机在乌克兰的营销策略进行了 PE
改革开放三十多年以来,非公有制经济已经成为我国社会主义经济的重要组成部分,并将发挥越来越重要的作用。在其经济占比越来越大、从业人员越来越多的情况下,如何加强党在这