【摘 要】
:
近年来,得益于大量的开源训练数据以及学习这些数据的强大的计算能力(GPU的产生及应用),人工智能领域特别是深度学习方向获得了极大的发展。基于LSTM的神经网络是一种循环神经网络,该网络模型在智能认知领域被广泛应用,比如语音识别、图像说明以及自然语言处理等。然而,传统的计算平台如CPU、GPU等无法快速高效地实现LSTM算法,且常常需要对大量的权重进行数据搬运,对片上的存储需求较大,且消耗的功耗也比
【基金项目】
:
“十三五”装备预研共用技术项目——计算资源受限条件下的机器学习技术
论文部分内容阅读
近年来,得益于大量的开源训练数据以及学习这些数据的强大的计算能力(GPU的产生及应用),人工智能领域特别是深度学习方向获得了极大的发展。基于LSTM的神经网络是一种循环神经网络,该网络模型在智能认知领域被广泛应用,比如语音识别、图像说明以及自然语言处理等。然而,传统的计算平台如CPU、GPU等无法快速高效地实现LSTM算法,且常常需要对大量的权重进行数据搬运,对片上的存储需求较大,且消耗的功耗也比较多。因此,需要针对LSTM网络设计一个灵活、快速且低功耗的专用硬件加速器,以满足日益增长的人工智能任务需求。本文根据机型识别和航迹预测这两个人工智能任务的项目需求,基于Xilinx FPGA平台设计了一种可配置的LSTM神经网络加速器。首先,本文对目前主流的基于LSTM的硬件加速器设计进行了详细的调研,并分析比对了其中的创新点以及加速效果。然后,在此基础上详细描述了本文所设计的LSTM网络加速器。一方面,设计了可配置的LSTM控制器单元来满足不同规模的LSTM运算需求;另一方面,针对稀疏量化后的压缩模型,设计了可配置的且对激励进行跳零处理的高性能稀疏矩阵向量乘单元。其次,介绍了基于FPGA验证平台的验证环境以及验证方法,对测试结果进行了详细的说明和分析。测试结果表明,可配置的LSTM硬件加速器在应用于机型识别任务时,可达到2135帧/s的运算速度,应用于航迹预测任务时,可达到15363帧/s的速度,且总功耗仅有6.215W;其中的稀疏矩阵向量乘模块相较于CPU,可达到26.27倍的加速,但功耗仅为CPU的0.16;相较于GPU,达到了 2.27倍的加速,但功耗仅为GPU的0.03;相较于ESE[16](系统时钟为200MHz),在能效比上,本文的能效比是ESE设计的5.5倍。论文最后还针对设计中的不足提出了相应的优化方案,包括数据传输带宽与片上计算单元运算速度不匹配问题的优化,以及利用非线性函数本身的对称性对非线性函数单元做出的优化。
其他文献
随着全球氮磷沉降趋势的加剧,热带地区森林土壤温室气体排放的问题仍是当前研究的热点话题。我国已成为世界三大氮素沉降集中分布区之一,随着社会的迅速发展,氮沉降量还会持续增长。海南岛吊罗山分布有典型的自然环境孕育的丰富的热带森林植被资源,极具研究价值。在此开展模拟氮磷沉降对热带森林土壤CO2和CH4气体通量的影响实验,对于研究热带森林土壤温室气体通量时空变化,完善我国温室气体排放清单,以及揭示森林生态系
目的:高迁移率族蛋白B1(High Mobility Group Box 1,HMGB1)是高迁移率族蛋白家族(High Mobility Group,HMG)中的一类,在哺乳动物中高度表达且是一类高度保守的蛋白质。依据目前研究可知,HMGB1在肿瘤的发生发展以及治疗过程中均有促进及抑制作用,其作用主要取决于在肿瘤细胞中的位置,以及肿瘤微环境的影响。但是,HMGB1在喉癌中的作用及其机制目前尚不清
环氧树脂作为工程材料,普遍用于电工电子、航空航天、机械建筑等领域。同时,该材料的后处理或回收问题受到研究者的极大关注。故此,本研究尝试制备可降解环氧树脂,并研究其结构和性能。(1)星形聚己内酯(s-PCL)是以端羟基环三磷腈衍生物为引发剂,单体己内酯经开环聚合获得。将其添加到环氧前驱体中加热至熔融,再添入适量的胺类固化剂(4,4’-亚甲基双(2-氯苯胺):MOCA或4,4’-二氨基二苯砜:DDS)
机体肠道是有益微生物发挥益生功效的主要靶点,但益生菌进入宿主肠道后与肠道内海量微生物并非和平共处,而是与肠道本地菌群对有限营养物质和肠道生态位进行残酷的竞争,随之衍生的选择压力也会对菌株的遗传稳定性造成影响。因此,对于肠道环境中菌株遗传稳定性的研究既关乎菌株的安全性评价,又直接影响其益生性能的稳定发挥,同时也为更加优秀突变个体及高效定殖株的筛选获得提供了新思路。为阐明肠道选择压力对益生菌遗传稳定性
为明确细胞壁转化酶(Cell wall invertase,CWIN)对灰霉菌抗性及其细胞死亡、水杨酸(Salicylic acid,SA)、茉莉酸(Jasmonic acid,JA)和可溶性糖含量等相关生理生化指标的影响。本试验以CWIN活性上调的转基因番茄(RNAi)与对应的野生型番茄(WT)为试验材料,通过离体接种灰霉菌孢子悬浮液的方法,观察病斑大小,同时对接种后不同时期番茄叶片中过氧化氢(
火龙果植物原产于中美洲热带雨林及沙漠地带,在国内已有一定种植规模。火龙果作为一类新兴水果,具有较高的营养价值和保健价值,愈受消费者喜爱。火龙果作为长日照被子植物,自然花期通常早于市场销量和价格最佳的春节,在11月份后,由于光照时间的不足,影响火龙果成花过程,严重制约了火龙果在冬季的产量,制约了产业的发展。目前,生产上采用补光措施来调节火龙果周年产期,但是缺乏理论支撑,造成了人力、电力等资源的浪费,
木薯(Manihot esculenta Crantz)是重要的热带经济作物和粮食作物之一。木薯采收后2-3内就会发生采后生理性变质并迅速加剧,导致木薯长距离运输和采后综合利用受限,严重制约了木薯产业的可持续发展。为了研究乙烯在木薯采后生理性变质中的作用及其调控机制,本研究探索了外源乙烯利处理对木薯采后生理性变质的调控作用,解析了乙烯信号转导通路中关键组分的互作关系,鉴定出乙烯信号转导途径中转录因
植被在全球水循环和碳循环中扮演着重要的角色,而气候变化直接影响了植被的空间格局分布与植被生长速率。研究植被动态,阐述其与温度和降水的关系,可以更好地理解植被在生物圈-大气圈交互作用下的动态过程,同时也在预测未来气候变化的植被响应中起到重要作用。传统的植被-气候研究受限于数据时空分辨率,多针对区域性的或单一植被类型进行短时段的研究。目前的遥感技术有助于发现长时间序列下的全球尺度的植被动态,区分全球不
2019年全国高职院校实施扩招,扩招人数为100万人。党中央、国务院高度重视高职扩招工作,2019年4月30日,国务院常务会议一致通过了《高职扩招专项工作实施方案》,届时高职毕业生人数会成倍的增加,就业形势会越来越严峻,就业质量更得不到保证,本文以缓解贵州高职学生就业压力,提升就业质量为导向,探究哪些因素会对贵州高职毕业生就业产生影响,对于加强贵州高职院校对学生的教育、就业指导等各项工作都会产生积