【摘 要】
:
针对循环神经网络的算法性能受带宽限制问题,设计了基于HBM存储器的循环神经网络加速SoC,可通用的支持RNN及其变体的推理过程.首先比较RNN及其变体结构,分析算法计算需求和存储带宽需求.然后,提出基于HBM的高带宽加速器设计,将其部署在VCU128开发板上.最后采用Roofline模型分析方法,提高带宽和计算密度,测试DeepSpeech2和GNMT算法的推理平均性能分别为61.74 GFLOPs/sec,20 GFLOPs/sec.对比基于DDR存储器的设计,性能提高3.68倍.对比其他基于FPGA循
【基金项目】
:
国家重点研发计划(2016YFA0201804)。
论文部分内容阅读
针对循环神经网络的算法性能受带宽限制问题,设计了基于HBM存储器的循环神经网络加速SoC,可通用的支持RNN及其变体的推理过程.首先比较RNN及其变体结构,分析算法计算需求和存储带宽需求.然后,提出基于HBM的高带宽加速器设计,将其部署在VCU128开发板上.最后采用Roofline模型分析方法,提高带宽和计算密度,测试DeepSpeech2和GNMT算法的推理平均性能分别为61.74 GFLOPs/sec,20 GFLOPs/sec.对比基于DDR存储器的设计,性能提高3.68倍.对比其他基于FPGA循
其他文献
本文主人公祝芳祝芳与幼儿园可爱的孩子们 初衷:第一次到南疆去开展“民族团结一家亲”结对认亲活动,祝芳亲眼目睹了村民的生活状况,作为一名党员、一名帮扶干部,祝芳当时就觉得自己应该在脱贫攻坚工作中为这里的村民做点什么 2016年10月,一场从区级机关到基层干部人人参与的“民族团结一家亲”活动全面铺开,在天山南北扬起高唱民族团结时代凯歌的主旋律。当时祝芳还在休产假,不能参加第一批集体结对认亲活动,但
针对蝴蝶优化算法存在收敛速度慢、寻优精度差和易陷入局部最优等缺陷,提出融合收敛因子和樽海鞘群的蝴蝶优化算法.受灰狼算法和樽海鞘群算法的启发分别将收敛因子融入全局位置和局部位置更新处,提高算法的寻优精度;再结合樽海鞘群领导机制,平衡了算法的全局搜索和局部勘探能力.通过17个基准函数的测试,所有实验结果表明采用综合改进策略的算法在收敛速度、寻优精度和鲁棒性方面具有一定优势.
以攀西地区含钛高炉渣为原料,通过高温处理使高炉渣中钛组分富集于钙钛矿中,并确定了最佳磨矿时间。以硫酸和氢氧化钠为pH调整剂、水玻璃为抑制剂、辛基羟肟酸为捕收剂、乙二胺四乙酸为络合剂进行单因素浮选试验,得到了优化的工艺条件:矿浆pH为5~6,乙二胺四乙酸用量为2000 g/t,辛基羟肟酸用量为112.5 g/t,水玻璃用量为600 g/t。采用1粗3精2扫的开路浮选流程进行试验,获得了TiO 2品位为42.38%、TiO 2回收率为23.99%的钛精矿指标,精矿TiO 2品位较高炉渣原渣TiO 2品位提高了
为了克服传统暗场图像处理误差较大、重复性较差等问题,文章提出一种暗场光谱分析算法.此算法以Matlab为平台,在暗场环境下通过图像膨胀等方法对金纳米粒子进行精确识别并计算亮度,同时考虑光谱标准化、除去污染物杂质等问题,然后重建单粒子散射峰并记录其光谱特性.金纳米棒检测实验结果表明,此算法相较于根据粒子亮度进行二值化处理的传统方法在识别粒子上更加灵活精确,粒子识别率可达91.33%,粒子拟合的准确率
疫情期间正确的佩戴口罩可以有效的防止病毒的传播,针对人员密集场所环境下往往存在复杂的干扰因素会导致对人脸佩戴口罩的检测任务产生影响,现有的基于Faster R-CNN检测算法无法满足复杂环境小目标的口罩佩戴检测,从而提出了一种基于改进Faster R-CNN的口罩佩戴检测算法,将传统的单一RPN网络模型改进使用多任务增强RPN模型以提高检测识别精度,利用改进的Soft-NMS算法删除区域候选网络输
无线传感器网络通常能量有限且容易受到环境干扰,为了提高无线传感器网络的能效并保障数据的可靠性,提出一种基于分簇无线传感网的高能效数据融合算法(EEDFA).EEDFA在分簇结构的网络中运行,数据的采集与传输过程分为多个周期,传感器在周期内的多个时隙采集数据形成数据向量.每个周期传感器将采集到的数据向量进行降维以降低传输负载,同时考虑环境干扰利用区间二型模糊系统生成数据可靠性因子以保障数据的可靠性.各簇头接收来自成员节点的数据进行分布式处理,利用相似度函数去除冗余数据,将融合后的数据发送至下一跳簇头或基站.
女儿聂天翔为在太空上过生日的父亲唱生日祝福歌“捷胜”奇缘,面临离婚 聂海胜于1964年9月出生在湖北枣阳杨垱镇的一个小村庄里,家境贫寒,生活拮据。但从小聂海胜学习就十分刻苦,成绩优异,尤其是数学和体育,总是遥遥领先。 初中毕业后,聂海胜顺利考上了重点高中,当时整个镇上只有两个人考上高中,可惜父母却付不起学费。聂海胜是个很倔强的人,认准的目标一定要达到,父母拿不出钱,他就利用假期去搬木材、装茶叶
数字水印技术被广泛应用于版权保护,为了更好地实现版权保护,增强水印算法的鲁棒性与不可感知性,兼顾几何攻击与非几何攻击的抵抗能力,提出一种基于Shearlet变换和Hu矩的零水印算法.对载体图像进行Shearlet变换和分块离散余弦变换,并分块计算Hu矩以构建特征矩阵,进而构造零水印.构造零水印前使用Kent混沌映射加密,保障了安全性.在仿真实验中对不同纹理的图像进行常见的高强度单一攻击以及组合攻击
为了实现低功耗和实时推理,AIoT设备近年来被应用于深度学习中的多个领域.然而,一些制造工艺导致AIoT设备在推理时会出现软错误.对于具有大量计算的神经网络加速器来说,可能会导致大量的计算误差和巨大的预测精度损失,这对于像自主无人机这样精度敏感的应用来说是无法忍受的.而传统的容错技术(如三重模块化冗余)会带来相当大的功耗和性能损失.本文提出了一种客户端-服务器协同的容错神经网络训练框架.在训练中采用带有软错误的AIoT处理器作为客户端,然后服务器端通过AIoT设备的应用数据学习到计算错误.实验中选取了多个
2021年夏,人社部向社会正式发布的18个新职业中,“酒体设计师”位列其一。这是一个类似文物修缮师的小众职业,年薪高达百万。他们的工作因鲜为人知而显得有些神秘,邵家艳就是其中的佼佼者。如同研制香水一样,她可以为酒设计出前调、中调和后调,使酒的层次感和滋味感更加丰富,香气也更加优雅。市面上的“江记壹号”等,都是由她主导设计的,其中“驴溪老坛·青瓷”,还一举斩获英国国际葡萄酒暨烈酒大赛金奖。被人们誉为