基于FPGA的多核卷积神经网络加速器调度策略研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:whfork
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经网络相关的研究是计算机研究领域的热点问题,分析这一领域的发展脉络,我们不难发现神经网络模型的计算量在不断地攀升。随着移动计算设备的发展,神经网络的推理正在越来越多的发生在边缘计算的场景中,但是网络层数越来越深的模型依然对嵌入式计算设备的功耗和任务地实时性提出了严峻的挑战。在这种背景下,神经网络加速器相关的研究在快速地推进,基于FPGA的加速器相比于传统的GPU具有更好的能效比。得益于FPGA的可编程性,基于FPGA的加速器可以快速迭代以适应快速发展的神经网络模型。基于FPGA的神经网络加速器主要有两种类型,一种是为确定的神经网络模型进行硬件加速器的设计空间探索。另一种是基于指令驱动的通用神经网络加速器,这种加速器的硬件结构的是相对固定的,依靠神经网络编译阶段的自动探索生成指令序列,加速器执行指令完成各种神经网络的推理任务。通用神经网络加速器在实际应用中更容易得到推广,它更能够灵活地适应任务的变化。因此有很多研究围绕优化通用神经网络加速器的性能展开,提升性能的最直接的方式是设计更高效的计算单元和探索更优的神经网络编译方案。本文对一种基于FPGA的神经网络加速器的单核性能和多核并行执行的性能表现进行了细致的分析。基于性能分析,本文提出了两种多核卷积神经网络加速器执行策略,这两种执行策略缓解了多核神经网络加速器面临的访存延迟和计算能力利用率低的问题,即使不依靠计算设备的进步和编译工具链的优化,通过合理的任务调度也可以在现有的软件和硬件平台上提升任务的处理效率,同时本文的研究也会为计算设备和编译工具链的改进带来启发。本文使用XILINXDPU(Deeplearning Processing Unit,深度学习处理单元)IP核作为研究对象,在以模型结点为单位的尺度上分析其单核性能表现,并且总结了模型结点的计算量和访存数据量与执行时间的相关性以及不同模型结点在不同配置的DPU核心上计算能力利用率的变化规律。本文还对DPU的多核并行执行的性能进行了分析,主要研究了多核心并行执行面临的访存延迟效应。利用性能分析过程中收集的大量数据,构建了一种基于机器学习的模型结点执行时间预测模型。本文提出了缓解访存延迟效应的高访存带宽错峰执行策略和提高计算能力利用率的异构多核分段流水线执行策略。实验结果表明,执行时间预测模型的误差为3.64%,高访存带宽错峰执行策略能够带来5.79%的性能提升,异构多核分段流水线执行策略能够带来13.5%的性能提升。
其他文献
高性能材料产业是江苏省镇江市“十四五”重点发展的八条产业链之一,也是新材料产业集群中唯一的重点产业链。目前,镇江市亟需通过产业专利导航分析明晰产业发展及转型升级的合理方向。本文基于IncoPat专利数据库,对专利包含的技术、法律和市场等信息进行深度分析,综合产业布局热点方向、产业增长热点方向、头部企业研发布局方向、核心专利技术分布方向、协同创新热点方向、专利转让热点方向、专利诉讼热点方向,厘清高性
期刊
第一部分我院老年溃疡性结肠炎的临床特点研究目的目前各年龄组的溃疡性结肠炎(Ulcerative colitis,UC)患者的发病人数正在逐年增加,通过对我院不同年龄段UC患者的临床特征进行对比分析,并针对发生上皮内瘤变的个体进行探索,寻找影响其发生的独立的危险因素。研究方法选取2011年4月至2021年12月于山东大学第二医院消化内科就诊,确诊为UC并且接受住院治疗的患者,进行回顾性调查分析。以6
学位
目前,化学防治仍是果园病虫害防治的主要技术手段,传统的大容量连续式喷雾,无视靶标及个体差异,造成果树空隙间的无效喷药及靶标内农药沉积严重,导致农药的大量流失、浪费、残余及环境的污染,影响果品品质。针对上述问题,对果园变量喷雾关键技术进行了研究,以提高农药利用率,实现农药减量增效,提高果品品质。主要研究内容如下:(1)设计了果园变量喷雾试验台,主要由变量喷雾系统、风送系统及控制系统等组成。对关键部件
学位
我国是世界上公认蚕桑的起源国和传播国。蚕茧是我国的国计民生的重要组成部分,在多个领域内具有广泛的应用。桑蚕产业是我国的传统产业,具有巨大且相对十分完备的生产体系。制种是蚕业生产的基础,也是蚕茧丰收的保证。在制种生产过程中,切削蚕茧对蚕蛹进行检测可以减少病原物通过蚕蛹相互接触交叉感染,减少蛹的死亡,提高制种效益。目前蚕茧切削工作主要依靠手工操作来完成。切削蚕茧不仅劳动强度大、工作效率低,还经常在切削
学位
我国蚕丝业历史悠久,是世界上最大的茧丝绸生产国和出口国。据统计,2016年全国有近800万农民从事栽桑养蚕,年产茧量约80万吨,占世界总产量的75%以上。但我国蚕桑产业机械化水平低、蚕桑生产技术研究落后,致使我国蚕桑产业大而不强。解决这些问题的根本出路就是实现蚕桑产业机械化,用先进的科学技术去引导蚕桑产业升级。蚕桑产业机械化可以有效提高生产效率,降低生产成本,增加经济效益。采茧是蚕桑产业中重要的环
学位
从我国当前粮食仓储技术发展实际出发,发现粮食仓储技术日益向智能化、绿色化、优质化方向发展。尤其是在“碳中和”发展的背景下,绿色储粮技术的发展对于促进粮食仓储技术发展,保障粮食安全具有重要意义。本文在系统介绍绿色储粮技术特点、要求的基础上,结合当前我国绿色储粮技术发展的现状,针对性地提出了绿色储粮技术的优化举措,以期为促进我国绿色仓储技术发展,促进粮食仓储绿色生态化提供经验借鉴。
期刊
<正>随着自动识别与数据采集行业的持续发展和商业应用的成熟,我国自动识别与数据采集行业的应用领域不断扩大,特别是在经济全球化趋势的背景下,自动识别技术被广泛应用于物流信息化、企业供应链和社会信息化管理等快速发展的众多领域,为我国整体信息化建设水平的提高、产品质量追溯等发挥了重要作用。
期刊
玉米作为我国三大粮食作物之一,种植面积大,秸秆资源丰富,但秸秆资源在利用过程中存在还田量过大,饲料采食率低等问题,需要对秸秆分段利用,即上部玉米秸秆粉碎收集,下部玉米秸秆粉碎还田。这种秸秆综合利用模式的关键是将秸秆切碎,对玉米秸秆分段切碎的关键部件进行研究。研究内容如下:(1)秸秆机械化利用现状的探究。秸秆还田量过大会造成下季作物的烧苗等问题,秸秆的粉碎效果差使得下季作物种子无法扎根,根据国内外玉
学位
我国蚕桑行业具有悠久的发展历史,特别是在“一带一路”战略提出的背景下,我国的蚕桑行业迎来了新的发展机遇。但是,我国蚕桑行业目前面临的困境是机械化水平低,劳动力价格不断增加。因此,降低劳动强度,提高劳动工效对我国现代蚕桑产业的发展具有重要意义。在对嫁接桑栽培模式的调研和阅读相关参考文献的基础下,进行了嫁接桑桑条剪切试验,仿真了圆盘锯切割桑条的过程,设计了一种自走式嫁接桑收获机。该机既可以实现嫁接桑的
学位
表情信息能传达出一个人的情绪状态、行动意图,是日常交流的主要方式。随着人工智能以及大数据时代的来临,人脸表情识别成为模式识别、机器视觉等领域的热点研究课题。人脸表情是人类彼此交流沟通的一种独特方式,赋予机器人感知面部表情的能力是实现智能人机交互的关键技术之一。随着GPU、存储器等计算机软硬件技术的发展,使人脸表情识别技术应用更加广泛,但这也对人脸表情识别技术提出了更高的要求。传统的人脸表情识别方法
学位