面向可重构结构的CNN算法行为分析与编译优化技术研究

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:zlmgwj006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能技术的快速发展,对我国经济向高端制造业和高科技领域转型起到了重大推动作用。然而,诸如卷积神经网络(Convolutional Neural Networks,CNN)等人工智能领域典型算法越来越呈现出计算密集性和访存密集性等高密集特性,给计算芯片处理能力带来巨大挑战。可重构结构同时具有通用处理器的高灵活性和专用硬件的高能效,成为应对高密集型应用处理的有效手段。但是,可重构处理器目前仍然面临编程难度大、可重构结构优势难以充分发挥等“编程墙”问题。因此,本文基于可重构结构下CNN算法的行为分析,提出一种面向可重构结构的领域专用高效编译优化方法。(1)为挖掘CNN算法中的并行信息,深入分析基于可重构结构的CNN算法行为模式。首先,使用底层虚拟机(Low Level Virtual Machine,LLVM)编译工具分析CNN算法结构信息。然后,借助算法结构信息,构建多面体模型来描述CNN算法的软件特征。最后,结合可重构结构硬件特性,构建可重构结构下CNN算法的特征向量。实验结果表明,基于4和16个处理单元(Processing Element,PE)的阵列,依据行为分析获取特征划分的CNN算法能达到传统划分加速比的99.31%和99.61%,基于CNN算法的行为模式分析可以有效挖掘其并行信息。(2)针对可重构结构下线程划分方法需要利用专家经验,且划分策略处理单一的问题,提出一种基于并行知识的线程划分方法。首先,使用可重构结构下CNN算法的特征向量,针对专家调优划分的最优程序构建程序样本集。然后,通过支持向量机学习其中蕴含的并行知识,包括程序能否并行、最大支持划分的PE数目、最大划分数目下PE的映射范围等。最后,利用并行知识指导可重构结构下CNN算法的并行划分。实验结果表明,采用4和16个PE,使用基于并行知识的线程划分方法,CNN算法加速比的均值分别是1.27和4.65,基于并行知识的线程划分方法能有效实现将CNN算法并行划分。(3)针对线程划分过程中未充分考虑数据局部性导致并行效率较低问题,提出一种基于模糊聚类的线程组合优化方法。首先,基于可重构结构下算法映射方案,构建组合优化性能评估函数。然后,采用k-means的聚类方法将性能评估函数作为聚类条件,将已有线程根据硬件资源进行聚类。最后,分析聚类后的线程之间的数据依赖关系,调整线程的映射范围,减少数据在PE之间的移动次数。实验结果表明,采用4和16个PE,与线程划分方法相比,线程组合优化方法加速比分别提升35.25%和35.62%,基于模糊聚类的线程组合优化方法能够提升CNN算法的并行效率。(4)针对可重构结构处理器面临编程困难问题,设计并实现一种自动化编译方法。首先,将PE按功能划分为数据提取、数据分配、数据汇总、数据处理。其中数据提取、分配和汇总由特定PE完成。通过计算模式-汇编指令组的映射规则实现数据处理。然后,分析CNN算法的计算过程,提取计算模式。最后。根据计算模式设计高效的汇编指令组,以实现自动化编译。实验结果表明,自动化编译方法能够达到人工划分下CNN算法执行时间的52.32%,自动化编译方法能实现高级语言到汇编指令的转换,降低可重构下CNN算法的编程难度。在LLVM9.0编译器和基于BEE4开发平台设计的可重构阵列处理器上,本文对提出的编译优化方法进行实现。实验结果表明,面向可重构结构的领域专用高效编译优化方法,能将高级语言转化为可重构阵列处理器支持的汇编指令,与LLVM和OpenMP并行编程工具在16个PE上处理Lnet-5网络进行比较,加速比分别提升了 2.84%和3.63%。综上,本文提出面向可重构结构的领域专用高效编译优化方法,为探索编译系统和可重构结构协同的高效能、自动化推测并行技术提供了新渠道,并为提高计算、数据密集型应用在可重构结构下的并行性能提供了新思路。
其他文献
机械法掘进地下工程遇到硬岩段时,刀具和设备磨损严重、掘进效率显著降低,采用微波辅助破岩技术对开挖硬岩进行一定程度的处理,可大大提高掘进速度和效率。影响微波辅助破岩效果的因素众多,如岩石矿物颗粒形态、含量、粒径、特性和微波照射方式等。根据当前的认识,矿物形状作为岩石重要特征之一,对微波辅助破岩效果有着重要影响。本文开展岩石矿物颗粒形状对微波辅助破岩影响规律和效果的研究,分析岩石矿物颗粒主要形状特征及
随着煤气化技术作为一种高效环保的煤洁净技术的广泛应用,其伴生固体废弃物(煤气化渣)给当地环境造成了巨大压力。因此,如何有效的处理煤气化渣是当地政府和企业亟待解决的问题。矿山充填作为一种固废管理的有效方式被推广应用,但充填高成本问题是阻碍其广泛应用的主要因素。目前,使用廉价固废替代高成本胶凝材料,将其资源化利用于矿山充填,以降低充填成本,已然成为一种不可阻挡的趋势。本论文运用室内试验与理论分析相结合
由于沥青路面本身存在不平整度和裂缝等缺陷,在车辆荷载作用下,造成沥青路面的疲劳寿命降低。本文考虑路面不平整度引起的车路耦合动荷载效应,运用有限元方法对平整不含裂缝、不平整不含裂缝和不平整且含裂缝三种沥青路面结构进行动力响应计算分析。在此基础上利用疲劳寿命预估公式,预测沥青路面的疲劳寿命,分析路面结构设计参数和车辆轴载对疲劳寿命的影响。主要研究内容及结论如下:(1)将车辆简化为二自由度四分之一车辆振
随着世界经济的高速发展,深部岩体工程的开发与利用已经成为地下工程领域研究的重要课题之一。由于深埋岩体工程赋存于典型的“三高一时一扰动”复杂力学环境中,其围岩在多种因素的共同作用下具有显著的流变特征,表现为围岩变形在施作初期支护一段时间后才趋于稳定。因此,研究支护条件下深埋洞室围岩的稳定性及其支护参数优化对确保深埋岩体工程安全施工具有极其重要的现实意义。本文在总结分析国内外研究成果的基础上,以预应力
随着社会经济的不断发展,所需要的能源消耗也越发增加,煤炭资源作为重要的社会资源消耗之一,其开采的安全性和有效性越来越受到关注,在开采过程中能够及时得到煤层中物质信息可以有效的提高开采的安全性和有效性。探地雷达具有较好的穿透性和较快的探测速度,被广泛的用于井下煤层探测。传统的冲激脉冲雷达和单站时间步进频连续波雷达在煤层异质体探测中存在空间分辨率差、时间利用率低的问题,而多输入多输出的空间步进频雷达在
我国西部煤炭基地地处干旱-半干旱地区,水资源匮乏,生态环境十分脆弱。随着西部煤炭基地高产高效开采技术的普及,煤层覆岩表现出新的破坏演化规律。采煤对含水层结构破坏和生态环境影响日益突出。因此,开展煤炭开采过程中覆岩应力场、裂隙场以及渗流场的发育规律研究,对我国西部生态脆弱矿区的煤炭安全、绿色、高效开采具有重要意义。本文以榆神矿区金鸡滩井田首采工作面为研究对象,通过收集整理文献资料,分析了研究区地质环
西安是一个地裂缝十分发育的城市,城市地下综合管廊工程是典型的线性工程。在西安修建综合管廊不可避免的要穿越地裂缝,管廊结构在建设和运营过程中将长期受到地裂缝错动的影响。地裂缝错动下,管廊结构会产生张拉-挤压、张拉-扭剪、剪断等破坏形式及底部出现脱空现象,其中管廊结构底部脱空常伴随其它破坏形式共同发生,是引起管廊结构产生破坏的重要因素。因此,开展管廊结构底部脱空及其受力性能的研究尤为重要。本文以西安某
交通流预测问题主要通过考虑交通流量的历史时间序列特征预测当前目标节点在未来一段时间的交通流量信息。作为智能交通领域的研究热点,对于交通疏导和路径规划等具有重要意义。针对已有的交通网络时空信息特征分析和建模方式的不足,如路网拓扑结构的构建方式不合理、数据特征信息存在单一性,导致不能有效提取城市路网动态的空间依赖关系、挖掘出潜在的交通模式等问题,提出一种基于预测能力得分(Predictive Powe
方管结构在建筑、机械、电力、化工等领域中应用广泛,在国民经济和社会发展方面发挥着巨大作用。方管结构在服役过程中,受载荷和环境等因素影响,极易产生疲劳裂纹和腐蚀等缺陷,及时进行缺陷检测,对预防事故的发生具有重要意义。目前方管结构检测主要采用传统超声的方法,存在检测效率低下的问题。因此,研究高效的方管结构缺陷检测方法,及时准确地判断和识别方管结构的缺陷尤为必要。本文提出利用超声导波的方法对方管结构进行
外周血液中的白细胞检测对于诊治许多疾病有着重要价值。目前,临床上多釆用血细胞分析仪与人工镜检的方式对白细胞进行分类检测。但这种方式效率较低,受镜检人员主观感受影响较大。随着医学影像处理技术的发展,利用图像处理方法对白细胞进行自动分类识别的技术具有较高的实用价值。因此本文提出了一种基于卷积神经网络的白细胞分类识别方法。首先针对白细胞图像采集中染色方式不同及硬件设备影响,出现干扰白细胞图像精确分割的灰