【摘 要】
:
线程级推测(Thread-Level Speculation,TLS)允许存在大量数据依赖的程序通过预先预测依赖值的方式激进地并行执行程序,获得并行收益。作为推测执行的核心部分,执行模型的高效设计对程序加速比性能的提升至关重要。然而,现存的TLS执行模型误推测率高,并行度低,同时执行过程中会引入过多开销,抵消掉并行性能。为解决上述问题,本文从程序特征分析与提取、串行程序自动推测并行转化和推测执行模
【基金项目】
:
国家自然科学基金青年项目,61602388,基于线程级推测的非规则算法并行化研; 陕西省自然科学基金面上项目,2017JM6059,面向循环结构的基于机器学习推测多线程划分方法研究;
论文部分内容阅读
线程级推测(Thread-Level Speculation,TLS)允许存在大量数据依赖的程序通过预先预测依赖值的方式激进地并行执行程序,获得并行收益。作为推测执行的核心部分,执行模型的高效设计对程序加速比性能的提升至关重要。然而,现存的TLS执行模型误推测率高,并行度低,同时执行过程中会引入过多开销,抵消掉并行性能。为解决上述问题,本文从程序特征分析与提取、串行程序自动推测并行转化和推测执行模型设计三个方面展开研究。本文的主要工作总结如下:(1)提出一种静态和动态技术相结合的程序特征分析方法。程序由于内部依赖关系使得推测并行化变得尤为困难,准确地分析和提取程序特征对指导线程划分、线程调度乃至推测并行版本代码生成有着至关重要的作用。为此,本文基于LLVM编译器,使用静态剖析技术剖析基本块的行为特征,分析基本块之间的控制关系和调用关系,构建控制流图和调用关系图,计算基本块频率和分支概率,通过插桩运行的动态剖析技术获取程序运行时的平均迭代数、调用次数和运行指令数信息,获取程序运行时动态信息,为程序自动推测并行提供了分析依据。(2)提出一种基于LLVM编译器的串行程序自动推测并行转化方法。传统方法在程序自动推测并行时需要编程人员手工将推测语句插入到串行程序中,对编程人员要求较高,会花费大量的时间和精力。为克服这一弊端,本文在程序特征分析与提取的基础之上,通过扩充LLVM的指令库和函数库,以支持推测并行。使用LLVM编译器的前端工具Clang完成串行程序到串行中间语言(Intermediate Representation,IR)的转化任务,利用自定义推测并行转化pass实现串行版本IR到推测并行版本IR的转化,为串行程序推测并行提供了理论基础。(3)设计了一种基于LLVM编译器的纯软件的推测执行模型。目前的推测执行模型存在高误推测率,开销较大,结合最后使用值和步长预测两种预测方法,本文使用混合的值预测方法进一步提高值预测的精度,降低推测并行的回滚率。设计自适应的Fork模型,根据程序特征和使用代价收益评估策略妥善划分线程任务,充分提取程序性,激发并行潜力。采用高效的内存管理策略,将推测线程状态与非推测线程状态分别存储,加速推测线程和主线程之间的通信过程,减少空间开销加速验证过程,为线程级推测机制设计了有效执行模型。本文基于LLVM编译框架实现了推测多线程执行模型,采用8核处理器的ubuntu系统。实验使用计算密集型和内存密集型共6个程序进行测试,实验结果显示该执行模型能够取得最大为3.76倍的加速比,平均加速比为2.59倍,相比现有的TLS执行模型,取得了平均9%的加速比提升率,同时非推测线程的平均执行效率为94.63%,相比传统的Fork模型,自适应的Fork模型能够带来平均4%的性能提升。实验结果表明基于LLVM的推测执行模型能够充分挖掘程序并行性,有效提高程序的加速比性能。
其他文献
随着奶山羊规模化养殖的推进,对羊场的精准监控及高效管理已成为亟待解决的问题。通过对羊场图像的语义分割,观察羊场环境和奶山羊的姿势与位置,可以实时监控奶山羊的行为状态,及时发现奶山羊的健康问题。本文以西北农林科技大学畜牧教学试验基地的奶山羊场图像为研究对象,构建羊场图像语义分割数据集,改进DeepLabV3+的解码网络,并优化ASPP结构,结合通道注意力机制,利用提取的图像特征,实现了羊场图像的语义
三维扫描技术可以扫描获取空间物体的外部结构特征,对于结构形状较为复杂的物体,三维扫描技术可以节省大量人力物力。当前绝大多数的三维扫描设备是分别获得部分点云数据,然后通过点云配准得到物体的完整数据。这样的应用过程没有解决动态扫描问题,不仅使得其应用场景受到极大限制,而且后期配准的时间消耗与精度损失影响了其易用性。为了解决传统双目视觉三维扫描技术需进行多次扫描,然后再进行配准的问题,提出基于光学跟踪的
目标跟踪技术是计算机视觉领域研究的基础任务,其在视频监控、牲畜养殖管理及动物研究与保护等方面均有广泛的应用。随着深度学习技术的发展,目标跟踪算法的性能也得到了广泛提升,但在实际应用中仍面临许多挑战性问题。本文以孪生网络跟踪框架为基础,以西北农林科技大学畜牧教学试验基地中的奶山羊以及VOT2016、VOT2017、OTB2015和La SOT公开数据集为研究对象,在存在相似目标干扰、目标尺度变化、目
小麦条锈病是小麦叶部的主要病害,由于受条锈病侵染的小麦叶片上会附着条锈孢子,使叶片无法正常进行光合作用,从而使叶片枯死,严重降低小麦的产量和品质。而防止小麦条锈病大规模入侵,保证产量最有效经济的手段,就是在小麦条锈病的易感地区培育具有良好抗性的小麦品种。在小麦条锈病抗病育种过程中,对小麦条锈病侵染型级别进行鉴定可以初步判断小麦对条锈病的抗性,这是抗性鉴定的重要步骤。目前小麦抗条锈病育种工作者对小麦
随着图像处理技术的快速发展,骨架提取算法为医学图像处理、科学数据可视化、虚拟现实和游戏等应用提供了技术支持。但现有的骨架提取算法存在难以并行以及并行度不高的问题,如何利用丰富的多核资源加速骨架提取算法,迅速成为了并行计算和高性能计算领域面临的一个紧迫而具有挑战性的关键问题。骨架提取算法中存在复杂的数据依赖关系,导致传统的并行策略在提升性能方面受限。针对这一问题,本文提出基于线程级推测的骨架提取算法
车道线识别及跟踪是自动驾驶视觉感知中极为重要的经典课题,通过识别当前车辆所处环境的车道线,可以为车辆的路径规划提供导航路径,使得车辆可以在标准的道路模型中安全可控的移动。同时,精准的车道线识别也是高精度地图定位的重要依据之一。针对当前基于语义分割的车道线识别方案易受环境负样本干扰、鲁棒性差和识别类别无法为自动驾驶提供充分导航信息的问题,首先完善了道路场景模型,在已有标注方案基础上添加新的车道线类别
根系是植物的重要功能器官,其三维实体可视化模拟有助于理解根系生长发育动态、形态与构型特征和营养吸收功能等,特别是在根系通过抗剪增强从而发挥固土护坡作用方面,通过三维实体可视化模拟,借助于图形图像学和计算机辅助等,可便捷的提取植物根系构型参数,比较不同护坡植物种间差别。因此,对护坡植物的选择与配置、及水土保持工程和园林设计制图等具有重要理论与实践意义。据此,论文选取选取黄土区自然坡体6种常见但根系类
肖像浮雕建模技术是一项重要的三维模型重建技术。目前,浮雕作为一种雕刻艺术,其将雕刻元素附加到相同的材质背景中,成为一种极具收藏价值的工艺艺术品。而肖像浮雕凭借着丰富的视觉审美和独特的雕刻方式成为浮雕艺术的典型代表形式,具备独特的艺术魅力和纪念意义。因此,为了满足人们对于风格多样的定制肖像浮雕的需要,计算机图形学与浮雕艺术相互结合已成为计算机图形领域研究的热点内容。通过三维建模技术辅助数字化浮雕的生
智能化管理是养殖业规模化的基础和发展方向。为了实现奶山羊养殖场的智能化和规模化建设,提高奶山羊养殖场的管理水平,本文以西北农林科技大学畜牧教学试验基地的奶山羊图像为研究对象,使用基于通道注意力模块SeNet和GIOU损失函数的YOLOv3算法,实现了奶山羊的目标检测与计数。本文的主要研究内容与结论有:(1)奶山羊目标检测数据集的构建及预处理。针对缺少奶山羊目标检测公开数据集的问题,首先在羊场搭建远
植物工厂是农业发展的高级阶段,可以在有限的土地资源上产出更多的粮食蔬菜,能够有效解决粮食安全、季节性蔬菜短缺和地域限制等问题。水培生菜因其产量高、生产周期短和市场需求大等特点,在植物工厂中种植面积越来越大。由于水培生菜质地脆嫩,极易受损,受损后受微生物影响会快速腐烂,严重影响生菜的商品价值和食用安全。针对于此,当今市场推行对水培生菜进行包装出售,针对包装环节也推出了系列包装机械。但包装前的分选检测