一种针对线性循环结构的非线性静态调度策略

来源 :计算机工程 | 被引量 : 0次 | 上传用户:liz302
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有OpenMP调度策略通常采用动态策略处理程序中的线性循环结构,存在负载不均衡和调度开销大的问题.提出一种针对线性递增或线性递减循环结构的非线性静态调度策略Nonlinear_static.将线性循环负载均匀变化参数与总负载、负载峰值、线程数相结合构建调度模型,计算循环迭代在线程上的映射,使迭代块大小呈非线性递增或递减趋势.将线性循环的负载平均地分配在每个线程上,并在开源OMPi编译器中进行编码.在Adjoint Convolution、Compute Pots、Matrix Multiplication、Mandelbrot Set应用程序上进行多线程调度,实验结果表明,相比静态调度、动态调度、指导调度等策略,Nonlinear_static调度策略在处理线性循环结构时执行时间缩短了5%~10%,且具有无调度开销的优点.
其他文献
近年来随着科学技术的飞速发展,软件研发项目所采用的技术类型也受到潜移默化的影响发生着迅猛的变化。例如增强现实(AR)和虚拟现实(VR)等新型技术,这些技术也在被广泛的应用于各行各业,使用这些新型技术研发的软件产品也如雨后春笋般出现。相比与传统的软件研发项目,这类项目的研发风险也会有所不同。因此对于这类新型技术的软件研发项目的风险管理研究尤为重要。本文是基于对D公司AR远程协助项目实施过程中项目风险
随着智能化时代的到来,各个行业都在尝试智能化发展。自动化喷涂在工业领域占据了一个重要领域,广泛应用于航空、军事、船舶等领域,提高了喷漆效率。虽然喷涂机器人智能化水平有所提高,能取代大部分人工喷漆,但目前智能化喷涂还是采用人工示教的方法进行喷涂时的路径规划,这样不仅影响工作人员的安全,还影响喷涂质量。所以急需研究自动喷涂技术,即通过离线编程规划路径后让机器人自己路径规划从而进行自动喷涂。因此,本文针
微博是个人和组织用户分享或获取简短实时信息的重要社交平台,微博文本自动生成技术能帮助用户在微博平台上快速实现各种社交意图.为辅助用户发表博文并表达社交意图,提出一种基于用户意图的微博文本生成技术,以挖掘提取微博文本特征,并在给定微博主题的条件下生成与用户意图相一致的微博文本.采用预训练语言模型与微调相结合的方法,在预训练语言模型GPT2上实现联合主题和用户意图的文本控制生成,以及具备用户对话功能的文本预测生成.实验结果表明,该技术生成的文本具有较高的可读性且符合微博文本语言风格,结合主题和5类用户意图的生
视频数据能够为车辆的智能网联化提供丰富的信息,为了更好地提取视频内容并使卸载后的视频中包含更多的有效信息,在时延约束条件下,设计一种内容驱动的计算卸载指导方式并提出基于改进蒙特卡洛树搜索的计算卸载决策算法.在车辆端通过关键帧提取来对视频内容进行预处理,以有效分析视频内容理解任务的重要性,使得更重要的任务能够获得更多的计算资源.采用基于强化学习的启发式搜索算法完成计算卸载决策,并引入深度神经网络预训练先验转移概率,从而优化算法的收敛速度并降低计算复杂度.实验结果表明,该算法能够在时延约束下有效降低能耗并提升
赫姆霍兹方程求解是GRAPES数值天气预报系统动力框架中的核心部分,可转换为大规模稀疏线性系统的求解问题,但受限于硬件资源和数据规模,其求解效率成为限制系统计算性能提升的瓶颈.分别通过MPI、MPI+OpenMP、CUDA三种并行方式实现求解大规模稀疏线性方程组的广义共轭余差法,并利用不完全分解LU预处理子(ILU)优化系数矩阵的条件数,加快迭代法收敛.在CPU并行方案中,MPI负责进程间粗粒度并行和通信,OpenMP结合共享内存实现进程内部的细粒度并行,而在GPU并行方案中,CUDA模型采用数据传输、访
基于位置的路网Skyline查询可根据用户的需求及用户所处的位置,从大量数据中快速返回给用户期望的数据,但已有的道路网络技术需要计算大量的路网距离及数据点间支配关系的运算,导致查询效率较低.提出一种基于路网数据点的倒排索引查询算法DSR.通过计算少量数据点的路网距离求得最终结果,减小路网距离计算的代价,从而加快数据点间支配关系的判定,提升查询效率.在此基础上,在数据点更新情况下给出算法的动态维护,仅通过维护少量数据,DSR即可以快速地计算出Skyline集合.实验结果表明,与SSI、BSS等算法相比,该算
作为SIMD扩展部件向量化的重要手段,自动向量化已在LLVM编译器中得到实现,但向量长度以及指令集功能的差异,导致国产平台在自动向量化过程中容易错失向量化机会以及向量化后产生倒加速的问题.为使SIMD得到充分应用,结合国产平台的指令集特征完善指令代价信息以提高收益分析精准度,使其在自动向量化后生成后端支持且简洁高效的向量指令.在此基础上,提出一种改进的控制流向量化方法,通过添加指令代价信息提高自动向量化的适配能力,从而形成一套面向国产平台的L LV M自动向量化系统.实验结果表明,相比自动向量化移植前,通
火车作为我国交通工具的重要组成部分,在我国运输行业中扮演着重要的角色。随着火车车辆的运行,其车厢表面的油漆标记会逐渐磨损或者破坏。当前,火车车厢标记的喷涂作业是通过人工喷涂方式来完成。但人工喷涂方式存在喷涂效率低、涂料浪费以及危害作业人员健康等缺点。因此,本文研究了一种自动喷码机器人,实现了火车车厢标记的自动喷码,从而有效的提高喷涂效率,降低涂料浪费,保障作业人员的健康等。本文主要从以下方面进行研
代码克隆是软件开发过程中常见的开发方式,随着开源组件、代码复用技术和开发框架等技术在程序开发中扮演越来越重要的角色,克隆代码的数量也随之快速增长。虽然代码克隆在一定程度上提高了程序开发效率,但也对软件管理及维护产生了负面影响,包括软件缺陷传播、恶意代码传播等。代码相似性分析技术旨在通过自动化的方式对克隆代码进行检测,降低克隆代码带来的负面影响。同时,随着软件产业的不断发展,代码相似性分析技术也越来
在软件定义网络与网络功能虚拟化协同的网络架构下,只考虑单个服务质量(QoS)指标的服务功能链部署无法满足用户的多业务体验需求.提出一种基于机器学习的服务功能链部署模型.基于层次分析法构造MPNQ2算法以建立QoS与体验质量(QoE)的映射关系,得出影响QoE的网络参数并评估其影响权重.在此基础上,利用具备较强综合学习和泛化能力的随机森林模型对服务功能链的QoE进行预测.实验结果表明,与梯度提升决策树、线性判别分析等机器学习模型相比,随机森林模型为预测QoE的最佳模型,同时在影响QoE的网络参数中,丢包率对