OpenMP环境下线积分卷积的并行化实现

来源 :理论与创新 | 被引量 : 0次 | 上传用户:a139471569
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘  要】线积分卷积是矢量场可视化的重要的方法之一,但是由于需要对每个矢量点进行卷积积分计算,因而计算量较大。CPU多核环境下的并行实现是现在并行计算技术发展的方向之一。本文在OpenMP 环境下实现了线积分卷积的并行化。结果表明,随着CPU核数的增加,并行线积分卷积的时间逐渐降低,加速比逐渐增加。
  【关键词】线积分卷积;OpenMP
  Abstract:Line integral convolution is one of the most important methods for vector field visualization. However, it requires the convolution integral calculation for each vector point. Parallel implementation in CPU multi-core environment is one of the development directions of parallel computing technology. In this paper, the parallelization of line integral convolution is realized by OpenMP in a multi-core environment. The results show that the time of parallel line integral convolution decreases and the acceleration ratio increases with the increase of CPU cores.
  KeyWords: Line integral convolution; OpenMP
  引言
  基于線积分卷积(Linear Integral Convolution, LIC)的矢量场可视化是目前矢量场可视化最常用的方法之一。其核心思想是白噪声叠加矢量场数据对矢量场运动信息进行可视化,能够很好的表示矢量场运动方向特性,且易于实现,因此对于矢量场的可视化具有重要意义。但同时该方法也存在不足:积分过程计算量大,需要对流线上的每一点进行积分卷积。在积分过程中即使采用最简单的欧拉积分方法,计算量也不容小觑。针对LIC算法计算量大的问题。文献[1]实现了基于平行坐标的LIC矢量场可视化,并根据netcdf格式数据的特点,提出了基于netcdf数据生成流线的方法。
  针对LIC算法积分过程计算量大,计算速度慢的问题,文献[2]中利用GPU的多线程技术,基于cuda平台对LIC算法的计算部分实现并行化,获得了较高的加速比。此外,采用GPU实现LIC并行化的研究如文献[3]。然而基于GPU的并行化通常情况下需要对串行LIC代码进行重构,工作量较大,此外,还需要在内存与显存之间频繁拷贝数据。
  文献[4]通过LIC算法模拟高分辨率的矢量场数据,在Windows集群环境下采用MPI实现了并行化,结果显示并行化后的算法能够大幅度缩短计算可视化时间,且与原来串行计算的图像结果一致。基于MPI的LIC的并行化具有良好的扩展性,能灵活的扩充与减少节点,但是该并行模式在通常情况下需要计算机集群,且并行加速比不仅依赖算法的优化,更加依赖计算集群底层网络的传输,即底层网络的带宽往往成为制约提高并行加速比的瓶颈。
  随着计算机多核CPU技术的不断进步,共享存储器编程因其能充分发挥各个CPU核的潜力而成为最受青睐的编程模式之一。共享存储器编程的优点是通过共享内存实现线程之间的数据通信,减少网络之间的数据传输,各个线程通过加锁的方式实现对共享内存的读写。常用的共享存储器编程方式包括OpenMP,及调用操作系统API实现多线程等方式。本文将采用OpenMP方式实现线积分卷积的并行化。
  1.线积分卷积
  线积分卷积是通过跟踪矢量场数据,形成矢量,然后在矢量方向性卷积高斯白噪声从而达到矢量场数据的可视化,具体公式如下:
  F(x)表示输出像素点的灰度值,T(s)表示高斯白噪声灰度图像值,k(s)为卷积核函数,积分长度为2L。对于输入的矢量场数据中的每一个点都需要计算流线,并依据上式输出积分卷积值作为输出结果。
  2.OpenMP并行实现
  本文主要对计算过程中的主要循环迭代加入OpenMP指令实现并行化。即对线积分卷积的迭代跟踪流线和卷积的过程通过加入OpenMP的并行指令 #pragma omp parallel 的方式实现该过程的并行化。
  LIC算法的积分过程需要对每一个点沿着矢量方法进行积分计算,计算完成之后根据卷积核函数对高斯白噪声进行卷积计算,卷积完成之后更新图形对应位置的像素值。根据LIC算法的特点,可以设置矢量场数据及高斯白噪声数据为各个OpenMP线程所共享,这样可以减少线程之间的数据通信,减少并行开销。在OpenMP编译指令中加入“default(shared)”子句实现默认数据的共享,共享数据包括矢量场数据,高斯白噪声及输出图像数据。在OpenMP编译指令中加入“private”子句实现循环变量的私有。
  3.结果分析
  本文在一台8核CPU机器上实现线积分卷积的并行化。为了较好的衡量并行结果,本文设置的线积分卷积的并行计算规模分别为1000*1000、2000*2000。线积分卷积并行计算规模为1000*1000、2000*2000时计算时间分别为表1、表2。对应的加速比分别对应图1,、图2。
  由以上2个表格的计算时间可以得到,随着CPU核数的增加,并行LIC算法的计算时间逐渐减少。加速比逐渐增加。在CPU核数较高(CPU核数为6、8时)时,两个问题规模计算时间大幅度减少,均能获得较高的加速比。在CPU核数为8,两种问题规模的加速比达分别达到3.78、3.48。然而在CPU增加过程中,加速比并没有线性增加,这主要是因为两个问题规模并行开销增加。对于OpenMP来说,并行开销主要包括线程的私有资源的分配、同步等开销增加。
  综上,并行化后的LIC算法随着CPU核数的增加,运算时间逐渐降低,逐渐获得较高的加速比。随着并行开销的增加,并行化的效率逐渐降低。此外,负载均衡与否也是影响并行效率的一个重要因素。
  参考文献
  [1] 宋扬扬.基于平行坐标的线积分卷积矢量场可视化方法研究[D].秦皇岛:燕山大学.2016
  [2] 吴占斌.基于 GPU 的二维矢量场可视化线性积分卷积方法的研究与实现[D] 青岛:中国海洋大学. 2011
  [3]詹芳芳.线积分卷积二维矢量场可视化方法的研究和改进[D].北京:北京化工大学2013
  [4]刘天佳.基Fast-LIC的矢量场并行可视化方法研究[D]. 哈尔滨:哈尔滨工程大学 2017
  作者简介:符晓单(1985--),男,博士研究生,从事并行程序设计。
其他文献
【摘 要】现阶段,DEH系统自身具有更强的功能性和可靠性,并且其还具有比较优秀的品质调节优点,渐渐在火力发电领域取得了广泛应用。进一步完善DEH系统方面的维护工作和检修工作能够为汽轮机在后续阶段的运行工作提供一定的保障。本文针对上述内容,对汽轮机在当前阶段常见的系统异常表现做出了阐述,同时本文也设计了汽轮机出现功异常的诊断方式说明,最后提出了对应的处理和预防措施。  【关键词】DEH;信号干扰;D
期刊
【摘 要】随着国家对海洋环境的重视程度越来越高,对海洋环境的检测也越来越重视,而对于海洋环境的检测方法仪器,也一直在不停改进中,对海水中重金属检测方法和处理技术的研究也在逐年增加。重点介绍海水中重金属检测的原理研究进展及其优缺点,包括目前应用较多的检测方法有原子吸收光谱法、电感耦合等离子体原子发射光谱法、原子荧光法、阳极溶出伏安法、分光光度法、X 射线荧光光谱分析法等。提出海水中痕量重金属检测方法
期刊
【摘 要】本文主要以铁矿为例,简述了我国矿业的发展以及资源分布不均匀的现状,浅显地分析了我国选矿技术,并对今后的技术发展方向做了简单的探讨。  【关键词】铁矿资源;选矿技术;发展方向  引言  随着我国钢铁产业的发展,钢铁产量迅速增长,伴随而来的便是矿石这一原料的需求越来越大。我国的矿产资源虽然丰富,但是多为贫矿,并且因为国土面积大、矿产资源分布不均匀、东西部的经济水平差距大等因素,导致在开采矿产
期刊
【摘 要】工业大数据是落实制造强国战略和网络强国战略的关键支撑和重要基石。宁夏坚决贯彻落实新发展理念,深入开展“互联网+”行动,构建网络、平台、安全三大功能体系,促进行业应用,形成实体经济与网络相互融合发展的良好局面。但不容忽视的是,宁夏工业大数据发展还面临着管理水平较低、行业产业链之间的数据互通依然困难,数据流通的壁垒较高等现实困境。实施基础能力提升行动、培育和引进一批先进的工业互联网平台,推动
期刊
【摘 要】随着经济的飞速发展,带动着互联网技术与计算机技术也得到了很大的提升,信息化技术在行政办公中已经得到了广泛的应用。当今社会的信息化水平空前提高,极大地推动了行政办公的工作效率,在行政办公中,运用信息化技术不仅能够做到科学决策和资源共享,还能大大提高我国在国际信息化建设潮流中的地位。本文主要对信息化技术在行政办公中发挥的作用进行研究,并针对现阶段信息化技术在行政办公中存在的问题进行分析,并找
期刊
【摘 要】本文分析了ZB45包装机商标纸横推装置存在的问题以及漏油原因、解决方案,改进措施等几方面的内容进行分析,对提高横推装置的稳定性提供了借鉴。  【关键词】ZB45包装机;横推装置;漏油;问题;对策  引言  ZB45商标纸横推装置是把商标纸由纵向输送改变为横向输送的转向的部件。在作业过程中,由于各种原因会引发漏油问题,不但影响了包装美观,也增加了工作量。因此,我们要对漏油问题引起足够重视。
期刊
【摘 要】随着我国经济社会的发展,对铁路运能运力的要求越来越高,既有的车站面临着大量的新线引入和更新改造。伴随着新线的引入、既有站场货物线的增加、供电臂机车对数的增加、电力调车机的增多,对电气回路的供电能力要求也在提升。特别通过分析近几年电气回路不畅引起的事故案列,牵出线等支线电流回路不畅问题占有较高的比例。基于此,本文主要针对电气化铁路牵出线接触网加装电连接入手进行探讨,通过等效电路原理分析进行
期刊
【摘 要】对湿法电解铜诱导脱砷研究分析,应根据实际检测工作量、车间工艺分析能力的覆盖范围、检测技术的类型和生产过程关键条件的变化等情况确定方式和频次。采用数据比对和能力验证、实验室数据比对、不确定度评定等方法。  【关键词】诱导脱砷;数据分析;车间生产控制  1.研究背景  铜的湿法电解液是伴随着四类杂质的行为而产生不断地变化的,一类:金银及铂族元素电极电位比铜的要正,在阳极上基本不进行化学溶解,
期刊
【摘 要】近年来,随着科学技术的不断发展,人们生活水平不断提高,随之而来的精神文化需求也越来越高。传统的信息获取方式如文本、声音、图像等已经满足不了人们的需求,视频、高清视频甚至是超高清视频逐渐成为主流媒体。视频分辨率的不断提高,给多媒体技术的硬件及软件提出了更高的要求。在这样的时代背景下,VVC(Versatile Video Coding)应运而生。该编码标准相比于上一代视频编码标准HEVC来
期刊
【摘 要】介绍了影响东营鲁方金属材料有限责任公司铜电解精炼生产过程中直流电单耗的因素,并对这些因素进行了较为透彻的分析,以期找出各因素之间的相互关系,最终使直流单耗降低,达到降低成本提高经济效益的目的。针对生产中影响直流电单耗的因素,采取降低槽电压和提高电解液温度等方法,基本达到了在电解生产过程中降低直流电单耗和生产成本的目的。  【关键词】阴极铜;电解;生产成本;质量;直流单耗  引言  东营鲁
期刊