【摘 要】
:
近年来,随着科学研究和工程技术的发展,各领域对计算能力的需求越来越大,促使了多核计算系统的快速发展,国内外主流计算平台核心数不断攀升。根据科学计算领域的二八法则,程序中20%的代码往往占据80%的执行时间,这些时间占比较大的代码块通常是程序中的循环结构。因此,利用多核并行计算资源来提升程序中核心循环的性能是一个重要的研究方向。Open MP是基于编译指示的共享存储多线程并行编程模型,由于其简单、高
论文部分内容阅读
近年来,随着科学研究和工程技术的发展,各领域对计算能力的需求越来越大,促使了多核计算系统的快速发展,国内外主流计算平台核心数不断攀升。根据科学计算领域的二八法则,程序中20%的代码往往占据80%的执行时间,这些时间占比较大的代码块通常是程序中的循环结构。因此,利用多核并行计算资源来提升程序中核心循环的性能是一个重要的研究方向。Open MP是基于编译指示的共享存储多线程并行编程模型,由于其简单、高效的特点,得到了GCC、ICC、LLVM等主流编译器的支持,是当前线程级并行编程的主要手段。Open MP针对循环并行化提供了三种不同的调度策略,但对于一些特定的循环模式,如负载线性递增或递减循环、随机负载循环等,已有的调度策略难以同时满足较好的负载均衡和较小的调度开销需求。为了解决上述问题,本文针对不同的循环模式提出了更具针对性的调度策略,主要的工作内容和研究成果如下:1、针对线性负载循环调度存在负载不均衡的问题,提出了非线性静态调度策略(Nonlinear_Static)。结合Open MP调度,提取循环调度过程中存在的关键参数,设计了最大化利用线性循环特点的调度模型,将调度模型在OMPi编译器里进行了编码实现。最终,该调度策略延续了静态调度没有调度开销的优点,并在此基础上实现了负载的均衡分配。本文采用具有不同循环模式的测试用例对提出的调度策略进行测试。结果表明,Nonlinear_Static调度策略在处理线性循环结构时,相比于Open MP已有的调度策略,在多种线程数下均取得了5%-10%的加速。2、针对随机负载循环采用动态调度策略时调度开销大的问题,提出了基于迭代编译的调度策略(Dual_static)。不同于其他调度策略,该调度策略在循环调度之前需进行一次预运行,目的是获取循环迭代的负载信息。通过预运行获取的循环迭代负载信息,实现适用于该随机循环的任务再分配,从而达到负载均衡。同时,通过代码隔离、并行执行预运行代码的方法,缓解了预运行带来的额外时间开销。本文采用含有随机负载循环的测试用例进行测试,结果表明,Dual_static调度策略在处理随机循环结构时,相比于其它调度策略,在多种线程数下取得了约8%的平均加速。
其他文献
近几年来,国内奢侈品消费屡创新高,随着奢侈品交易量的不断增大,奢侈品的真伪鉴别问题逐步成为了困扰行业发展的绊脚石。传统依靠人工鉴别专家进行人工鉴别的解决方案也随着奢侈品鉴别任务需求量的增大而显现出自身的瓶颈,人工鉴别不仅耗时耗力且成本很高。针对该问题,本文提出了一种使用深度学习技术借助奢侈品的视觉特征来完成奢侈品鉴别任务的模型,并以此模型为基础开发出用于移动端奢侈品鉴别任务的线上系统——小程序Re
知识图谱是一种流行的数据结构,主要用于在下游应用中查询和使用的事实知识的表示。知识图谱通常是由(头实体、关系、尾实体)三元组组成的多关系图,尽管这种三元组在组织结构化的事实方面很有效,但它们潜在的符号特性使得大多数的机器学习算法难以处理。为此,知识图谱表示学习旨在将这些符号化实体和关系嵌入到低维的连续向量空间中,以捕获实体和关系的内在结构信息,其为诸如关系抽取、信息检索、问答系统和推荐系统等不同的
光诱导原子转移自由基聚合(Atom transfer radical polymerization,ATRP)是一种能够制备结构复杂,功能性聚合物的简单高效的方法,具有适用单体范围广、反应条件温和、可通过“开/关”控制聚合过程等优点。目前大多数光诱导ATRP所使用的光催化剂是过渡金属、有机染料、有机催化剂和半导体纳米粒子,但是过渡金属、有机染料和有机催化剂具有毒性高,价格昂贵和不易制备等不足。因此
苯并咪唑是一种含氮杂环化合物,是多种药物的基本骨架。苯并咪唑衍生物具有多种生物活性,如抗肿瘤、抗寄生虫、抗消化道溃疡、抗菌、抗真菌、抗结核、抗病毒、抗高血压等。苯醌是许多药物的母核,其衍生物具有抗肿瘤、抗菌、抗炎等多种生物活性。合成新型苯并咪唑和醌类衍生物是发现新型药物的有效途径。糖作为天然手性化合物,在药物合成中起着重要作用。本论文以不同取代邻苯二胺和1,4:3,6-二缩水-D-果糖反应生成具有
MF-TDMA(多频时分多址接入)卫星通信是在TDMA(时分多址)技术体制基础上发展起来的一种新型宽带VSAT(甚小孔径终端系统)网,具有通信容量大、传播距离远等优势,是目前宽带多媒体卫星通信系统所采用的主流体制,近年来广泛应用于军事、民用、医疗健康、应急救援等领域。在MF-TDMA卫星通信系统的基础构建中,时钟同步技术是卫星通信应用的必要条件之一,且时钟同步的精度直接影响通信应用的质量,这也是本
近年来,基于深度卷积神经网络的目标检测算法与嵌入式平台相结合的技术已经在诸多领域得到广泛应用。但在如今的国内教育领域,目标检测与嵌入式平台相结合的应用基本局限于考场的人脸识别系统,在基层的教学工作中并未得到更有深度的应用。本论文对初中物理电路实验教学工作进行调研,开发出以YOLOv3-Tiny目标检测算法为理论基础、以嵌入式RK3399Pro为应用平台的软件系统,该系统可以代替老师或学生完成电路实
无线Mesh网络(Wireless Mesh Network,WMN)是近年来逐渐成熟的一种新型无线网状网络,有着很好的自组织性能,在可扩展性,组网速度等方面表现优秀,被视为下一代无线网络的重要组成部分。随着网络信息技术的发展进步,无线Mesh网络相关应用场景开发不断拓展,其中,将其作为灾后应急网络基础架构的相关研究是目前世界范围内的研究热点。信道分配算法决定了无线Mesh网络的网络表现,以WMN
医学图像配准的主要目的是对相同设备拍摄的不同场景或者不同设备拍摄的相同场景下一系列图像进行适当的空间变换,使得两幅或多幅图像间的对应点在空间位置上对齐。把医学图像配准技术应用于医学影像分析,可以辅助进行疾病诊断和手术治疗。但是由于成像技术的不同,产生很多不同模态的医学图像。若能够有效结合多种模态图像的成像优势,提供更加准确和互补的信息,从而为医生在疾病诊断和手术治疗中提供更全面的依据。解决上述问题
光热转换智能水凝胶可以将光能转化为热能,再通过热能引发水凝胶材料的响应行为。这种具备光热转换功能的智能水凝胶材料在药物缓释、海水淡化、光驱动器件等领域具有良好的应用前景。但是目前的光热复合水凝胶存在光热转换性能差、响应速度慢、力学性能不佳、功能单一等缺点。针对这些问题,本文以开发新型具有优良光热性能的多功能水凝胶为目标,将聚N-异丙基丙烯酰胺(PNIPAM)温敏水凝胶分别与高光热转换效率的二维MX