并行程序性能故障的检测与规避

来源 :清华大学 | 被引量 : 0次 | 上传用户:lklqlk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在并行程序已广泛应用于各行各业的当代社会,保障并行程序的高效运行尤为重要。然而,系统软硬件故障和共享资源争抢等因素会导致并行程序出现性能故障,造成大量资源浪费,甚至带来无法估量的损失。因此,如何检测与规避并行程序的性能故障已成为亟待解决的重要问题。尽管国内外已有相关研究,但现有工作仍存在诸多不足,集中体现在:检测性能故障时,引入的性能开销过大,检测结果不易解读;规避性能故障时,对程序特征和系统特性的考虑不够全面。为更好地解决并行程序性能故障的检测与规避这一问题,本文研究如何低开销地在线检测性能故障并给出直观易读的检测结果,以及如何根据程序特征和系统特性进行针对性的性能故障规避。具体而言,本文的主要创新成果包括:(1)提出了利用并行程序源代码中的负载不变代码段进行性能故障在线检测的技术VSENSOR。VSENSOR通过编译器技术自动识别重复执行且各次执行时负载量不变的代码段,并将其视作并行程序内部的性能基准测试程序,从而利用并行程序的源代码进行性能故障检测,而不需要依赖外部测试程序。VSENSOR引入的运行时性能开销低于4%,平均为1.99%。(2)提出了可用于生产环境的轻量级性能故障在线检测技术VAPRO。VAPRO利用外部函数调用将程序运行过程切片,并通过硬件性能计数器和函数调用参数等运行时信息分析各切片的负载和性能。VAPRO不依赖外部测试程序,也不需要分析或修改源代码或可执行文件,实用性较强,可用于生产环境中的CESM等复杂的并行程序。VAPRO引入的性能开销低于10%,平均为2.38%。(3)提出了基于差异化资源调度的性能故障规避技术UBERUN。UBERUN首先分析并行程序对于缓存容量和内存带宽这两种共享资源的需求差异,接着通过分散共享的进程分布模式规避程序间或程序内的进程对此类共享资源的争抢。与不考虑资源争抢的调度方式相比,UBERUN将并行程序的性能平均提升了 16.2%,将系统整体吞吐率提升了 5.4%。(4)提出了利用显式核间消息传递机制规避互斥锁争抢相关性能故障的技术PLOCK。PLOCK是针对显式核间消息传递这一体系结构新特性设计的线程互斥锁。PLOCK针对核间通信机制进行优化,与基础的核间通信互斥锁方案相比,通信量减少67%,吞吐率提升284%,延迟缩短95%。PLOCK避免了互斥锁竞争引起的缓存和内存争抢,其吞吐率是基于内存的互斥锁的27.37倍。
其他文献
我国机场高填方建设正处于快速发展阶段,也面临着很多问题,其中长期荷载作用下的变形问题较为突出。而对机场高填方的长期工后沉降的研究需要基于对堆石料时间相关力学特性的正确认知。本文利用离散元方法研究了堆石料瞬时变形及长期变形过程中的细观力学机理,并基于离散元研究结果建立了一种能够反映nonisotach现象的堆石料时间相关本构模型。本文的主要研究成果如下:(1)利用颗粒粘接法建立了可破碎堆石料的离散元
表面等离子体共振(SPR)生物传感器作为一种比较成熟的光学生物传感检测方法,由于其实时、快速、免标记和高灵敏的优势,被广泛应用于药物筛选、食品安全、环境检测、生命科学研究等领域。但传统的金膜SPR生物传感器,由于其较低的信噪比和较小的比表面积,限制了传感器的检测水平,主要表现在较大的谱宽和较弱的富集能力限制了待测吸附物的检测下限。本研究主要工作是基于表面等离子体共振,进行传感特性更优秀的纳米结构光
柔性连续体机械臂由于其特殊的结构形式,具有大柔性、可缠绕操作等特点,在新场景和新应用方面潜力很大,同时也在运动规划和振动控制等方面提出了诸多挑战。本文围绕柔性连续体机械臂的运动规划与振动控制,开展了如下研究:研究了柔性连续体机械臂的冗余解,针对柔性连续体机械臂具有中心柔性结构,在运动中会产生变形的特点,提出了最小化曲率向量无穷范数解来优化柔性连续体机械臂的中心结构受力。该冗余解将末端的运动和各自由
用户不断增长的网络接入需求对现有的网络设施提出了巨大挑战,现有的网络配置已经不能满足用户多样化需求。随着硬件技术和高速无线通信技术的发展,用户在作为网络使用者的同时,具备成为网络提供者的条件。本文将研究利用用户设备资源提供网络接入策略的问题。具体来说,根据用户网络接入需求特点,本文分别从一般网络类接入需求和视频类接入需求的角度分析,并且提出对应的解决方案。同时在策略设计中,本文充分考虑用户分享资源
如何从被噪声污染的观测数据中得到状态的最优估计被称为滤波问题。根据状态和观测系统是否线性,滤波问题可以分为线性滤波和非线性滤波,实际中的滤波问题大多数是非线性的。由于状态的最优估计是基于观测的条件期望,针对非线性滤波问题,我们一般从两个思路去研究:一个是利用Duncan-Mortensen-Zakai(DMZ)方程直接求解状态的条件密度函数,从而得到状态的条件期望。此方法一般需要求解DMZ方程,例
光电响应是利用光和物质之间的相互作用把光学信息转换成电学信号的物理过程,目前已经有一系列工作于?射线、X射线、紫外光、可见光、红外光和太赫兹波段的各种类型的光电响应器件。社会的发展和科技的进步对光电响应器件的性能不断地提出新的要求,例如高灵敏、快响应、低功耗和宽光谱等。为了满足这些要求,科研人员需要不断地发现新的光电响应机理、寻找新的光电响应材料、构造新的器件结构和开发新的工艺技术。本论文着重研究
钢-混凝土组合结构能够充分利用钢材和混凝土各自的优势,具有优越的综合力学性能,其在对结构安全性、经济性有较高要求的海上超大型平台中具有良好的应用价值和广阔的发展潜力。论文围绕钢-混凝土组合结构在海上超大型浮式平台中的应用展开深入研究,提出了多种新型超大型浮式平台组合结构方案,开发了相应的水弹性响应分析程序包,并基于结构整体和局部构件研究,对结构受力性能进行深入分析,为钢-混凝土组合结构在海上超大型
二维过渡金属硫族化合物(Transistion Metal Chalcogenides,TMCs)具有超薄的平面结构、丰富的元素组成和性质,为未来集成电路的构建提供了可选择的新材料。二维材料作为结构基元经过面内拼接或层层堆叠形成异质/相结构,此类结构蕴含着新奇的物理现象,可用于构筑新功能器件,为解决二维器件加工和实用化所面临的问题提供新思路。然而,二维异质/相结构的构筑与器件研究还面临诸多挑战,主
现代社会对无线通信技术的需求不断提升,然而频谱资源是有限的,这就对无线通信系统的精确度以及抗干扰性能提出了更高的要求。滤波器是无线通信系统中的核心器件,具有抑制特性的高温超导滤波器与双工器具有插入损耗低、带外抑制能力强的特点,这方面的研究对于未来无线通信系统有重要的应用价值。本论文系统地研究了高带外抑制性能的低频窄带、宽抑制性能的超宽带高温超导滤波器以及高隔离度的高频高温超导双工器,研究内容是目前
2010年,诺贝尔物理学奖授予石墨烯的发现者Andre Geim和Konstantin Novoselov,他们用最简单的机械剥离的办法将这种在理论上绝对零度时存在的神奇材料在常态下制备出来。自此开启了全世界科学家投身各类二维纳米材料研究的热潮。石墨烯——这种仅由单层碳原子所组成的二维纳米材料,亦可视为准二维的理想电子气体。作为零带隙半导体,其特殊的能带结构使之在电学、光学等多方面具有极其优异的物