基于插桩技术的并行调试工具设计与实现

来源 :2006年全国高性能计算学术会议(HPC 2006) | 被引量 : 0次 | 上传用户:laoyoutiao66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高性能并行计算技术的发展,并行程序的调试越来越重要,本文介绍了一种异构环境下的并行调试工具的设计.通过对并行程序源代码的分析处理,利用自动插桩模板插入用于调试的用户代码,从而对并行程序进行断点调试和性能参数收集,通过程序运行过程中内存变量值的查看,可以检查出异常变量,再对源并行程序进行调试,达到进一步优化程序设计的目的.
其他文献
探讨了小波分析的新颖的理论和算法.利用虚拟仪器、组件化开发、层次模型等先进技术,设计开发了小波分析仪器库.该仪器库由专家系统、经验数据库、开发系统和丰富的小波分析功能模块组成,它们共同实现在机械、能源、交通、生物医学等领域的通用和专用小波分析功能.展示了该仪器库的界面和工程应用.
首先介绍了柱栅传感器的基本原理,并重点介绍了圆柱型柱栅定滑尺的典型形式.在此基础上,对同轴测量型柱栅传感器总体结构、安装方式等进行了详细设计,为直线位移的同轴测量方式提供了一种数字化传感器选择方案.
本文详细论述了变压器油中溶解气体监测技术的国内外发展现状,并且提出了在线监测中数据无线传输的新方法.
研究了旋转机械非稳态信号的分析方法.对等时间间隔采样的齿轮箱振动信号,利用插值算法实现角域重采样.为了抑制与工频无关的噪声信号,提高信噪比,对重采样信号进行了阶次域平均.将倒频分析引入阶次分析中,以检测出功率谱中难以辨识的周期性.通过以上方法成功地识别了齿根裂纹故障,说明了对旋转机械非稳态信号进行角域平均和倒阶次谱分析的可行性和有效性.
详细介绍了LabVIEW在自动机运动规律测试中的具体应用情况,将LabVIEW开发平台应用在自动机运动规律测试中,有效提高了测试精度.
最少比较排序问题就是要研究在最坏情况下,对n个元素完成排序所需要的最少比较次数S(n).1965年M.Wells用穷举法证明S(12)=30, 2002年到2004年,M.Peczarski计算得到S(13)=34、S(14)=38、S(22)=71.本文改进了线性扩展计数算法、Wells算法、Peczarski算法,使时间代价大幅降低,并设计了一个新的算法PS算法.通过对Wells算法、Pecz
矩阵计算在科学计算和其它很多的领域中有着广泛的应用.而随着计算机体系结构的不断发展,尤其是分层存储的出现,现有的经典矩阵计算算法和传统数据结构已经不太适应新硬件发展的需要了.本文主要通过分析存储层次对矩阵计算的影响,结合近年来国内外的一些研究成果,提出了一种矩阵计算理念--计算重排序理论,并在此基础上提出了一种面向存储层次解决矩阵计算问题的方法--综合递归分块方法.对比实验表明,采用该方法既可以提
动态二进制翻译是解决兼容问题的重要手段,它能够将为源平台编译的二进制代码直接运行在目标平台上.指令调度作为一种有效的编译优化技术,也适用于动态二进制翻译.本文在对gcc指令调度器分析研究的基础上,结合动态二进制翻译的实时性特点,提出了适合动态二进制翻译的效率高、开销小的指令调度算法.
副本管理是数据网格系统中重要的研究课题之一,针对数据网格系统中副本数量日益增多,分布范围日益广泛的发展趋势,提出了构建于结构化P2P网络之上的分布式副本信息管理机制P-DRMM,通过Overlay网络中的路由机制实施所有的副本信息更新和查找操作,使得副本的管理变得简单而有效,为快速有效地访问数据网格中的数据提供了一个良好的底层机制.在设计Overlay网络节点的路由表时结合了小世界模型的思想,理论
本文针对Chord模型在资源发现和定位中存在的效率问题,设计了一种用于提高资源发现和定位效率的扩展模型-RL模型.RL模型在两方面对Chord模型进行了改进,RL模型使用双向指取表,使搜索能从P2P环的两个方向同时进行;通过对节点进行分类排除了干扰节点,并减少资源定位所需的跳数.从而使搜索系统能更好的完成对P2P网络资源的定位.本文详细描述了RL模型的结构和资源定位的原理,给出了资源定位的示例,介