基于硬件性能计数器的程序性能分析方法实践

来源 :北京大学 | 被引量 : 0次 | 上传用户:chenzi004
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
良好的性能是程序设计开发的重要目标之一。结合硬件平台的系统结构特点,分析程序行为、寻找性能瓶颈是一个重要课题。硬件性能计数器是现代处理器芯片提供的一组专用寄存器。其功能为统计程序执行过程中特定硬件事件发生的次数,协助程序开发人员进行性能剖析。  本文以程序的动态行为为主要研究对象,基于PKUnity-3(65)平台,利用该平台集成的Cache性能计数器和总线计数器两种硬件性能计数器,对程序运行时间和内存访问情况进行剖析。主要研究内容包括以下两个方面。  1)分解程序运行时间,利用硬件性能计数器对各部分时间进行精确统计。程序运行时间划分为两个部分:CPU计算时间和存储访问时间(包括高速缓存和内存)。本文以SPEC2000测试基准程序为例,利用PKUnity-3(65)平台的硬件性能计数器精确统计各个部分的时间开销,并与SimpleScalar模拟器的相关结果对比,验证统计数据的正确性。  2)基于PKUnity-3(65)平台,扩展Oprofile的功能,使其支持基于事件的采样方式。本文首先分析了Oprofile的系统架构,然后基于PKUnity-3(65)平台的硬件性能计数器,利用时钟中断,完善了Oprofile对基于事件的采样方式的支持。最后以Firefox浏览器为例,用改进后的Oprofile分析程序的运行时间分布及二级Cache访问情况。  通过本文的工作,程序开发人员可以基于PKUnity-3(65)平台,精确测量程序运行时间分布,并利用Oprofile从模块和函数的粒度分析程序的动态行为,从而有方向有重点地进行程序的优化工作。
其他文献
近年来,64位微处理器在个人电脑及服务器领域得到了日益广泛的应用。64位微处理器能同时处理更宽的数据,通常还能提供超过32位的内存寻址能力,这符合应用程序逐渐增长的对内
随着质谱技术的发展,高分辨率、高精度的质谱数据的获取大大提升了蛋白质鉴定和定量的效果。使用“鸟枪法”和数据库搜索方法鉴定蛋白质时,可以利用肽段在色谱中的保留时间预测
由于网络的快速发展,它遇到了许多关于安全方面的问题,这些情况显得尤为突出,各种各样的攻击也层出不穷。虽然防火墙的应用在一定的程度上能够阻止网络的入侵,但随着网络的攻
随着互联网的迅速发展,网络协议的安全性越来越成为人们关注的焦点。IEEE802.1X协议作为以太网上主要的接入认证协议,其安全性的重要性显而易见。形式化方法作为一种重要的软
随着多媒体信息技术的不断发展,数字视频技术的应用越来越普遍,尤其是室外的视频监控应用,如道路交通、住宅小区、停车场等。然而逐渐增多的雾、霾等恶劣天气,使得采集到的室外视
荔枝、柑橘采摘效率的提高是提升岭南地区特色水果质量、降低成本的重要途径。农业采收机器人的应用是提高水果采摘效率的有效途径之一。但由于荔枝、柑橘果实形态、颜色、纹
全过程计算机辅助动画自动生成技术是人工智能与多媒体技术相结合的全新动画制作技术,它将电影艺术、人工智能和图形学技术引入动画生成全过程,底层以图形学技术作为支撑,上层运
卫星移动通信系统可以通过提供与地面蜂窝系统兼容的语音和数据服务,来解决传统蜂窝通信系统的业务范围受地理环境和运营成本制约的问题。新一代地球静止轨道卫星通信系统——
随着三维GIS的兴起和发展以及数据采集技术的进步,三维GIS中大规模矢量数据的可视化已经成为当前GIS空间数据可视化所要解决的一个重要问题。而目前,三维GIS中矢量数据的可视化
智能视频监控系统是计算机视觉领域的重要应用,运动目标检测是智能视频监控系统中的关键技术,阴影去除是运动目标检测中的重要环节。本文结合图像亮度归一化和二维交叉熵的思