基于龙芯3A处理器的跨平台二进制翻译器QEMU的优化研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:wyoo00oo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
龙芯处理器作为我国自主研发的通用CPU,它的发展具有重大意义。龙芯处理器采用类MIPS架构。而目前基于X86架构的处理器在应用中被大量使用,这是因为无论在服务器领域还是在商业软件中,大量应用都是采用X86架构。因此实现与X86架构的兼容就成为龙芯平台的重要任务。二进制翻译技术使得龙芯对X86兼容变为可能。目前基于龙芯的二进制翻译研究多是基于用户级模拟下的应用移植和优化,而本文基于龙芯3A平台,从系统级模拟着手,通过运行X86操作系统,对其上常用应用程序进行针对性优化研究。   本文以龙芯3A处理器为实现平台,以QEMU作为跨平台动态二进制翻译系统。在深入了解QEMU的特点及翻译运行机理的基础上,结合程序代码的局部性原理,指出程序执行时代码的热路径部分是很适合进行优化的区域。在对常见的几种热路径识别算法进行分析比较后,针对QEMU的特性提出了在本文中实现的算法。QEMU利用本算法能够较好的识别出程序执行的热路径并进行优化。同时,通过对X86和龙芯处理器通用寄存器特点的分析,论证了在源机器为X86体系结构,目标机为类MIPS体系结构的情况下进行寄存器分配优化的可行性。接下来结合QEMU系统级模拟工作模式特点,通过在龙芯3A平台上对QEMU二进制翻译器上Windows XP操作系统常用应用程序的运行时寄存器的访问情况进行统计分析,针对龙芯3A平台,对QEMU现有寄存器分配方案进行优化,从而达到降低系统级模拟时的访存频率的目的,提高模拟效率。最后,通过在龙芯3A平台上运行Windows XP操作系统,对其上常用应用程序的运行效率进行优化前后的量化对比,验证了本文的优化方法是行而有效的。而使用nbench测试集进行性能评测的结果,则验证了本文的优化方法对于更广范围的X86架构下应用程序的效率提升也是有效的。这对基于龙芯平台的系统级跨平台应用程序的实用化具有深远的现实意义。
其他文献
近几年,基于位置服务(LBS)的广泛应用使得位置定位成为普适计算中一个重要的研究领域。基于位置指纹的WIFI定位技术由于定位成本低、依赖部署的WIFI环境、定位原理简单、实用
随着云计算技术的飞速发展,大规模云数据中心所带来的巨大能耗问题日益凸显。如何有效的降低云数据中心的能耗,成为学术界和商业界关注的焦点。目前云计算数据中心在节能优化研
纱线检测是评价纱线质量的重要方法之一。当前我国检测纱线疵点的方法主要有测长称重法、人工检查法和设备检测法,但这些方法都有不同的优缺点。在纺织行业,增加产品产量的同时
不同的算法可能用不同的时间、空间或效率来完成同样的任务,对于精心实现的算法,往往可以带来更高的运行和存储上的效率。所以研究第一类样条权函数的算法复杂度是非常有意义的
BWDSP100是一款采用了超长指令字体系结构(VLIW)以及单指令多数据流(SIMD)技术相结合的32bit浮点数字信号处理器(DSP)。它是由中国电子科技集团某研究所自主设计、自主研发,拥
近几十年来,视频成像技术经历了黑白、彩色、数字、立体的快速发展过程。电影《阿凡达》的热映,拉开了立体视频的应用热潮。与传统的2D视频相比,立体视频可以产生空间立体感,
近年来,随着世界经济以及现代工业不断飞速的发展,各个领域生产规模的不断扩大,对生产控制系统以及信息的处理要求也越来越高。而分布式控制系统以其良好的性能成为用户的首选,在现代化的今天,基于现场总线的分布式控制系统更是成为研究和应用的热点。CAN总线更是成为诸多现场总线中的佼佼者,被应用到很多的生产以及生活领域,被誉为最有前途的现场总线之一本文研究的就是一种基于CAN总线的分布式电机控制系统,而不是以
随着三维表面重建技术的逐渐发展与成熟,人们为了能够重建出高精度的物体表面,不断地对该技术进行优化和改进,并将其运用于很多领域。其中,将BP神经网络应用于物体表面重建也
随着互联网的迅速发展,分布式计算正在高性能计算、海量数据处理、大规模服务器端技术等领域发挥着越来越重要的影响,成为不可或缺的支柱技术。与此同时,Java虚拟机技术的作
互联网技术的飞速发展,将我们带入了数字化、网络化的信息时代。在海量信息中,如何能快速并有效的提取有用信息成为人们研究的重要领域。文本分类技术是文本信息处理领域重要的