通用处理器的访存关键问题研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:wuni_cn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着微处理器设计和生产工艺的快速发展,存储系统的访问速度与处理器的运算速度之间的差距越来越显著,访存效率成为影响处理器性能的重要因素,存储系统的性能优化从而成为处理器性能提高的关键。   GodsonX是以Godson2处理器为基础设计的x86超标量处理器,由中国科学院计算技术研究所前瞻研究中心新型微系统组设计实现,是高性能通用x86处理器自主研究的一次重要探索,实现了IA-32结构的完全兼容。本文以平衡GodsonX处理器的设计为基础,从提高处理器的性能、优化处理器的访存延时及带宽的角度出发,采用SPECCPU2000作为基准测试程序,结合处理器的访存行为特征,对影响存储系统性能的多个关键问题进行研究,提出了相应的优化技术,并对所提出的优化技术进行了性能评测与分析。   本文主要的创新点及贡献包括:   1.提出了一种自修改代码(SMC)的检测及处理策略。这种解决方案能精确检测处理器内部发生的SMC冲突并能进行高效灵活的处理,其中SMC冲突检测区域的大小是可配置的,并且通过复用访存通路取消了数据cache中用于SMC检测的Tag部分。这种方案在cycle级的C模型下经过充分的验证,并在RTL一级进行了实现,这种设计不但没有大量增加GodsonX设计的复杂度,反而因复用访存通路将处理器的面积减少了1.16%,同时不会影响流水线的性能。   2.提出了一种单端口的高带宽TLB设计方法。通过这种方法可以在高带宽访存流水线中使用单端口TLB来取代多端口TLB,这一思路源于我们对程序访存行为页面级空间局部性的观察。本文对虚实地址转换机制进行了两次改进,第一次改进使得双端口TLB被单端口TLB替代,但增加了访存队列(LSQ)发射选择逻辑的延迟,第二次改进消除了第一次改进所增加的LSQ延迟,相比传统的双端口TLB,最后的结果是在不明显影响访存流水线关键路径的延迟和处理器性能的情况下,TLB的面积降低了53%。   3.提出了一种改进的高带宽cache设计方法。本文给出的简化的多端口cache设计技术基于多体技术。通过观察程序的访存行为,我们发现load访问cache的次数和store访问cache的次数接近,因此我们将load和store在访问cache时分开,使load和store使用各自专用的端口访问cache,这样允许我们采用双端口的Tag SRAM和单端口的Data SRAM实现简化的双端口cache。在将这种技术用于Godson2处理器(单访存通路)后,在处理器整体面积仅增加2%的情况下,处理器运行SPEC CPU2000的性能平均提高了8.6%。   4.提出了一种快速访存地址计算策略。本文介绍了动态微码分割技术,该技术的目的是通过尽早的计算出store的地址,减少模糊地址别名发生的机会,进而减少错误load猜测的次数。在寄存器重命名阶段,一条store指令被分成store-address和store-data两部分,store-address进入保留站(RS),store-data进入LSQ,store-address的计算不再依赖store-data,削除了二者之间冗余的依赖。依赖的削除使得store-address可以尽早的被发射,这样一来,LSQ由于可以及时得到store指令的地址,模糊地址别名的情况大大减少,发生错误load猜测的概率也明显降低,将store-data直接映射到LSQ的做法还节省了RS的空间,提高了指令窗口的利用率。根据SPEC CPU2000的测试结果,错误的load猜测平均降低35.7%,系统性能平均提高3.3%。   5.提出了针对栈操作的load猜测机制改进策略。分析发现错误的load猜测大都因为使用堆栈进程参数传递导致,本文还有针对性对load猜测策略进行优化,进一步降低了load猜测错误的几率,系统性能平均提高0.9%。
其他文献
数字化技术和网络的发展推动了海量数据的产生、共享与应用,使得科学与工程研究、教育日益成为数据密集型的工作.科学数据已经成为一种重要的战略资源,将在未来全球科技合作
作为一种新兴的网络形态,无线Mesh网络(Wireless Mesh Network,WMN)有着广阔的应用前景,它为解决无线接入“最后一公里”瓶颈问题提供了新的方案。随着网络多媒体化进程的加快,Vo
近年来,随着互联网的发展,资源共享越来越贴近人们的生活。然而由于各种原因,资源数据存在于不同的数据库管理系统,这些系统便形成了信息“孤岛”。如何消除这些异构数据库之
Web服务是当今网络应用和开发的重要形式,对下一代互联网的发展必将产生重要影响。Web服务以分布式计算和处理为显著特点,为电子商务系统的快速开发、部署提供有力的保障。We
学位
业务流程管理(Business Process Management,BPM)在政府、金融、企业等信息化进程中的地位日趋重要,BPM的应用领域也越来越广泛。目前BPM没有统一的标准和规范,各大厂商的产品和
信号处理与生物视觉的研究表明:在信号的频域表示中,相位扮演了比幅值更加重要的角色,单纯由相位重建的结果包含了更多与原信号相似的结构.由此可见:相位含有很多重要特征.因
本文的研究工作主要是围绕像素级的图像融合展开的,全面、深入、系统地研究了图像融合的基本理论,重点研究了小波变换图像融合算法、基于边缘检测的图像融合算法、基于HSI变换
信息化技术的飞速发展,传统的档案业务流程已经无法满足信息化时代的档案归档、管理和利用的需求,使得建设基于内容管理技术的电子档案中心势在必行。   电子档案中心是将运
城市化的迅速发展催生了数以万计的高楼大厦,伴随智能终端的广泛普及面向智能终端的室内移动位置感知技术成为研究热点。基于地磁的室内定位技术由于不需要部署额外的基础设施