高性能通用微处理器TLB性能优化技术研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:zhangsen168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着技术的进步和处理器结构的发展,高性能通用微处理器的TLB(TranslationLookasideBuffer)成为系统性能的瓶颈。为加快TLB的访问速度,TLB通常采用全相联结构。全相联的组织模式大大限制了TLB覆盖率的增长。TLB可以是硬件管理的也可以是软件管理的,前者虽然高效却限制了操作系统的灵活性,越来越多的处理器结构采用软件管理的TLB。软件管理的TLB除了要面对日趋低下的低覆盖率的压力,还要遭受较高的TLB失效开销造成的系统性能损失。TLB系统性能的损失是由较大的TLB失效开销或较低的覆盖率造成的,或者两方面共同作用造成的。具体到不同的应用,由于其工作集和访存模型的不同其TLB行为也不同。因此,优化TLB系统性能需要从降低TLB失效开销和降低TLB失效率这两个角度出发。   本文以龙芯处理器为研究平台,对高性能通用微处理器TLB性能优化的关键技术进行了深入的研究。本文的主要工作与创新点如下:   1.为降低TLB重填例外处理中的访存开销,本文提出软硬件协同的多级TLB结构,该结构中软件实现二级TLB表(SL2TLB)。该表为一个平面结构,其内部缓存了大量TLB表项。与多级页表相比,查询该TLB表所需的访存次数较少,访存造成的Cache失效次数更少,且该表的命中率达到95%以上。在此基础上,本文利用龙芯3号处理器提供的Cache锁机制将SL2TLB表锁进L2Cache中,避免了查找SL2TLB表时可能引发的L2Cache失效,从而进一步降低TLB失效开销,优化系统性能。实验结果表明,软硬件协同的多级TLB结构,对SPECCPU2000测试程序集中TLB失效严重的程序性能平均提高5%,对SPECCPU2006测试程序集平均性能提高达7%以上。   2.随着多核处理器时代的到来,越来越多的应用采用并行编程模式,而目前多核处理器系统通常采用私有的TLB结构。根据程序的局部性原理,并行执行的多个线程会在多个处理器核上产生大量重复的TLB失效。鉴于此,本文提出了多核处理器上软件实现的共享二级TLB结构(Shared-SL2TLB),降低了各个处理器核内95%以上的TLB失效开销和几乎所有核间冗余的TLB失效的开销。本文对并行测试程序集PARSEC进行评估,结果表明在集成了Shared-SL2TLB结构的系统中其性能提升达7%。   3.为降低TLB失效率,本文在龙芯3号处理器上实现了静态可变页和动态可变页技术。静态可变页技术即HugeTLB技术,本文在采用龙芯处理器核的曙光服务器上,对该技术进行了评估。该技术减少了LINPACK测试程序中99%的TLB失效,使得系统整体性能提升了5%。本文设计实现的动态可变页系统,在保留的激进式超页分配策略和渐进式的超页延迟降解策略的基础上,提出了基于热点页面识别的超页提升策略。该策略通过统计页面访问的热度信息,有针对性地提升超页,降低了超页系统的开销,并源源不断地为系统提供超页。该系统与16KB页大小系统的性能相比有5%以上的性能提升,同时可变页系统可有效地提高内存利用率。
其他文献
随着计算机体系结构的不断发展,新的处理器会在旧处理器的基础上增加新功能或使用新的处理器体系结构来提高处理器性能。这些新的体系结构特征为应用程序提供了更多的优化机会
移动IPv6作为下一代网络建设的重要组成部分,为用户提供了强大的移动通信支持,已经成为当前网络研究中的一个热点。随着手机、手提电脑等便携式移动通信终端设备的广泛应用,
无线定位技术是各种基于位置服务的基础。目前大多数基于射频信号强度匹配定位算法均采用信号不随时间变化的静态射频指纹(Radio Map)模型,或未有效利用目标连续运动信息,从而
随着数字化技术的发展和三网融合的加剧,IPTV技术正在得到广泛的应用。TS流技术作为IPTV中的关键技术之一,也得到了越来越多的关注,所谓TS流是根据ITU-T Rec H220.ISO/IEC DI
随着电子商务在世界范围内应用的日益广泛,网上交易的数据安全等课题已经成为电子商务领域的重要组成部分。安全套接层协议SSL是Internet上使用最为广泛的进行保密通信的安全
伴随着经济的发展,科学技术的进步及生活水平的不断提高,人们对健康、保健的追求,使得中国的医疗体系发生着巨大的改变。传统意义上的医疗模式是建立在以医院为中心的基础上,而现
视频监控技术一直是人们关注的热点之一,随着网络和计算机的普及,监控探头大量出现在住宅区、公路、银行等场所,为人们的财产安全保驾护航,为公安机关侦破案件提供重要的线索
网页已经成为人们在工作和生活中必不可少的工具之一。除了向用户提供信息之外,网页还担负着用户和互联网之间的交互任务,是用户访问互联网的最主要的接口。在愈来愈强调用户
随着汉语自然语言处理任务的不断深入,汉语句子研究也逐步从句法层面,进入到了语义层面,汉语句子的句法语义分析逐渐成为汉语自然语言处理过程中一个重要的任务。经过多年发
无线Mesh网络(Wireless Mesh Network)简称WMN,是一种具有自组织多跳特性的宽带无线网络。在无线Mesh网络中,任何无线设备都可以同时作为AP和路由器,网络中的每个节点都可以