论文部分内容阅读
近年来,处理器内核的工作频率及处理器内部指令执行并行度的不断增加,使单位时间内处理器内核的访存频度不断增加,导致处理器对访存效率的要求也越来越高。然而,与处理器性能提高的速度相比,内存设备工作效率提高的速度相当缓慢。目前,内存访问的较长延时和较低带宽已经成为制约计算机系统性能提高的主要因素,因此,对控制内存设备的存储控制系统进行性能优化方面的研究是非常有意义的。本文从减少系统访存延时和增加系统访存带宽的角度出发,结合龙芯2号处理器运行SPEC CPU2000测试程序时的内存访问行为,系统地研究了存储控制系统的性能优化技术。本文的主要贡献及创新点如下:1.利用现代内存设备所支持的访问模式(Close page模式/Open page模式)以及内存设备中多个存储体(bank)可以并发访问的特性,结合龙芯2号处理器运行SPEC CPU2000测试程序时的内存访问行为特征,提出了一种基于存储体访问历史表的动态内存设备page管理策略以提高内存设备的访问效率。2.提出了一种在存储控制系统中实现的预取结构。该预取电路基于stream buffer预取技术,结合龙芯2号处理器运行SPEC CPU2000测试程序时的内存访问行为特征来对访存stream进行定位。为了减少预取操作对系统有效访存带宽的负面影响,在预取电路中利用动态page管理电路所提供的内存设备page状态信息对预取操作的发起时机进行了管理。3.结合目前龙芯2号处理器系统总线的相关特征,提出了一种在存储控制系统内部实现的写缓存技术以提高系统的有效访存带宽。4.提出了一种基于Split transaction技术并且与目前龙芯2号处理器系统总线协议相结合的系统总线传输协议。在改进的系统总线传输协议中,通过简洁的握手机制保证了系统总线上多个读操作所对应的命令与数据被分离交叠地传输。论文对上述优化策略进行了大量的实验和测试。实验结果表明:动态page管理策略、预取技术以及写缓存技术结合在一起,可使龙芯2号处理器的有效访存带宽提高近一倍,并且使龙芯2号处理器运行SPEC CPU2000测试程序时的平均IPC(Instructions per Cycle)提高10%以上;改进的系统总线传输协议使得系统有效访存带宽得到明显的提高;另外,在改进总线传输协议的基础上,本文所提出的存储控制系统性能优化技术依然能够使得处理器的IPC提高10%左右。上述实验结果说明:本文所提出的存储控制系统性能优化技术对系统访存性能的提高是相当明显的。