面向处理器解析模型的Trace分析方法优化

来源 :东南大学 | 被引量 : 0次 | 上传用户:sgrsrg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在CPI栈理论的处理器性能解析模型中,稳态吞吐率模型和访存并发度模型需要基于滑动指令窗口的分析方法。现阶段无论是基于单指令还是整窗口的滑动策略都是以重排序缓存(Reorder Buffer,ROB)的大小作为指令窗口的大小来进行的。然而根据本文的实验观测,ROB在绝大多数时间都处于较低水平的充满状态。因此,以ROB大小作为指令窗口大小本质上是一种近似,这会对后续的稳态吞吐率模型和访存并发度模型精度产生一定的误差。本文通过实验分析了影响ROB充满情况的各种因素,包括ROB大小、IQ、Cache、物理寄存器、前端宽度、后端执行单元数目等硬件参数和软件负载特征,并从处理器的内部机制出发分析解读了实验数据。随后基于线性和非线性两方面建立起评估ROB充满情况的经验模型,在线性方面,第一步是通过斯皮尔曼分析进行降维,使得与因变量不相关的自变量得以剔除。第二步是通过逐步回归剔除掉与因变量虽然相关但不显著的自变量,线性回归模型揭示了不同软硬件参数对有效ROB的正负相关性及影响权重。而在非线性方面,主要是基于BP神经网络训练模型,本文通过对各种结构组合的神经网络在自应用预测上的误差对比最终选定隐含层18个节点,激励函数tansig,训练方法traingd为最佳组合。本文采用了14个来自SPEC 2006中的基准测试程序验证了有效ROB模型及其对CPI栈理论模型的精度提升。在有效ROB预测模型的误差方面,基于线性的逐步回归模型在自应用、自应用跨硬件配置和跨应用跨硬件配置上的预测平均误差分别为8.81%、8.94%和9.33%。而基于非线性的神经网络模型在自应用、自应用跨硬件配置和跨应用跨硬件配置上的预测平均误差分别为6.71%、7.41%和8.21%。神经网络模型相比逐步回归模型在预测误差上并无显著减少但训练耗时却高出三个数量级。因此,本文选定逐步回归模型为预测有效ROB的最终模型。以逐步回归模型预测得到的有效ROB代替默认ROB作为窗口大小进行Trace分析,分别实现了稳态吞吐率模型、访存并发度模型和总CPI栈理论模型平均精度9.31%、2.78%和10.62%的提升。
其他文献
对于任意一个可靠的结构体系而言,强度、刚度(或者说变形)和稳定性都是其需要满足的基本要求。在钢结构中,由于钢材具有强度高、韧性好、材质均匀且力学性能接近理想弹塑性等
无衍射光束的中心光斑尺寸不随传播距离的增加而改变,同时具有极高的中心光强以及自重建效应等特性。实现理想的无衍射光束需要无限大的能量,在实验中只能获得准无衍射光束。
目的:本研究对肾阳虚证PCOS排卵障碍性不孕患者运用助孕方配合来曲唑治疗,与单纯运用来曲唑组进行分析比较,观察助孕方配合来曲唑治疗本病的临床疗效,以期为本病的治疗探索有
目的:观察“传统针刺方法加刺膈俞穴”治疗老年性失眠的有效性,并观察其疗效是否优于传统针刺方法。方法:运用随机分组的方法将老年失眠患者60例分为两组,即治疗组与对照组,
扭矩作为最能够反映一个系统性能的物理量之一,无论是在汽车制造领域还是在航空航天领域以及铁路运输领域都扮演着重要的角色。扭矩既是旋转机械装置动力输出的重要指标之一,
P2P(Peer-to-Peer)网络借贷是一种资金借贷双方在没有金融中介机构参与的情况下直接进行借贷活动的新兴市场,是互联网金融快速发展的产物。由于P2P网络借贷具有门槛低、操作
入射信号的频率和波达方向在雷达、无线通信系统、电子战等被动目标感知领域中是至关重要的两个物理参量。并且这两个物理量的估计困难程度会随着入射信号频率的升高而逐步增
压型钢板的传湿隔绝作用使组合板中的湿度单向传导,收缩应变沿截面高度分布不均匀,产生附加曲率,从而增大板件长期挠度与压型钢板长期应力;还会显著增大连续组合板负弯矩区弯
近年来我国宏观经济金融环境发生改变,以货币供应量为中间目标的数量型货币政策已渐渐失效,货币政策正在向以利率为中间目标的价格型调控方式转型。然而,该转型仍然任重道远
在电磁轨道炮发射过程中,枢轨相对运动产生的摩擦磨损会引起接触表面材料的缺失,造成枢轨间的接触压力不足,从而导致接触表面起弧现象甚至发生转捩。并且,随着电磁轨道炮技术