面向处理器解析模型的Trace分析方法优化

来源 :东南大学 | 被引量 : 0次 | 上传用户：sgrsrg

【摘要】

：

【作者】

：

赵彬

【出处】

：

东南大学

【发表日期】

：

2019年01期

【关键词】

：

处理器解析模型重排序缓存指令窗口逐步回归神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在CPI栈理论的处理器性能解析模型中,稳态吞吐率模型和访存并发度模型需要基于滑动指令窗口的分析方法。现阶段无论是基于单指令还是整窗口的滑动策略都是以重排序缓存(Reorder Buffer,ROB)的大小作为指令窗口的大小来进行的。然而根据本文的实验观测,ROB在绝大多数时间都处于较低水平的充满状态。因此,以ROB大小作为指令窗口大小本质上是一种近似,这会对后续的稳态吞吐率模型和访存并发度模型精度产生一定的误差。本文通过实验分析了影响ROB充满情况的各种因素,包括ROB大小、IQ、Cache、物理寄存器、前端宽度、后端执行单元数目等硬件参数和软件负载特征,并从处理器的内部机制出发分析解读了实验数据。随后基于线性和非线性两方面建立起评估ROB充满情况的经验模型,在线性方面,第一步是通过斯皮尔曼分析进行降维,使得与因变量不相关的自变量得以剔除。第二步是通过逐步回归剔除掉与因变量虽然相关但不显著的自变量,线性回归模型揭示了不同软硬件参数对有效ROB的正负相关性及影响权重。而在非线性方面,主要是基于BP神经网络训练模型,本文通过对各种结构组合的神经网络在自应用预测上的误差对比最终选定隐含层18个节点,激励函数tansig,训练方法traingd为最佳组合。本文采用了14个来自SPEC 2006中的基准测试程序验证了有效ROB模型及其对CPI栈理论模型的精度提升。在有效ROB预测模型的误差方面,基于线性的逐步回归模型在自应用、自应用跨硬件配置和跨应用跨硬件配置上的预测平均误差分别为8.81%、8.94%和9.33%。而基于非线性的神经网络模型在自应用、自应用跨硬件配置和跨应用跨硬件配置上的预测平均误差分别为6.71%、7.41%和8.21%。神经网络模型相比逐步回归模型在预测误差上并无显著减少但训练耗时却高出三个数量级。因此,本文选定逐步回归模型为预测有效ROB的最终模型。以逐步回归模型预测得到的有效ROB代替默认ROB作为窗口大小进行Trace分析,分别实现了稳态吞吐率模型、访存并发度模型和总CPI栈理论模型平均精度9.31%、2.78%和10.62%的提升。

其他文献

钢筋混凝土建筑结构中框架柱类构件的非弹性稳定性验算方法研究

对于任意一个可靠的结构体系而言,强度、刚度(或者说变形)和稳定性都是其需要满足的基本要求。在钢结构中,由于钢材具有强度高、韧性好、材质均匀且力学性能接近理想弹塑性等

学位

钢筋混凝土框架柱类构件非弹性动力反应分析非线性有限元模拟计算长度稳定性验算

准无衍射超振荡光学透镜研究

无衍射光束的中心光斑尺寸不随传播距离的增加而改变,同时具有极高的中心光强以及自重建效应等特性。实现理想的无衍射光束需要无限大的能量,在实验中只能获得准无衍射光束。

学位

准无衍射超振荡光学透镜归一化角谱压缩超分辨聚焦

助孕方配合来曲唑治疗PCOS排卵障碍性不孕的临床观察

目的:本研究对肾阳虚证PCOS排卵障碍性不孕患者运用助孕方配合来曲唑治疗,与单纯运用来曲唑组进行分析比较,观察助孕方配合来曲唑治疗本病的临床疗效,以期为本病的治疗探索有

学位

PCOS排卵障碍性不孕助孕方来曲唑临床观察

传统针刺法加刺膈俞穴治疗老年性失眠的临床观察

目的:观察“传统针刺方法加刺膈俞穴”治疗老年性失眠的有效性,并观察其疗效是否优于传统针刺方法。方法:运用随机分组的方法将老年失眠患者60例分为两组,即治疗组与对照组,

学位

膈俞老年性失眠针刺慢性失眠症

基于磁力等效理论的扭矩传感技术研究

扭矩作为最能够反映一个系统性能的物理量之一,无论是在汽车制造领域还是在航空航天领域以及铁路运输领域都扮演着重要的角色。扭矩既是旋转机械装置动力输出的重要指标之一,

学位

磁力等效扭矩检测热力学平衡有限元仿真matlab仿真

P2P网贷市场投资者羊群行为的分析

P2P(Peer-to-Peer)网络借贷是一种资金借贷双方在没有金融中介机构参与的情况下直接进行借贷活动的新兴市场,是互联网金融快速发展的产物。由于P2P网络借贷具有门槛低、操作

学位

P2P网络借贷信息不对称羊群行为

稀疏阵列下抗噪鲁棒性分级的频率和波达方向联合估计

入射信号的频率和波达方向在雷达、无线通信系统、电子战等被动目标感知领域中是至关重要的两个物理参量。并且这两个物理量的估计困难程度会随着入射信号频率的升高而逐步增

学位

欠采样波达方向估计频率估计抗噪鲁棒性互素松弛阵列

钢-再生细骨料混凝土连续组合板长期性能计算方法研究

压型钢板的传湿隔绝作用使组合板中的湿度单向传导,收缩应变沿截面高度分布不均匀,产生附加曲率,从而增大板件长期挠度与压型钢板长期应力;还会显著增大连续组合板负弯矩区弯

学位

组合板再生细骨料非均匀收缩裂缝宽度设计方法

利率期限结构对商业银行盈利能力的影响

近年来我国宏观经济金融环境发生改变,以货币供应量为中间目标的数量型货币政策已渐渐失效,货币政策正在向以利率为中间目标的价格型调控方式转型。然而,该转型仍然任重道远

学位

货币政策价格型调控工具利率传导机制利率期限结构商业银行净息差

电磁轨道炮枢轨磨损特性分析

在电磁轨道炮发射过程中,枢轨相对运动产生的摩擦磨损会引起接触表面材料的缺失,造成枢轨间的接触压力不足,从而导致接触表面起弧现象甚至发生转捩。并且,随着电磁轨道炮技术

学位

电磁轨道炮摩擦磨损接触压力磨损体积口径

面向处理器解析模型的Trace分析方法优化

其他学术论文