基于软件访存Trace的下游Cache行为解析建模

来源 :东南大学 | 被引量 : 0次 | 上传用户:yaya_tush
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现代处理器设计中,为了缓解中央处理器(CPU)和内存之间的访问速度差距,多层级高速缓存(Cache)被引入到系统中。因此,对于Cache性能的评估在系统设计的过程中变得越来越重要。本文提出一套解析模型,可以快速评估下游Cache(Downstream Cache)的缺失率。由于该模型不需要对L1级Cache进行时钟精确型仿真,提高了存储子系统解析模型的评估效率。本文提出两种新型的指标参数用于描述软件的访存特征——重用距离-堆栈距离转换表(RST),重用区间命中/缺失概率分布(Hit RDH)。RST能够用于描述软件访存中重用距离和堆栈距离之间的关系;而Hit RDH可以用于描述在某一确定的重用区间长度内,L1级Cache命中的访存个数。通过RST和Hit RDH构建解析模型,预测下游Cache的距离分布。借助Stat Stack和Stat Cache模型,本文提出的模型能够快速预测下游Cache的缺失率;借助Stat CC,本文还可以将预测从L1级数据Cache和L1级指令Cache出来的重用距离分布进行合并,从而推测出进入L2级Cache的重用距离分布。本文采用了15个和9个分别来自SPEC CPU 2006和SPEC CPU 2017的基准测试程序来验证多层级Cache模型。与Gem5时钟精确型仿真结果相比,本文所提出的模型对于L2级Cache缺失率评估的绝对误差最大为9%,平均误差在4%。由于一次访存信息的提取在L1级Cache配置不变的情况下,可以被多种不同配置的L2级Cache架构使用,平均评估时间降低。针对四个不同的L2 Cache配置,本文所提出的方法可以使评估速度提升30倍左右。
其他文献
近年来,随着信息交互过程中数据安全问题的出现,设备指纹识别技术开始被应用。仲裁器物理不可克隆函数(Arbiter Physically Unclonable Functions,APUFs)利用IC制造过程中不同工艺偏差对逻辑门传输速率的影响,为每个芯片产生特定的“芯片指纹”,主要应用于芯片身份识别、设备认证等领域。由于现场可编程门阵列(Field Programmable Gate Array,
随着物联网技术的快速发展,信息加密技术显得越来越重要。信息加密通过软件或硬件实现,基于硬件实现的密码芯片具有速度快,功耗低的优势,已成为研究热点。然而基于硬件实现的密码芯片易受到功耗分析攻击等侧信道攻击,它是一种非侵入式攻击,攻击者通过获取大量密码设备在加、解密操作时泄露的功耗信息分析出密钥信息。本文研究了高级加密标准(AES)算法的功耗分析攻击和抗功耗分析攻击方案。为了提高侧信道攻击的效率,降低
5G技术与物联网技术的发展使得低功耗无线收发系统成为研究的热点,而射频接收前端作为射频接收链路中的关键模块,其性能在很大程度上决定了整个射频接收链路的性能,且其同样也是主要的耗能模块。因此,在保证射频接收前端性能的前提下降低其功耗至关重要,具有重要的科研价值与工程意义。本文设计了一款面向IoT的低功耗射频接收前端,在实现了低功耗设计的同时得到了低的噪声系数与高的转换增益,确保射频接收机高灵敏度的实
窄带物联网(NB-IoT)技术作为物联网系统中的一个最重要研究方向,受到人们越来越多的关注。NB-IoT的核心功能由3GPP R13标准定义,在之后的升级版本中进行了补充。通过软件仿真,可在实际部署系统之前对相关协议与算法进行验证和性能评估,提前发现问题并解决。本文基于3GPP R13标准,针对NB-IoT系统的协议栈进行软件仿真平台研究与实现。本文首先对NB-IoT系统进行概述,对数据在NB-I
近年来,人工智能越来越受到关注,为了使人们的生活更加便利,各种智能设备应运而生,未来智能设备的市场很大,社会对于物联网设备的需求也将急剧增加。在用于物联网的各种通信技术中,窄带物联网(NB-IoT)以其大连接、广覆盖等特点脱颖而出。NB-IoT是针对新型物联网业务提出的一种新的蜂窝网技术,继承自长期演进技术(LTE),与LTE有许多相似之处,但同时也有很大的不同。在NB-IoT中,随机接入是实现上
近年来,物联网技术的应用越来越广泛,而终端用户量巨大,多采用电池供电,长期更换电池会造成大量人力物力的浪费,所以,降低终端能耗迫在眉睫。本文依据3GPP中R13标准的相关规定,对窄带物联网NB-Io T低功耗技术进行研究。本文首先针对终端同时响应,造成信道堵塞且能耗浪费的问题,提出了基于分组的周期自适应调整的策略。各终端设备先按照各自的应用进行自动分类,系统按照所分类别配置相应的参数。设备随后通过
在经济全球化和市场经济竞争日趋激烈的背景下,前瞻的战略和强大的执行力已成为国有企业提升市场竞争力的关键。但目前一些国有企业在执行力动力方面、执行力领导方面、执行力行为方面等还存在不足,在执行管理中缺乏模型指导及信息技术的支持。本文针对目前一类国有企业执行力普遍存在的现状,设计和实现一个执行力管理系统。本文结合拉里博西迪典型的执行力模型和企业实际,设计了针对任务执行的执行力模型,确定了模型组成要素,
利用物理不可克隆函数(Physically Unclonable Functions,PUF),可以提取设备独有的安全信息,并作为物理指纹,用于安全认证等应用。PUF由于其可被实时读取,具备不可预测和不可克隆的特征,成为了近年来硬件信息安全领域的一个热门话题。其中动态随机存储器PUF(Dynamic Random Access Memory PUF,DRAM PUF)作为一种可应用于嵌入式设备的内
随着现代处理器集成晶体管数量的不断增加,处理器性能的进一步提高越来越受限于能耗与散热之间的矛盾。另一方面,对于采用电池供电的移动终端类应用和对能耗更加敏感的物联网应用,如何在满足性能需求的前提下尽可能的降低能耗已经成为设计者首先需要面对的挑战。为了降低系统的能耗以减缓上述矛盾,工业界和学术界将电路的工作电压向下延伸至近阈值附近。然而在近阈值低电压工作环境下,组成系统中高速缓存(Cache)的主体:
目前在各大运营商的运维管理系统中,带内(in-band)网管是最为常见的交换机管理方式。交换机之间通过裸光纤进行连接,网管信令和业务数据通过同一条通路经由不同的逻辑VLAN进行传输。如建设期规划不到位或设备数据配置不规范,容易造成设备脱离网管不可控,重则甚至导致广播风暴,设备业务中断。此外,传统的带内网管,对人力的依赖较高,增加了重复劳动。为了解决上述问题,本文主要完成了以下工作:(1)基于带外(