面向能耗优化的指令片上存储器动态布局策略研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:laopoxqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着集成电路设计进入深亚微米和纳米级工艺阶段,SoC(System on Chip)的能耗问题日益严重,已经成为制约SoC发展的主要因素之一。作为SoC能耗、性能和成本的主要瓶颈,存储子系统设计一直是SoC研究的热点。业界通常采用高速片上存储器弥补片外存储器和内核的速度差,并降低系统能耗。片上存储器一般包括高速缓冲存储器(Cache)和便签存储器(Scratch-Pad Memory,以下简称SPM)等,两者各具优势且存在互补性,因此Cache/SPM共存的架构逐渐成为趋势。   本文借助虚拟内存管理的思想,实现了一种基于内存管理单元(MMU)管理的、Cache和SPM共存的片上存储器机制,并对程序指令部分的动态布局优化策略进行研究。为了充分利用程序的时间局部性,本文提出时隙管理的方法,将程序执行过程分成若干时隙,并根据不同时隙中指令Cache的命中次数、缺失次数以及指令页的搬运成本等,建立系统能耗模型。以系统能耗模型为基础,本文以系统能耗作为目标函数,将其抽象为非线性最优化的数学问题,利用整数非线性规划对其进行求解,获得每个时隙内最有优化价值的指令页。借助虚存管理机制,在每个时隙开始时利用定时器中断处理程序,将本时隙中有优化价值的指令页通过直接存储器访问(DMA)搬运到SPM中,并修改页表项完成SPM缓冲地址空间的重映射,最终实现对程序指令段的动态优化。   本文依据上述设计对多个基准测试程序在不同的片上存储器配置下的优化进行了分析和对比。实验结果表明,采用本文的优化策略,使用4K Bytes直接关联Cache和8K Bytes SPM对程序指令段进行优化,相比16K Bytes四路组关联的Cache,芯片面积降低l9.0%:系统能耗平均降低l1.2%,最高降低22.3%。同时,系统性能有明显提升:程序执行时间平均降低14.4%,最高降低25.6%。
其他文献
“研究性学习”是学生在老师指导下,在学科领域或现实生活情境中,通过学生自主探究式的学习研究活动,在摄取已有知识或经验的基础上,经过同化、组合和探究,获得新的知识、能力和态
稀土基硼酸盐荧光粉是最近的研究热点,它可以克服稀土掺杂荧光粉浓度淬灭的问题,并且硼酸盐具有原料便宜,合成温度低,物化性质稳定等优点。本文研究了用近紫外-紫外激发的不同稀土基硼酸盐CeZn_(1-x)(B_5O_(10)):xMn~(2+)荧光粉、TbZn_(1-x)(B_5O_(10)):xMn~(2+)荧光粉和Tb_(1-x)Zn(B_5O_(10)):xYb~(3+)荧光粉的发光性能。(1)采
磁粉检测作为工业无损检测中的一种重要检测手段,在工业领域中被广泛应用。那么磁粉探伤设备作为磁粉检测的主要工具,其发展水平直接制约着磁粉检测行业整体发展水平。由于工业
学位
中国画里,我偏爱山水画,尤其是董源以来的南派山水。因为偏爱,老是怕别人看不懂进而看不起,这些柔山弱水文人羸士,每看之下,冷清寡淡,几乎大同小异,无甚新意——这样小看别人
近年来提高阅读照明的质量,为人们提供舒适、护眼的照明条件成为照明产品设计的重点,而基于人眼视觉感知的照明质量评价已是提高现有照明系统设施的新研究热点。论文设计了两
宿迁市振北桑蚕养殖专业合作社成立于2016 年7 月,注册资金100 万元,现有成员13 户.合作社主要从事桑蚕养殖及青年鸡养殖,每年可养殖桑蚕700 张,出栏2 个月龄青年鸡15 万羽,
期刊
学位
针对当今安检领域的新要求,利用CT技术在爆炸物检测中的优势,CT式行李安检系统的研究将具有重大意义。本文主要针对CT式行李安检系统射束硬化校正和扇形束滤波反投影重建展开了
玉米是我国重要的粮食与经济作物,田间杂草严重危害玉米的生长,抗草甘膦玉米的研发成功为解决玉米生产中的杂草危害提供了一条行之有效的途径。本论文通过测定和比较转aroA CC-M耐草甘膦玉米以及3种非转基因玉米(郑58、HZ77和HZ340)在生长20天、40天、60大时,玉米叶片以及成熟玉米籽粒中多种营养成分的含量,得出以下结论:通过单因素与正交实验,得出玉米中多酚的最佳提取条件为:乙醇浓度为70%
本论文以我国自主研发获得的转Bt-mCry1Ac基因抗虫玉米Bt-799及其非转基因近等基因系郑58为研究材料,利用ELISA法对外源抗虫基因Bt-mCry1Ac在玉米生育期内的表达规律进行研究