【摘 要】
:
内存系统性能存在不确定性.内存系统带宽压力较大时,内存系统排队延迟占据访存延迟绝大部分.内存系统排队延迟取决于访存请求到达速率和内存命令处理速率.内存命令处理速率是影响内存系统性能的关键因素.为从理论上分析内存系统结构特性和应用程序访存特性对内存系统性能的影响,简化内存系统性能分析过程,帮助系统结构设计者发现内存系统的性能瓶颈所在,提出一种基于排队论的内存系统模型.结合内存芯片结构特性,该内存系统
【机 构】
:
先进计算机系统实验室 北京100190 计算机体系结构国家重点实验室 北京100190
【出 处】
:
第十七届计算机工程与工艺年会暨第三届微处理器技术论坛
论文部分内容阅读
内存系统性能存在不确定性.内存系统带宽压力较大时,内存系统排队延迟占据访存延迟绝大部分.内存系统排队延迟取决于访存请求到达速率和内存命令处理速率.内存命令处理速率是影响内存系统性能的关键因素.为从理论上分析内存系统结构特性和应用程序访存特性对内存系统性能的影响,简化内存系统性能分析过程,帮助系统结构设计者发现内存系统的性能瓶颈所在,提出一种基于排队论的内存系统模型.结合内存芯片结构特性,该内存系统模型将应用程序访存特性按照带宽需求、页命中率、读写切换率和Bank级并行性进行分类.经在受限随机平台和多核处理器平台上验证,该模型有较高的精确度.根据模型分析结果,提出一系列内存系统优化策略,并应用于多核处理器的内存系统设计.
其他文献
如何加强消防设施的有效管理,提高消防设施的完好率、合格率,笔者分析了火灾自动报警系统控制设备的现状,提出了在消防控制室的火灾报警控制器上完善消防监管功能、显示自动消防设备(设施)动态信息和管理信息的建议,介绍了采用技术方法来解决消防管理中出现的问题、在现有消防监控设备基础上实现对消防电源、消防水泵、消防水箱(池)水位、管网压力以及防排烟风机等消防设备(设施)的动态信息和管理信息监管功能的一些具体做
本文以一起车辆火灾事故的调查为例,以火灾现场勘验为重点,分析了火灾发生的条件,认定了火灾原因,对如何预防汽车火灾提出了建议.运用科学方法和技术手段,对与火灾有关的场所、物品等进行勘查、验证,查找、检验、鉴别和提取物证是火灾现场勘验的基本内容;发现、收集与火灾事实有关的证据、调查线索和其他信息,分析火灾发生及发展过程是火灾认定关键所在;现场保护、实地勘验、现场询问、物证提取、现场分析、现场处理,根据
本文研究了铜导体外观和金相组织结构受火灾现场环境温度和受热时间的影响.环境温度越高,铜导线表面附着的氧化层越厚,铜导线金相组织结构中平均晶粒度越大.受热时间和线径大小对晶粒度影响不大,平均晶粒度可大致判断铜导线在火灾现场中所承受的温度,有利于判断火灾的蔓延方向.
本文实现了一种基于异步FIFO结构的外设接口模块.该模块使用异步FIFO接收高频时钟域发送的读/写请求,同时向处于低频时钟域的PCIe控制器逐个发送读/写命令,在此过程中实现系统总线协议向DBI总线协议的转换.模拟结果表明,该模块能有效地实现PCIe控制器和系统内核两个不同时钟域之间数据的可靠交换,满足PCIe链路与系统内核互连的需求.
随着工艺技术的进步,如何降低功耗已经成为当前设计的关键.本文针对时钟树综合阶段从降低负载电容角度分别探讨了时钟树构建单元的选择及时钟网络拓扑结构的优化两种不同的设计方案.通过采用混合构建单元的使用与减小时钟树规模的思想对设计进行优化,实验结果表明本文的方法显著降低了整体功耗.
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程.在该MMU结构中,TLB采用三个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持一个较大的可扩展的48位物理寻址空间。虚实地址转换支持可配置的多种页面粒度,支持粗粒度为64KB和细粒度为4KB两种页面大小,并详细论述了四级页表转换过程,TLB结构组织等.该MMU结构将作为该处理器存储系统实现的一个重要组成部
目前SRAM为了达到高可靠性和高性能,普遍采用全定制设计方法.全定制模块的时序模型对后续物理设计至关重要,因此如何有效地建立SRAM宏模块的时序模型以及准确提出LIB文件至关重要.针对某尺寸SRAM模块介绍了建立全定制SRAM宏模块时序模型的方法以及基于NanoSim BDC模拟工具采用二分法思想设计的时序库文件提取方法.同时对提取出来的LIB视图数据与采用NanoSim工具自身模拟出来的数据通过
在云计算的快速发展下,人们把更多的注意力放在大数据中心的可扩展性上.这些数据中心为了获得较好的性能和可靠性以及空间占用率大部分采用了RAID技术,尤其是RAID5.然而,RAID5存储系统面临的一个重要挑战就是如何快速地添加和移除固态硬盘以满足数据规模不断变化的要求.之前的RAID扩展方法或者需要迁移很多数据,或者不能容忍添加多个盘时带来的负载不均衡.本文提出一种基于parity动态重分布的RAI
不同于以往高斯尺度空间或近似高斯尺度空间,本文基于加性分裂算子快速创建非线性尺度空间,在图像细节信息保持性能上有所提高.利用Bhattacharyya系数描述两个有向梯度直方图分布的相似性,提取图像局部特征点.该算法表现出很好的旋转不变性、抗光照变化和抗模糊性.和SIFF和SURF相比,本文提出的算法在重复性和显著性均有较大提升.
传统的系统级调试与验证的方法,是以软硬件联合的FPGA原型验证,但是长期以来该方法一直存在错误定位困难、源代码修改不便与验证迭代周期长等不足.为了改善FPGA原型验证的以上缺点,本文设计并实现了一种基于PLI技术的系统级验证方法.采用PLI接口连接调试软件与硬件仿真环境,通过共享内存机制实现不同进程间的通信,最终达到对芯片系统级调试、验证以及RTL代码维护等目的.对于多核处理器,同样可以采用这一接