EPIP并行微处理器指令Cache设计

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:huangxiaojie33
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机体系结构中,处理器存取速度一直比主存存储器快的多,使处理器的高速处理能力不能充分发挥,整个系统的工作效率受到影响,因此需要设计高速缓冲存储器(Cache)以解决速度匹配的问题。Cache中的SRAM读取速度一般要比主存储器(DRAM)快3~4倍。根据时间局部性和空间局部性原理,Cache可以极大地提高处理器的效率。本文的主要工作是设计应用于32位并行处理器EPIP中的多线程非阻塞指令Cache。首先分析了多线程非阻塞Cache的处理器需求,然后提出其时序要求和一种实现方案,利用SystemVerilog对该方案进行RTL级建模并使用OVM库建立验证环境进行性能评估。为了实现高性能的设计要求,优化了多种设计结构。使用Cache缓冲表和线程请求顺序表两种硬件结构满足非阻塞和多线程返回数据顺序的要求;为了提高Cache的命中率,采用多路组相联映像方式;在替换策略上,采用LRU(LeastRecently Used),最近最少使用算法;为了提高虚拟地址向物理地址转换的效率,增加了地址查找缓冲结构;支持高速缓存的撤销请求,当对应线程撤销请求有效时,高速缓存停止发送撤销信号有效前所有数据;为更好利用程序的空间局部性原理,提高高速缓存的命中率,增加外部数据请求的预取。通过验证比较,设计的指令Cache支持最大阻塞长度为8个数据请求,最短返回周期为5个时钟周期,内含32KB的SRAM,使用SMIC0.18um工艺综合后的最大工作时钟频率为250MHz,等效逻辑门300K,核心工功耗约92mW,芯片面积为3mm2,可满足大多数支持多线程和超前执行处理器的需求。
其他文献
我是《常州日报》的通讯员,又是特约评报员。最近,围绕着怎样搞好市、县报的新闻改革,在家乡农村——漂阳县前马乡西芮村召开了一次农民、教师评论《常州日报》座谈会。现将
言论配新闻,这或许是天经地义的办报“经验”。其实,一味去“配”,往往使版面呆板而缺乏生气,且因言论常常“配”不上而被冷落。许多小言论提出问题,观点鲜明、见解透彻,针
空气重介流化床(Air Dense Medium Fluidized Bed, ADMFB)干法选煤技术是将流态化技术应用于选煤的一种高效干法分选技术,相比传统湿法选煤方法有很多优点,为煤炭分选开辟了
有人重视写作,认为只要有一支生花妙笔,就能写出精彩的报道来;有人则注重采访,认为七分靠采,三分靠写。对第一种见解我不敢苟同;第二种,觉得它是对的,但似乎又不尽然,尚缺少
提升设备担负着连通地面和矿井的重要任务,是煤矿生产的大型机电设备。在煤矿生产中,提升机运行的安全性和可靠性很重要。而目前由于提升容器位置跟踪定位的不准确而造成的事故
全国减轻农民负担工作电视电话会议提出,当前和今后一个时期,要重点抓好以下9项工作.
伴随着强大的图像编辑软件被日益广泛地普及应用与数字化技术发展的日趋成熟,普通的计算机用户可以轻松地修改数字图像内容,且不留明显痕迹。这类编辑软件虽然在生活上能给我们
自组织网络是一个由多个节点组成的分组多跳的无线网络,该网络具有自组织,分布式,自适应以及自愈能力等特征。节点由电池供电和相邻节点共享无线信道的特性决定了能量和带宽是自
纵观世界航天大国,在享受航天科技带来巨大社会和经济效益的同时,也面临一个挑战,即制定的航天发展战略如何与国家、社会需求和经济财力保持协调。航天工业军、民、商综合发展,适
高速船自动驾控模拟系统数据库是高速船驾控模拟系统的重要组成部分,针对高速船自动驾控模拟系统数据库构建和管理进行了研究,能够对学员进行训练时产生的大量数据进行存储和管