EDGE体系结构指令动态映射算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:sima1969
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
乱序超标量处理器中广泛存在的集总式结构已严重限制微处理器性能的提升。EDGE(Explicit Data Graph Execution)作为应对微处理器性能提升瓶颈的模型之一,从结构模型中摒弃了超标量中能耗大不易扩展的集总式结构。在分布式EDGE结构中,指令映射到多个分片上同时执行。分片之间操作数传递需要延时从而导致性能下降。指令映射算法通过仔细权衡程序的并行度和分片间通信延时来试图消除分片后带来的性能损失。TRIPS微处理器采用关键资源拓扑结构不对称分布和静态指令映射算法(SPDI, Static Placement Dynamic Issue)。这会导致ET(Execute Tile)上较大的负载不均衡和操作数网络通信热点,从而引起IPC下降。本文在M5-EDGE模拟器中实现与TRIPS类似的EDGE结构,以此来研究指令动态Deep映射算法。在缺乏编译器调度下,采用循环映射方式的Deep算法在发射宽度为1和2时IPC分别为SPDI的85%和98.3%。针对RT(Register Tile)和DT(Data-cache Tile)的拓扑位置,对Deep映射进行三种优化:依照ET编号顺序、“之”字形顺序和计算甚块全局通信跳步数之和来优先选择ET。在发射宽度为1时三种优化与基本的Deep算法相比平均跳步分别减少2.63%、2.18%和4.70%,而IPC分别提升1.07%、1.21%和2.11%。这说明在Deep映射下优化指令间通信跳步数能显著提高IPC。在Deep映射算法中,90%以上的操作数通过操作数旁路来传递,大大减少操作数网络的负载。在bypass宽度为2倍发射宽度时,本地的操作数传递延时几乎下降为0。增加本地bypass宽度,能有效的减少操作数传递的延时。将RT按编号分配到ET上,基本Deep映射算法的IPC提升1.77%。针对DT位置进行优化,优先选择靠近DT的ET和计算甚块通信跳数之和选择ET。这两种优化比基本Deep映射IPC分别提升1.17%和1.89%。将RT和DT平铺到ET中形成4x4的拓扑结构。在发射宽度为1和2时该结构中Deep映射的IPC分别为SPDI的97.18%和113.42%。计算跳步数选择ET,这一比值为97.32%和114.06%。微结构变化导致拓扑距离变小或者Deep映射算法优化通信跳步数时,能显著提高系统IPC。
其他文献
  谷氨酸(GLU)是海马最主要的兴奋性神经递质。GLU通过其受体,引发一系列的生物化学级联反应,对海马有着重要且复杂的作用。CRH与海马神经元上谷氨酸介导的诸多重要的生理和
海洋是一个非常大的碳库,是全球碳循环至关重要的纽带,它在大气圈、水圈、生物圈和岩石圈之间碳的交换流动过程中占主导地位。海水中溶存着大量的碳化合物,其中绝大部分是无机碳
微球谐振腔由于其独特的回音壁模式而具有很高的品质因数,受到了越来越多的关注,并日益广泛地应用在传感与测试领域。本文从微球腔的耦合特性出发,对高Q微球腔的光学特性及非线
目的 对美洛昔康对类风湿关节炎的治疗效果进行研究.方法 选取2017年1月-2019年1月某基层卫生院30例类风湿关节炎患者,按照随机分组方式将其分为实验组(n=15)和对照组(n=15)
目的 分析在老年急性支气管哮喘患者的治疗中合用孟鲁司特及布地奈德的治疗效果以及对嗜酸粒细胞免疫功能的具体影响.方法 对照组应用布地奈德行吸入治疗,观察组加用孟鲁司特
目的 分析达美康与二甲双胍对2型糖尿病临床治疗效果及生活质量的影响.方法 选择我院内分泌科于2016年2月至2017年4月期间收治的122名2型糖尿病患者为研究对象,分为对照组(61
本文通过对荣华二采区10
期刊
随着无线通信技术和微电子技术的高速发展,无线传感器网络引起了广泛的关注。符合IEEE802.15.4标准的Zigbee无线收发机主要针对短距离、低速率和低功耗的无线传感器网络应用。
目的 分析治疗冠心病心力衰竭应用美托洛尔和曲美他嗪临床治疗效果.方法 此次实验对象为70例冠心病心力衰竭患者,研究时间在2018年4月-2019年6月,患者被分为参照组和治疗组,
目的 甲状腺化患者在术后需要进行镇痛处理,本分分析患者术后应用芬太尼静脉镇痛的具体效果.方法 参与此次研究的82例患者全部为甲状腺患者,这些患者在2016-2018年间就诊于我