BOOOST:基于代码块乱序执行的投机多线程架构及其线程间数据通信研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:xuan1911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机体系结构发展至今,多核处理器已经得到广泛应用,而且单个芯片内的核心数量还在快速增长。但与此同时,客户端系统(桌面系统和移动系统)一般应用程序的并行度却基本保持不变,近十年来没有增长。这就使得多核处理器的计算资源不能得到充分利用。本文的研究目标就是更好地解决这一矛盾。  投机多线程(SpMT)是一种自动并行化的技术,又称为线程级投机(TLS)。SpMT可以自动发掘程序中的线程级并行性(TLP),通过编译器或处理器硬件的支持将单个线程拆分为多个轻量级线程。本文首先提出一种基于代码块乱序执行的SpMT模型(称为BOOOST),并以代码块重排序缓存(Meta-RB)的方式实现了一个动态的代码块乱序执行框架。总体而言,跟现有SpMT模型相比,本文的模型可以达到更高的理论加速比。实验模拟显示,SPEC2006程序有的可以获得16核13倍、64核44倍的理论加速比,明显超过Multiscalar等现有的SpMT架构。  在研究中发现,SpMT的线程间数据依赖关系对整体性能影响很大,为了提高并行执行的效率,本文的研究重点就集中于优化线程间的数据通信。SpMT线程间的数据依赖分为寄存器读写依赖和内存读写依赖。本文针对SpMT线程间寄存器读写依赖和内存读写依赖,分别设计了一些解决方案。  寄存器的读写可以离线分析,因为寄存器编号是直接编码在指令中的。于是我们提出一种针对寄存器访问的“读写无冲突”的代码块调度策略(Conflict-FreeScheduling,即CFS),从而降低线程间读写依赖造成的开销,并设计了全局寄存器重命名表(Global Register Renaming Table,即GRRT)实现核间寄存器数据同步。研究表明,CFS一般可以提升20%左右的性能。为了降低核间数据同步,我们还提出了一种基于寄存器数据亲和性的代码块调度策略。实验证明这种调度策略可以降低5%~28%左右的核间数据同步,大约可以折算为0.7%~3.7%的整体性能提升。  内存读写地址一般只有在运行时才能确定,所以无法离线分析。我们提出一种支持投机读写的核间共享写缓存(Shared Write Buffer,即SWB)来解决内存数据读写依赖。实验证明,跟一般Cache架构相比,引入SWB可以减少20%左右的CacheSnooping开销,减少7%左右的访问延迟;我们还研究了多核处理器的cache组织方式,提出簇状层次型cache结构以优化核间数据同步效率。研究表明簇状层次型cache组织则比一般的平铺组织方式能降低几个数量级的核间通讯延迟。
其他文献
随着VOIP技术和多媒体技术的发展以及市场环境的变化,企业对呼叫中心客户服务体验的要求越来越高,单纯的语音已经不能满足客户对高质量信息交互的需求。在这种情况下,视频呼
人们在看一副图像时通常比较关心特定的区域,这些被关注的区域就是显著性的区域。本文重点研究了基于GABOR纹理特征的图像显著性以及视频显著性检测算法,图像显著性检测算法检
互联网成为人们获取信息的主要来源,主导着信息的交互模式。面对快速增长的网络信息资源,用户很难快速从中获得自己感兴趣的信息,搜索引擎的诞生在一定程度上很好地缓和了这
随着网络和通信技术的发展,多媒体应用越来越广泛和多样性。传统单播技术无法满足应用服务的发展,其带宽的利用率低、端到端的延迟增大等严重制约了迅速发展的多媒体应用。鉴
应急救援指挥系统是指在突发事故发生时,相关决策人员通过该系统能够快速地做出应急救援决策,完成对相关应急队伍和应急物资的调度,从而能够针对突发事故高效的完成应急救援活动
基于云计算平台的应用,能够处理海量数据,为用户提供更可靠更高效的服务,因而得到了快速发展。如何将视频监控系统与云计算平台结合起来,并能够可靠地保存海量视频数据,为海
情感状态不是孤立的,情感之间存在转移和依赖,其转移不仅受内在的、认知的方面的因素影响,而且与社会因素相关。对情感转化现象进行描述和建模,可以有效地帮助理解个人与公众的情
海洋雷达高度计主要应用于海洋参数测量,包括平均海面高度,海面后向散射系数,海面有效波高等。传统雷达高度计由于工作体制的限制,其测量精度已经到达极限,很难进一步提高,同时传统
四足机器人有很强的环境适应性和运动灵活性,是机器人研究一个非常活跃的领域。本文分别从高增益控制和柔顺性控制两个方面对四足机器人步态控制和步态变换算法的有效性和可行
分布式仿真技术利用已开发好的协议,将分散在不同地方的仿真应用联合起来形成一个仿真系统。基于HLA开发的仿真应用具有良好的可重用性和互操作性,目前的军事仿真大多使用HLA