【摘 要】
:
为了应对超级计算机单节点内高并行性带来的通信瓶颈问题,本文提出了一种称之为同步引擎的硬件设计来支持和加速并行应用中常见的同步通信模式。该同步引擎可以有效地支持和加
【机 构】
:
中国科学院计算技术研究所 北京100190
【出 处】
:
第十五届计算机工程与工艺年会暨第一届微处理器技术论坛
论文部分内容阅读
为了应对超级计算机单节点内高并行性带来的通信瓶颈问题,本文提出了一种称之为同步引擎的硬件设计来支持和加速并行应用中常见的同步通信模式。该同步引擎可以有效地支持和加速计算节点内多个任务之间频繁的小数据量传输(细粒度同步)以及计算节点内和节点间的Barrier、All-reduce集合操作,进而加速并行应用的性能。测试结果表明,在16进程规模下的集合操作测试中,同步引擎相比传统的软件实现有约4倍加速,在三角矩阵分解测试程序中可以获得约20%的性能提升。
其他文献
肺癌对人类健康的威胁日益严重,其发病率和死亡率大幅度上升,仅25%~ 30%的患者就诊时适宜手术,术后患者的5年生存率仅为35%~50%,其中Ⅱ和ⅢA期分别为30%~40%和20%~25%.70%~75%的不可手术的肺
目的 探讨≥50岁人群髋骨骨折影响因素,为后续预防措施的制定和实施提供参考依据.方法 以2016-2017年郑州市某医院骨科就诊的髋骨骨折患者为研究对象(病例组),按同性别、年龄
1999年3月我退休时,糖尿病已困扰了我20年,由于治疗不及时,身体每况愈下,想吃不能吃,想玩走不动,想看眼发花,想睡睡不着,天天是药不离身。俗话说:“活动活动,要活就要动。”退休后,我下决心锻炼
目的探讨非激素依赖性乳腺癌的临床病理特征及预后相关因素。方法收集213例1999年1月至2006年12月术前未接受任何治疗的ER、PR阴性乳腺癌患者的临床、病理资料,随访追踪患者
三维集成电路技术可以有效地解决深亚微米芯片设计中互联延迟问题,cache设计中存在大量的全局互联连线。目前已经提出了多种三维cache结构,本文在已有的工作基础上,提出了一种新
女性从月经出算开始到绝经期为止都可以受孕,但是从初潮到省之气基本发育成熟一般是13-18岁。这个阶段由于生殖器官尚未完全发育成熟,排卵仍不规律,因此受孕的机率会小一些,
目的 研究海口市琼山区老年女性骨质疏松发生的影响因素.方法 以2018年10月至2019年9月海口市琼山区≥60岁女性体检人群中检出骨质疏松者作为观察组,按年龄±0.5岁1∶1选择同
集成电路工艺已经发展到纳米量级,在纳米级工艺下,芯片集成度不断提高,电压不断降低,软错误问题已经开始对地面的集成电路产生影响。与此同时,晶体管的氧化层随着特征尺寸的降低而
Meta分析是一种对多研究结果合并的统计方法.随着近年来R语言这一开源免费软件的兴起,得益于其强大的拓展性,只需加载相关程序包即可实现meta分析功能,且编程语法简单灵活,功
肺癌是全球范围内肿瘤最主要的死因之一.手术是可切除早期非小细胞肺癌的唯一可治愈治疗手段.但是,由于术前已有潜在的转移灶和微小转移灶、术中病灶切除不彻底、术后患者机