【摘 要】
:
针对手工优化GPU(Graphic Processing Unit)显存级数据复用过程复杂和编译时优化数据复用开销过大的问题,提出了一种基于动态生成树在运行时进行数据复用的优化方法,可为程序
【机 构】
:
西安交通大学电子与信息工程学院,浪潮集团高效能服务器和存储技术国家重点实验室
【基金项目】
:
国家自然科学基金资助项目(61173039);国家“863计划”资助项目(2012AA010904,2012AA01A306);国家科技支撑计划资助项目(2011BAH04B03)
论文部分内容阅读
针对手工优化GPU(Graphic Processing Unit)显存级数据复用过程复杂和编译时优化数据复用开销过大的问题,提出了一种基于动态生成树在运行时进行数据复用的优化方法,可为程序员提供一种透明且高效简单的优化方式。该方法将已经执行的GPU计算任务的数据访问抽象为生成树的叶子节点,利用动态生成树管理GPU数据访问信息,实现了运行时GPU显存级数据的复用优化,并通过运行时对生成树的搜索和维护,动态地发掘和优化GPU显存级数据复用,因此,在编程时不需要进行复杂且困难的数据复用分析,直接调用文中提出的运行时库就能有效减少程序执行过程中CPU内存和GPU显存之间的冗余数据传输次数,从而提升应用的运行性能。实验结果表明,使用文中提出的优化方法可有效消除未进行数据复用优化的CPU-GPU应用程序中的冗余数据传输,最大加速比达原始执行的3~10倍,额外开销不到优化后程序总执行时间的5%。
其他文献
采用微分计算方法,在考虑、不考虑燃油中溶解氧逸出这2种极限情况下,建立了燃油箱气相空间冲洗惰化的数学模型,并用实验数据验证了模型的正确性.以无氧逸出模型为基础,定义了
针对云存储中的隐私安全问题,设计了一个支持隐私保护的、高效且安全的云存储框架.该框架采用多叉树结构构建数据索引,设计密钥推导算法EKDA(Extirpation-Based Key Derivati
格里生制曲线齿锥齿轮的常用切齿方法有个种。本文用二阶齿面展成的理论论述了其中两种——变性半展成法加工弧齿锥齿轮及准双曲面齿轮(SFM及HFM)的切齿原理及机床调整方法。
目的探讨奥扎格雷钠联合依达拉奉治疗急性进展性脑梗死对患者神经功能损伤以及日常生活能力的影响。方法选取2016年1—12月沈阳医学院附属中心医院神经内科收治的80例急性进
通过实验和数值分析研究了两台往复式压缩机并机运行时管道系统中关键部位的气流脉动,根据计算流体动力学(CFD)方法建立了管道系统流体动力学模型,提出了合理的边界条件,分析
研究了以双环戊二烯改性不饱和聚酯的合成工艺,合成了气干性优良的树脂,并研制了气干性不饱和聚酯清漆,通过正交实验确定最佳配方。对其固化机理作了初步探讨。
目的对比HBeAg阴性及HBeAg阳性慢性乙肝患者在细胞免疫状态及HBV DNA水平方面的差别,分析造成这种差别的可能原因。方法应用流式细胞仪进行T淋巴细胞分类检测、荧光定量PCR测
郭纪生,河北省首届名中医、第4批全国老中医药专家学术经验继承工作指导老师,郭氏中医世家第4代传人,其先父是我国著名中医温病学家郭可明先生。郭纪生继承先人的宝贵经验,
以聚乙烯醇(PVA)为基体,用水溶性光敏剂4-叠氮基肉桂醛-2-磺酸钠(ACS)对其改性,获得一种高感度的水溶性感光高分子.应用红外、紫外光谱法及元素分析法验证了合成的感光高分子的结构,探讨了影响合
瑜伽在国外作为配合临床的辅助治疗手段被广泛应用,以EBSCO全文数据库、Springer Link全文电子期刊和Elsevier Science数据库作为信息统计源,对1823—2011年有关瑜伽治疗的文