【摘 要】
:
本文针对包含数百个变量和数千个操作的复杂模板计算进行优化.选择了在弹性波建模中最复杂的方法之一——加权近似解析离散化(WNAD)方法的核心作为目标应用,探究复杂模板计算
【机 构】
:
清华大学 计算机科学与技术系,北京 100084
论文部分内容阅读
本文针对包含数百个变量和数千个操作的复杂模板计算进行优化.选择了在弹性波建模中最复杂的方法之一——加权近似解析离散化(WNAD)方法的核心作为目标应用,探究复杂模板计算在GPU平台上的优化方法.除了包含在缓存中数据重用和调节并行度等之外,还新增加了基于图的代码变换以及指令重排,使得各种系统资源得到平衡的配置和使用,以达到最佳的计算性能.其中,通过提取和变换源程序中的计算的表达式图,能够调整寄存器用量和计算操作数量之间的平衡,而自动指令重排能提供指令间并行度.基于以上方法,在NVIDIA Kepler GPU平台上对WNAD方法的模板计算进行优化,将性能从231 GFlops提升到了972 GFlops.
其他文献
人工智能教育在中小学教育中已经开始崭露头角,越来越多的有识之士开始探索人工智能教育。当今中国,课程的评价方式往往决定着课程的开设的好坏。因此,很探索高中人工智能教育的
利用分期播种和田间自然接种的方法,研究了安徽省44个主栽水稻品种对黑条矮缩病的抗性和水稻的易感生育期,结果表明:籼稻发病较粳稻重,同一类型的品种之间也存在抗病性差异,
亚洲最大型的木工机械及家具配料展——第十三届国际木工机械及家具生产设备展览会及第十三届国际家具配件、材料及木制品展览会(简称“北京木工展2010”及“家具配料展2010
转座子在基因表达、基因演化以及基因调控方面扮演着重要的角色.目前,转座子系统在转基因动物、基因功能研究和基因治疗等领域已投入研究,细菌的非自主转座系统也开始在基因
美国在反倾销处理中引入的司法审查机制,可以对反倾销措施进行更深入的思考,从而更好地保护美国利益。河北兴茂轮胎有限公司在美国就商务部的反倾销裁定打赢一场官司。国内有
“滄篟坏巍?五月十八日是美国的武装部队节,这一天向来是美国(?)国主义者耀武扬威的节日,可是在今年的这一天,气氛却有點不一样了。在当天晚上华盛顿举行的宴會上,马歇尔罵
(一)挣健康是我的切身体验2004年4月,我在通济医院接受了左乳癌根治术和第一次化疗。从手术室里出来,体重减少了3公斤。后又在肿瘤医院接受了5个疗程化疗和30次放疗。当年11
本文研究了保种基物含水量的变化对小麦赤霉病菌菌丝生长速率和产孢量的影响,并将保存的菌种接种至大田试验中观察其致病力.结果表明:在-80℃下保存时间3个月后,基物不同含水
本文介绍了玉米新虫害二点委夜蛾的发现过程,明确了新害虫二点委夜蛾的形态特征、为害症状及其主要生物学习性,详细探讨了其暴发机制,研发监测和预报技术,制定了《二点委夜蛾预测
基于教育教学改革背景下,“玩中学、学中玩”作为一种新型教学策略,与当前教学要求以及学生学习需求相契合。在学习中,使得感受到乐趣,而在玩中,也促使学生积累经验,学会并掌握知识