一个结构网格并行CFD程序的单机性能优化

来源 :计算机科学 | 被引量 : 0次 | 上传用户:y317145569
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从单机性能优化角度对一个高阶精度结构网格CFD并行程序进行了优化。通过识别关键变量并对其进行常量参数化优化,使编译器能够实现更高级别的针对性优化;根据程序数据结构特点及访问模式,设计了分级数据缓存技术,使程序主要计算代码能够以更优的方式访问主要数据结构,提高了访存空间局部性;进行了各种循环变换,以优化访存性能。在国家超算长沙中心"Tianhe-1A"并行机上的测试结果表明,相对于采用Intel编译器最高优化级别的版本,其对100万网格点二维翼型算例,串行程序性能提高约22.2%~28.9%;对1.12亿网
其他文献
通过同一口井关井后所测得的压力恢复曲线与开井后测得的压力降落曲线进行曲线形态和压力及其参数对比。从理论上阐述压力恢复与压力降落具有相同的功能,在一定条件下可用压
本文运用文献资料法等方法,对体育微课程教学进行设计与开发。研究认为:体育微课程教学是一种新型的体育课教学方式,呈现出时间短、内容精简等特点;体育微课程教学转变了传统
本设计实现了一种基于FPGA便携式高精度脉冲信号产生和参数测量装置。信号产生功能实现,通过FPGA的定时器/计数器电路、输出比较电路产生。经调试,系统能够产生频率为1 MHz、
该系统抗震、防尘、抗电磁干扰 ,从取样、制样、光谱分析、把分析结果传到现场 ,时间不超过3 m in。建立的数据采集与传输网络系统可用于炉外精炼的成分临界控制 ,满足了现代
结合具体工程实例,分析了围岩监控量测的重要性,介绍了监控量测点的布置、量测仪器的采用和量测频率时间的确定,通过对量测数据的回归分析,评价和预测了围岩的稳定情况,从而
头盔音响的设计灵感来源于罗马骑士的头盔,罗马骑士作为勇敢的化身,其头盔象征着勇敢与荣耀。,符合大多数年轻人的追求。音响以头盔原型,造型进行简化,使其便于生产制作,色彩
建立科学合理的薪酬激励机制是企业人力资源管理的一项非常重要的工作。如何实现薪酬效能的最大化,是一门值得探讨的管理艺术。
旗下营隧道是京新高速公路重要的控制性工程,文章阐述了该隧道防寒抗冻设计、隧道监控量测、超前地质预报设计及隧道安全风险评估等关键环节,为内蒙古自治区寒冷地区隧道的防
笔者介绍了基于WEB的微课平台有关开发技术。针对微课系统中的核心功能,阐述了微课平台中文本信息展示、多媒体资源的上传与浏览技术,讲解了其具体实现步骤,最后展望了基于WE
本文对1990~1991年间稀土元素分析化学方面的进展进行了评述,内容包括分离方法、重量法、容量法、吸光光度法、荧光光度法、原子吸收光谱法、原子发射光谱法、原子荧光光谱法