面向异构架构的混合精度有限元算法及其CUDA实现

来源 :计算机科学 | 被引量 : 0次 | 上传用户:haoz8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
长期以来,单精度似乎与科学计算无缘,然而从体系结构看,混合精度计算可以充分发挥向量部件、GPGPU设备的单精度性能,提供更高的效能,如降低通讯带宽要求、提高数据传输和通讯效率等。混合精度显格式有限元算法,结合材料强非线性多尺度有限元程序msFEM,实现了GPGPU上的有效加速。实验结果表明:混合精度显格式有限元程序实现了90%以上的计算通过单精度完成,其计算结果与全部使用双精度的结果相一致。该算法可以使得在不支持双精度格式的加速卡上实现科学计算功能。在支持双精度浮点格式的GPU上,混合精度算法与全部采用双
其他文献
目的实现结构宽频域随机振动与噪声复合响应分析。方法针对噪声与随机振动复合响应分析问题,首先基于声学流体流固耦合动力学有限元分析理论,利用现有商业有限元分析软件,建
近年来,GPU在通用计算方面对传统的CPU应用发起了强有力的冲击,被广泛运用于各种高性能计算中,特别是网络安全领域。为了解决传统硬件加速存在的缺陷问题,首先介绍GPU的基本硬件架构及其并行计算原理,其次说明基于CUDA的GPU编程与通用CPU编程之间算法实现的性能差异,最后详细分析了几种典型的网络安全算法,并设计了相应的GPU并行加速试验进行性能测试。实验结果表明,在算法设计合理的前提下,GPU可
针对LEACH协议簇间通信能耗和控制开销过大,以及簇首数量波动大、簇首分布不均匀等问题,提出一种基于能量均衡的固定分区路由算法。结合多跳算法进行非均匀分簇,在降低簇间通
阅读,然后学以致用,这是我的学习习惯。阅读《三重专注力》一书,我同样遵循这一习惯。“呼吸的小伙伴”这一游戏,是《三重专注力》中提出的一个训练学生专注力的有效方法。我
目的:分析不同家庭环境对学龄期儿童社交焦虑与心理孤独感的影响。方法:采用整群随机抽样,在宁夏某县5所小学随机选择3~6年级共990名学生进行一般情况、儿童社会交往焦虑测评
爆破振动对充填体影响的研究对于爆破参数的优化和安全回采具有现实意义。湖北三鑫金铜股份有限公司拟在某铜矿-370 m中段对残留顶柱进行回采,为确保安全,很有必要找到复杂
目的:评估在疫情期间,基层医务人员的个人心理状况并对基层医务人员心理状况进行分析。方法:2020年2—4月以上海市浦东新区上钢社区卫生服务中心为调查点,选取30名参与疫情防
目的获取钝锥外形飞行器再入飞行力热环境参数,建立更为准确的环境预测模型,开展基于无控火箭的模型飞行试验设计。方法根据转捩区、湍流区时间提出了无控惯性飞行弹道的落速
以天山北坡城市群中主要的23个市(县)为研究对象,结合莫兰指数、Getis-Ord G指数和标准差椭圆等方法分析了天山北坡城市群2002—2019年经济格局的集聚变化和经济重心的迁移趋