【摘 要】
:
相比传统的微处理器CPU,图像处理单元(Graphics Processing Unit,GPU)具备低成本、低功率,高性能等特点。由于其强大的并行处理能力和浮点计算能力以及快速提升的可编程能力,除了
论文部分内容阅读
相比传统的微处理器CPU,图像处理单元(Graphics Processing Unit,GPU)具备低成本、低功率,高性能等特点。由于其强大的并行处理能力和浮点计算能力以及快速提升的可编程能力,除了在图像处理上的应用,学者们越来越重视GPU高性能并行计算在数值计算上潜在的应用。CUDA(Compute Unified DeviceArchitecture,计算统一设备架构)的推出为高性能并行计算提供了一个新的开发平台。目前,CUDA已经在金融、石油开发、天文学、流体力学、信号处理、图像处理等领域获得广泛应用,并取得了丰硕的成果。边界面法(BFM)不仅继承边界元法(BEM)的求解问题降维、应力计算精度高等优点,还具备自身的特点:边界积分和场变量插值都是在以边界表征的实体边界曲面的参数空间里进行。在边界积分过程中,积分点的几何数据,如物理坐标、雅可比、法向量都是直接由曲面本身计算得到,而不是通过单元插值近似,从而避免了几何误差。然而,边界面法高额的计算成本使其成为求解大型问题的瓶颈。因此,本文基于CUDA平台,利用GPU加速边界面法的计算具有重要的意义。在深入分析CUDA编程模型和体系结构的基础上,本文研究了边界面法中的正则积分和奇异积分,分别给出了正则积分和奇异积分的并行方案及算法流程。根据CUDA平台的特性和优化策略并结合GPU自身的硬件性能提出了并行程序的优化方案。本文在NVIDIA GTX680GPU和英特尔(R)酷睿(TM)i7-3770KCPU的计算平台上进行计算对比。数值算例结果表明,在计算精度良好且与CPU串行程序计算精度保持高度一致的前提下,正则积分并行程序的加速比可达到8.2。
其他文献
静电驱动微机电系统(Micro-Electro-Mechanical-Systems,简写为MEMS)器件具有重量轻、体积小、响应快、耗能低等优点,在太空探索、智能控制、生物医学等领域得到广泛的应用。由于静电驱动器件几何尺寸的微小化,其力学性能与宏观状态下的器件相比存在着较大的差异。目前微尺度实验已经验证了特征尺寸大小小于微米量级时微器件的力学特性含有明显的尺寸效应现象。但是,由于经典的连续介质力
随着网络社会的迅速发展,新媒体的出现使得传统媒体受到了的巨大的挑战,传统报刊就深受其影响.在网络还未兴起之前,传统报刊业差不多垄断了整个行业,但随着信息化发展的推动,
目的:研究七氟烷麻醉6 h对新生期大鼠脑电监测的癫痫波及远期行为的影响及机制研究。方法:健康新生4~6 d SD大鼠141只(雄性66只,雌性75只)按照随机数字表法分为3大组(每组雄性2
随着我国建设的不断发展,建筑项目的不断增多,同时在众多的建筑行业中的发展标准也存在明显的差异,因此工程管理能力也存在一定的差别.文章首先阐述了精益建造的概念,并具体
植物微生态制剂以其环境友好,作用广泛,成本低廉而广泛受到世界各国的重视,成为当前研究与开发的热点。链霉菌(Streptomyces.sp)S506是从番茄根际土壤中分离得到的具有防治多种根部病害,降解根系自毒物质和促生长作用的一株多功能根际益生菌,在防治蔬菜连作障碍方面具有广泛应用前景。研制高密度、高效价活菌制剂是将其推向实用的关键。本研究以菌株S506为材料,在摇瓶发酵水平上,对其液固两相发酵条
蓝细菌通过光合作用利用太阳能固定无机碳并释放出氧气,是地球上氧、碳、氮、氢等元素循环的主要参与者,又是有机物的初级生产者。由于蓝细菌细胞结构简单,主要营养代谢方式与真
随着零部件产品不断朝着整体化、轻量化、精密化、复杂化的方向发展,铝合金铸件所占的比重越来越大,铝合金熔模精密铸造技术作为铝合金零部件的先进成型工艺也受到越来越多的关
此文主要在施工现场的安全生产治理、施工质量的管理、施工程度的管理、施工费用的合理使用几个方面来讨论该怎样提高建筑工程施工现场的优化治理.建筑工程项目的施工现场管
汽车作为一个复杂的多自由度振动系统,它是由多个具有固有振动特性的子系统组成的,在分析汽车的异常振动问题时,涉及到的系统较多,解决起来相对复杂。轮胎不均匀性是造成车辆
我国经济的快速发展在为企业带来发展机遇的同时,企业间的竞争压力也越来越大,而中成药制造企业的竞争尤为激烈,中成药制造企业在提高销售收入的前提下,也要侧重于自身产品成