基于协同异构模型的成形模拟计算加速

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:a372092
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
成形模拟中的多场耦合分析,非线性多尺度耦合分析等问题通常需要对大量数据进行多次计算以得到有效的结果,另外这些计算又必须在合理的时间内完成。本文主要从并行计算架构方面研究成形模拟中的计算加速方法,提出了基于CPU/GPU架构的协同异构计算模型来缩短成形模拟过程中的计算时间。本文把工作重点放在了如何优化CPU/GPU协同异构计算模型,缩短计算时间问题的研究上,通过对成形模拟中求解多物理场耦合,多尺度耦合分析过程中的温度场问题,应力应变问题经常用到的有限差分法,矩阵与向量乘积等常用计算方法的GPU架构的程序实现,极大的提高了计算效率,将大量计算转移到计算效率较高的GPU架构上来,减轻CPU的计算压力,缩短计算时间。本文通过对六个数据存储优化方案的实验分析,不断优化CPU/GPU异构计算架构的设计方法,经过各种实验数据证明,得出了比较合适的数据存储方案,针对GPU架构在科学计算方面的一些缺陷,通过CPU来协同完成。通过将完全位串链表与位掩码结合在一起使用优化了存储器结构对计算性能的影响,测试发现,优化方案比没有优化过的方案有25倍的性能提升。在程序设计和收敛求和计算过程中充分利用共享内存空间,减少不必要的数据同步,减少导致缓存命中率下降的因素。通过使用分支同步的方法来处理条件分支,在发生条件分支时,转移方向相同线程的先执行完分支中的指令,然后另外一个转移方向的线程再执行另外一个分支中的指令优化了单指令多线程技术对计算性能的影响。通过实验评估,CPU/GPU协同异构计算模型能解决比单个CPU或者GPU计算系统大16倍左右的问题,却能得到少于20%的错误率,系统负载率只有之前的60%,系统计算效率有50%以上的提升。通过实验结果和并行计算系统现在的发展趋势,相信CPU/GPU协同异构计算将成为并行计算发展历程中越来越重要的一环。本文的研究内容具有重要的工程意义和广阔的应用前景。
其他文献
如何布置作业才能避免发生优生“吃不饱”、差生“消化不了”的问题,这是一门艺术而不是技术。面对成绩参差不齐的学生实施作业分层设计,对每一个同学都能提出具有针对性的学
剃须刀是一个已经存在了上百年的产品。过去的100多年来,吉列曾上演从无到有、从低市场份额到垄断的奋斗故事,然而.最近20年,吉列却遭遇细分行业整体下滑的尴尬。是啊,相比电动剃
为探讨两种生物表面活性剂皂苷和鼠李糖脂对污染塿土中苯酚的淋洗修复机制,采用批次试验方法,初步探究了塿土对苯酚及两种生物表面活性剂的吸附特征、两种生物表面活性剂在不同淋洗条件(生物表面活性剂浓度、时间、温度)下对塿土中苯酚的淋洗效果。结果表明:(1)塿土对苯酚的吸附量较低,吸附等温线符合Langmuir等温方程;(2)在较低浓度范围,塿土对皂苷和鼠李糖脂的吸附属于单分子层物理吸附,能较好地用Lang
这一个公开的"骗局",所有参与者均心知肚明,包括作为主要"受害者"的银行。但操盘者李国清的意外跑路,最终让这场游戏,难以为继。坐落在江苏省无锡市惠山区的一洲钢材市场,因为毗
目的了解巴南区人民医院传染病网络报告质量,促进其工作更加科学、规范。方法按照系统抽样法抽取2005~2009年传染病卡片,分别统计并比较迟报率、漏报率、完整率、准确率及一致
目的:观察微创DHS内固定治疗股骨粗隆间骨折临床疗效。方法:分析我院骨科42例股骨粗隆间骨折,按Evan`s分类法:Ⅱ型10例,Ⅲ型12例,Ⅳ型14例,Ⅴ型6例,均微创DHS内固定术式。结
欧朋(Opera)最近有些尴尬,尴尬的不仅是它.还有整个手机浏览器行业。仅仅在2010年.手机浏览器还是一个热热闹闹的行业,UC获得诺基亚巨额投资;3C门户网2年推出3代产品;不久,360也高调进
看得见的城市里的那些看不见的人,既让繁忙的城市多了一处美好的风景,也让我们的同情心变得有所作为。
编辑工作是出版活动的重要组成部分,编辑工作者的职业素养与能力既决定着出版物的质量,更关系到我国社会文化事业的发展.在瞬息万变的信息时代,传播媒体在传播方式、编辑手段
什么是电子监管码?简单来讲,电子监管码是对产品实施电子监管为每件产品赋予的标识,就像是商品的身份证一样.“一件一码”.也可以简称“监管码”。电子监管码的实施有着重要的现实