多线程并行四面体网格生成与优化算法

来源 :浙江大学 | 被引量 : 0次 | 上传用户:wisdom_chen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算固体力学、计算流体力学等领域中,以有限元方法为代表的数值模拟依赖高精度、高质量的网格输入。一些如直接数值模拟、大涡模拟、分离涡模拟等数值模拟方法所需网格规模通常在数亿甚至数十亿的量级。在数值模拟领域中,要生成复杂区域的网格,通常需要不断迭代加密,以满足设计与计算要求。如何快速生成大规模的网格,以及如何快速生成质量可靠的大规模网格,成为网格生成研究中亟待解决的难题。本文始于Delaunay三角化的经典B-W插点算法,根据算法中的空腔局部修改特性,建立了并行基本原则:仅当两个点所涉及修改的单元范围(即“空腔”)及其边界无交叠时,二者方可同时执行。既有的并行策略是在计算空腔与空腔修改之间插入同步,以分离读写过程。但大量同步带来了不必要的等待与同步开销的浪费。因此本文提出了一种更细粒度的避免数据竞争的机制——基于无锁原子操作的并行方法:对每一个单元,某个线程需要获取其写入权限时,只需通过一次原子条件交换操作即可保证只有一个线程处于可写状态,从而避免了数据竞争。原子变量在NUMA范围(通常是8核)内相比加锁而言效率很高,将其应用于Delaunay三角化算法中,8线程下达到约4.7倍的加速。将基于原子操作的并行方法应用于网格质量优化中的递归壳变换中,不仅解决了既有基于同步的并行方法无法并行递归壳变换(因其空腔需动态扩展)的困难,并且得益于递归壳变换对极差单元的处理能力,使并行网格优化算法在保有串行算法的优化能力基础上,性能得以大幅提升,在8线程下全优化算法达到原串行算法7倍以上的速度。本文的创新点如下:1.提出了基于无锁原子操作的多线程Delaunay三角化并行插点算法,较好的处理了基于同步并行方法进行插点时,同步等待引起的时间浪费问题,提高了并行效率。在实验环境中16线程实现了7倍以上的加速。2.将并行图着色算法应用于点光滑化算法的并行化,把一轮着色改进为多轮着色,基于高效的多轮着色选取可并行进行光滑处理的点集。在实验环境中,16线程实现了9倍以上的加速。3.针对同步并行方法无法动态扩展空腔的困难,提出了基于无锁原子操作的多线程并行递归壳变换算法。将并行递归壳变换算法、并行点光滑算法与其他拓扑变换算法结合,实现了与原串行网格优化算法相当的优化能力,并且显著提升它的时间效率。在实验环境中,8线程下实现了7倍以上的加速。
其他文献
第一部分大鼠骨髓间充质干细胞多能分化与P3HB4HB生物相容性1.1目的本研究验证潜在成骨诱导因子BMP9诱导骨髓间充质干细胞(BMSCs)与优良的支架材料P3HB4HB复合材料可用于修复
<正>石油是战略资源,对促进国民经济发展和实现国家战略发展均具有十分重要的作用,能否有保证地获得充足的石油供应直接关系到国家的政治、经济和军事安全。或者说,一个国家
会议
“白酒业发展何去何从?”这是目前业内及广大经济工作者非常关注的重要问题。本文作者认为:在激烈的市场竞争中,企业界只有认清形势,明确自身的竞争地位及行业发展前景,顺应
题跋作为一种文艺评论,是理论的重要组成部分。古人的书法美学往往蕴含在题跋的评论中,所以,题跋具有很高的价值。本文论述题跋的内涵和作用,并结合山谷题跋进行分析。
为了解铜陵县急性血吸虫病(简称急血)流行规律并为制订防治策略提供依据,对本县1990~1999年发生的353例急血病例资料进行统计分析.
中国经济现状如何?中外人士对此议论纷纷。中国经济的改革与发展蓬勃向上,令人惊喜,这是有目共睹的事实。许多人形容中国经济的高速发展似火车在飞奔。然而,现在居民的直观感
坐澳大利亚飞机感遇刘新粦由香港去曼谷,我们坐的是澳大利亚“快达”(OANTAS)航空公司的飞机。这架飞机的服务、饮食没有给我留下深刻的印象,也没有发生什么令人不愉快的事。如果说有点
目的 研究日本血吸虫感染对C57BL/6小时雄性激素的影响。方法 应用放射免疫测定法检测实验感染日本血吸虫动物血清中雄性激素睾酮的水平。结果 感染日本血吸虫45d小鼠血清中睾酮的水
大都市是指人口在一千万以上的“超大城市”和人口在五百万以上的“特大城市”。按照我国2014年城市人口数据来划分,目前我国大都市共有十三个,分别是北京、上海、天津、沈阳、
皓月一轮照,春风两岸明〔台湾〕陈大络1996年2月19日,是丙子年的春节,“丙曙照临,春台迎旭,子行蔚起,夏屋连云。”是年的3月4日,是丙子元宵。“天空皓月一轮照,人醉春风万里明。”笙歌簇拥,灯火