基于多核CPU环境的星系成团算法的研究与优化

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:license63
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Halo-based Galaxy Group Finder(HGGF)算法实现了基于暗物质晕的星系找群,在研究宇宙大尺度结构及宇宙的演化等领域占有至关重要的地位。但随着数据量的不断增长,现有算法难以高效的在计算机上进行模拟运算,迫切需要对HGGF算法进行分析和优化,以提高模拟计算的效率并有益于扩大计算规模。经过分析,算法的热点部分耗时过多是因为受到了非规则访存的严重影响,所以针对算法的结构和非规则访存模型,我们提出并使用了数据预排序方法,分析了该方法对数据访存过程的影响。在此基础上,我们利用数组拆分和数据对齐、循环分解等方法进一步优化访存效率,利用负载均衡和互斥变量私有化的方法提高了OpenMP的并行效率,相比最初的串行算法,将HGGF应用使用单节点12线程加速11.6倍,并取得了较好的扩展性。此外,我们还在MIC上对优化方法的效果进行了验证。本文主要有三点贡献:(1)对HGGF算法的程序结构和访存模型进行了总结分析,将其访存方式归纳为非规则访存;(2)提出并应用数据预排序方法改善了程序的数据局部性、缩短了访存延迟;(3)基于多核CPU设计了并行算法,结合数据预排序,使用数据对齐、循环分解、负载均衡、互斥变量私有化等方法显著提高了HGGF应用运行速度。
其他文献
In 2020,mobile communications is considered to be one of the fastest growing parts of the communications industry.At present,the society is about to enter the stage of full popularization of 5th gener
特殊教育近年来不断受到政府的重视,而作为其中重要组成部分的听障生高等教育得到快速发展。听障大学生的课堂学习状态是影响其学习的重要一环。通过研究听障大学生的课堂学习状态,对各变量进行有序Logistic回归探索影响听障大学生的课堂学习状态的因素并建立Logistic回归方程,据此对听障大学生的课堂学习状态进行预测。本文以天津理工大学聋人工学院全体学生为研究对象,主要通过问卷调查,访谈调查等方法对40
个人破产免责制度作为能否顺利实施个人破产制度的重要保障,处在个人破产法律制度中的核心地位。本文主要运用文献研究法和比较研究法进行论文写作。首先介绍个人破产免责制度的基本概念,从历史发展的角度讨论了个人破产免责制度的发展历程。随后从法律形成角度横向考察介绍了大陆法系的德国和日本、英美法系的英国和美国以及我国台湾地区的个人破产免责立法例,为我国的个人破产立法构建提供参考借鉴。接下去笔者基于我国的基本国
浮栅型有机晶体管存储器作为有机电子器件中一种非常重要的基本单元,被广泛应用于各种新兴领域中。但是其较差的数据保持时间和稳定性限制了其进一步的商业化应用。为了解决
不平衡问题是指在数据集中不同类别的数据分布不均匀,而传统的分类算法是基于数据大致平衡的假设,因而对少数类数据关注度不够,忽略了它们蕴含的珍贵信息,影响分类效果。研究
基本公共服务作为第三产业特别是现代服务业的重要组成部分与经济的变动之间存在着密切的联系,二者的高水平协调发展有利于实现社会和人类的共同进步。《“十三五”推进基本公共服务均等化规划》强调基本公共服务是为了保障全体公民生存和发展的基本需要、需与经济社会发展水平相适应的由政府主导的公共服务。而安徽省作为“中部崛起”的六省之一,是皖江城市带产业转移示范区建设的重点规划区域,在基本公共服务方面却面临诸多问题
随着医学美容技术的飞速发展,人们越来越关注自身皮肤的健康状况。如何客观、定量地评价人脸皮肤的肤质成为医学美容界重点关注的问题。传统的大型机械性皮肤肤质检测仪在便携性和实时性方面已无法满足人们的需求,利用图像处理手段对人脸皮肤肤质进行检测与评价具有十分广阔的应用前景。本课题希望可以建立一套皮肤瑕疵检测与评价系统,能够对皮肤表面的皱纹、斑点、痤疮、毛孔粗大等皮肤问题进行评估。具体工作内容如下:1.详细
本文主要研究一类在风险资产偏离半强有效性定价下的连续内部交易模型,探讨了这些金融风险市场中的最优连续内部交易策略及市场均衡特征。首先,我们研究了风险资产是静态的连
推荐系统是当今数据时代信息过滤的一项强有力的工具,被广泛应用于各种商业场景中,其功能是以主动的方式向用户推荐物品以满足用户的个性化需求。推荐系统中应用最广泛的推荐算法是协同过滤(CF,Collaborative Filtering),其个性化推荐结果的准确性依赖于用户数据来源的丰富性。但是,单一服务提供商的业务局限性和用户群体数量限制,使其无法获得大量多样化的数据来保证CF推荐算法的准确性。因此,
脑微出血(Cerebral microbleeds,CMBs)是脑小血管病、认知功能障碍等疾病的出血性影像学标志物和重要诊断标志物。可靠的检测出脑组织中CMB的位置和数量对于相关疾病的诊断和防治至关重要。在临床中,常规的CMB检测主要依靠医生从医学影像中手动标注,该过程费时费力且结果重复性差。目前存在一些利用各种影像处理技术开发的CMB自动检测方法。早期方法大多基于形状和强度等人工提取的简单特征,