面向大数据的分布式交替方向乘子法计算框架研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:koptity
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,数据信息的爆炸式增长对数据分析处理技术和计算能力提出了更高的要求,将传统集中式数据处理方法转换成分布式方法成为一种自然选择。高性能计算和分布式计算的发展为大数据处理提供了强有力的平台。大数据的多样性及高性能计算系统体系结构的复杂性,给实现高效分布式算法提出了新的挑战:利用分布式算法求解大规模问题时,如何合理分配数据、协调节点间通信、均衡工作负载是提高算法性能的关键问题。分布式算法的核心思想是分而治之,将大规模任务划分为多个小规模任务分布到不同计算节点并行执行。大多分布式机器学习问题可转换为最优化问题求解,交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)是一种典型的优化算法,也是求解大规模机器学习问题最有效的优化算法之一,因其高分解性和良好的收敛性而广受关注。ADMM算法框架本质上是分解协作的过程,可将大规模问题分解为多个可并行执行的子问题,通过协调子问题的解得到全局解。高性能计算系统体系结构的复杂性使得分布式ADMM计算模式及通信策略变得更加复杂,增加了并行程序实现的难度。因此需对分布式算法的算法原理和执行过程进行深入研究,才能设计出具有较高可扩展性的计算框架。本文对分布式ADMM实现时的算法模型、通信策略、编程模型等关键问题进行研究,设计实现分布式ADMM计算框架。本文研究内容及创新点如下:(1)本文对分布式ADMM算法模型进行研究,提出一种基于分组的异步分布式ADMM(Group-based Asynchronous Distributed ADMM,GAD-ADMM),主要解决因节点间计算和通信的不均衡性带来的算法收敛速度慢的问题。GADADMM结合多核分布式系统底层通信机制及数据集模型相似性对工作进程进行分组,通过分组策略聚合参数提高算法收敛速度。同时该算法模型利用分组变量代替局部变量更新全局变量,通过放松全局一致性约束条件进一步提高算法收敛速度。理论和实验表明:在求解L2正则化优化问题时,GAD-ADMM能有效提高收敛速度;(2)针对分布式ADMM处理高维稀疏数据时通信开销大的问题,本文提出一种基于层次化稀疏allreduce通信模型的异步惰性ADMM(Asynchronous Lazy ADMM based on Hierarchical Sparse Allreduce Communication model,HSACALADMM)。针对高维数据稀疏性,提出延时聚合参数策略对传输参数过滤,减少节点间通信负载,并设计基于稀疏数据的层次化allreduce算法以提高节点间通信效率。进一步提出了一种计算-通信-管理(Calculator-Communicator-Manager,CCM)框架,利用该框架实现HSAC-ALADMM提高系统计算和通信效率。“天河二号”和“自强4000”等高性能计算集群上测试结果表明,与其他异步分布式ADMM相比,HSAC-ALADMM可减少30%-93%的通信时间,且具有更好的可扩展性;(3)针对单节点计算资源的增加带来算法通信和内存开销大的问题,本文设计基于混合编程模型的异步分布式ADMM(Asynchronous Distributed ADMM based on Hybrid Programming model,HPAD-ADMM)。该算法节点间基于MPI分布式内存方式实现并行化,节点内基于Open MP共享内存方式实现细粒度并行。同时,针对带L1正则logistic回归(L1-regularized Logistic Regression,L1-LR)和Lasso两类问题,设计不同的并行化算法求解子问题。“天河二号”上实验测试表明,与基于纯MPI编程模型的分布式ADMM相比,HPAD-ADMM可减少21%-73%的总运行时间,且HPAD-ADMM可有效减少单节点内存开销,提高算法可扩展性;(4)本文设计并实现分布式ADMM计算框架。该框架主要应用于求解logistic回归(Logistic Regression,LR)和线性支持向量机(Support Vector Machine,SVM)等线性分类问题。用户使用该框架实现分布式ADMM,不需要过多关注分布式系统底层实现机制,有效缩短其软件开发周期。本文从不同层面提高分布式ADMM性能,并将分布式ADMM的关键部分抽象出来,为用户提供高效的分布式ADMM计算框架,协助用户快速开发面向高性能计算系统并行程序。
其他文献
高速磁浮地铁等轨道交通将迎来“智能轨道交通”的新时代。车地通信需要满足高达100 Gbps的数据传输速率以提供如车载高清视频监控、实时列车调度高清视频等传输服务。太赫兹(Terahertz,THz)通信以穿透性强、使用安全性高、定向性好、带宽高等优势,被视为车地间实现超高信息传输速率的候选途径。但是随着波长减小,大气湍流对通信的影响逐渐加剧。特别是高速列车通过隧道时湍流更甚。目前湍流对太赫兹通信性
学位
微观偏析影响合金铸坯的力学性能、耐腐蚀性能及加工性能,研究微观偏析对于优化铸造工艺及提高合金性能具有重要意义。已有研究发现,在合金凝固过程中施加稳恒磁场可以改变微观偏析,且这一现象与磁场的多种磁效应相关。但关于这些磁效应影响微观偏析的机制至今仍不清楚,更缺乏描述磁场下微观偏析规律的模型。本文以亚共晶Al-Cu合金和Ga-In合金为模型合金,探索了稳恒磁场(最大磁场强度为5 T)下二元亚共晶合金凝固
学位
报纸
报纸
本论文基于稀土镧(La)在钢中的强效微合金化作用,聚焦于当前我国高速铁路网建设对高强度贝氏体钢轨的重大需求,探究La在高强度贝氏体轨钢中的强韧化机理。采用La与Mn、Cr、Mo微合金化制备系列含La贝氏体轨钢,通过Gleeble热模拟技术、热膨胀法及原位观察法,结合激光共聚焦显微镜(LSCM)、透射电镜(TEM)、俄歇电子能谱仪(AES)、电子探针显微分析(EPMA)及X射线衍射仪(XRD)等材料
学位
急性心肌梗死(Acute myocardial infarction,AMI)是导致全球心脑血管疾病死亡主要的原因之一,快速高效诊断急性心肌梗死对疾病的治疗及预后起重要作用。研究认为,微小RNA(microRNA、miRNA)可能成为诊断AMI的重要分子标志物,为AMI治疗提供方向。本文将会围绕miRNA作为心肌梗死诊断标志物、如何促进或改善梗死产生、miRNA与心肌缺血再灌注损伤的关系及对梗死后
期刊
<正>配电网“低电压”是关系到千家万户生活质量的民生问题,消除“低电压”是供电企业履行社会责任和践行服务宗旨的基本要求。近年来,经过供电企业持续配电网“低电压”治理,配网结构、装备水平及配网综合管理水平有了显著提升,绝大部分用户端供电质量有了明显改善。
期刊
<正>在幼儿教育中,德育教育是重要的组成部分。《幼儿园工作规程》中指出:"幼儿园的品德教育应以情感教育和培养良好行为习惯为主,注重潜移默化的影响,并贯穿于幼儿生活以及各项活动之中。"作为教师,我们应整合各种家长资源,开展形式多样的家园活动,帮助家长树立正确的教育观,为幼儿播下道德的种子,培养幼儿成为人格健全的优秀人才。
期刊
钕是一种重要的稀土元素,其合金已经广泛应用于各行各业。在诸多钕合金的生产工艺中,熔盐电解法一直是研究重点。本文基于氯化物熔盐体系,实现了不同参比电极电位体系与标准氯电极电位体系之间的电位转化;在标准氯电极电位体系下,通过不同电化学研究手段,重点研究了Nd3+在惰性电极W,活性电极Cu和液态电极Sn上的还原过程,明确了Nd3+在不同电极上的还原机制,确定对应的金属间化合物的生成吉布斯自由能,并以此为
学位
随着科学技术的不断发展,对零件表面的微观几何精度及表面粗糙度都提出了越来越高的要求。在航空、电子、计算机、汽车制造等领域,对加工精度及表面性能要求越来越高,对细长孔精密加工的需求也越来越迫切。目前传统的表面光整加工方法有其局限性。许多阀类精密零部件具有特殊的结构特性,例如针阀体喷孔的孔径比大且对喷孔的流量精度和雾化质量要求很高。如采用传统的方法对喷孔表面进行表面光整加工,则加工效率和研磨质量都难以
学位