论文部分内容阅读
人工智能及其相关领域的不断融合与发展巩固了以大数据为核心的信息化时代进程,这导致传统集中式优化方法受到了数据爆炸、数据结构日趋复杂、分布式硬件框架深化等客观因素的巨大冲击与深刻影响。因此,以并行计算和分布式存储为核心的分布式优化算法近年来受到了广泛的关注与应用。相较于传统集中式优化方法采用一个中心节点来协调和控制整个网络化系统的计算与通信,分布式优化方法首先将大规模优化问题分解成一系列可和的子问题。然后,将子问题分配给多个节点,通过节点之间的保密协作求解原优化问题。因此,分布式优化方法可以极大程度地减轻中心节点的计算负担,提升网络化系统的优化控制效率与鲁棒性。相较于以Hessian矩阵(二阶梯度法)或零阶函数信息(零阶梯度法)设计的分布式优化算法,以一阶梯度法为基础设计的分布式优化算法仍然是求解机器学习、信号处理、协同控制、能源调度、状态估计等领域优化问题的主流选择。这主要得益于一阶梯度法消耗更少的计算、存储、通信资源,同时应用和获取方式更简单。近年来涌现了诸如:EXTRA、ADD-OPT、Push-DIGing、Push-Pull、DSA、GT-SAGA/GT-SVRG等优秀的分布式一阶优化算法。但是如何在有向非平衡(有向)网络环境下设计高效率、低计算成本的分布式优化算法是许多研究者关注的重点、难点和热点问题。鉴于分布式一阶优化方法在算法性能和资源消耗上体现的显著优势,本文将针对实际应用场景中的大规模优化问题和复杂通信网络环境,设计高性能、强鲁棒性、低计算成本的分布式一阶优化算法,主要研究内容概括为以下四个方面:(1)在动态网络强连通的假设条件下,TV-AB算法是基于行和列随机权重矩阵设计的时变有向网络下分布式一阶优化算法。然而,由于TV-AB算法采用常数步长,导致算法存在全局参数,因而该算法并不能实现真正意义上的完全分布式运行。并且,由于理论分析的缺憾,研究人员并没有从理论上给出TV-AB算法收敛时步长的取值范围。鉴于TV-AB算法存在的以上问题,本文通过引入非协作步长和动量参数,Nesterov加速机制和“重球”加速机制,设计了时变有向网络环境中的双加速算法,并且基于线性系统动态不等式理论分析方法严格解析出了当算法收敛时的最大步长与动量参数的取值范围。仿真部分通过分布式求解最小二乘、逻辑回归、支持向量机等机器学习和信号处理常见问题验证了算法的高效性。(2)考虑通信网络中可能存在的噪声,通过引入噪声梯度,SAB算法是第一个可以应用于任意有向网络的分布式一阶随机优化算法。虽然SAB算法可以应用于含有噪声的有向网络下,但是该算法仍然具有很大的加速潜力。因此,通过引入Nesterov加速机制,本文基于行和列随机权重矩阵设计了能应用于有向网络的分布式一阶随机优化算法。仿真部分通过应用所提出的算法解决在线岭回归问题和逻辑回归问题验证了算法的加速特性和抗噪声能力。(3)在一阶批量梯度下降领域,基于有向网络设计的分布式优化算法在理论上需要选取“充分小”的步长才能保证算法收敛,这种遗憾是由于保守的收敛分析过程造成的。于是,本文通过引入基于Barzilai-Borwein(BB)方法的自适应步长,并结合梯度追踪机制和行随机权重矩阵,开发了一种能应用于有向网络简记为ADBB的分布式一阶梯度优化算法。值得提及的是,本文不仅从理论上证明了ADBB算法在实现全局最优解时,允许各节点自主选择相较于现有同类型算法更大的步长,从而达到了去除“充分小”步长选取的理论缺陷,而且实验结果显示ADBB算法在实现全局最优解时需要更少的梯度计算量、迭代次数以及通信成本。(4)在一阶随机梯度下降领域,如何消除分布式随机优化算法对常数步长等全局参量的依赖,是分布式随机优化算法向完全分布式迈进的一个重要问题。除此之外,全局参数造成的额外通信和协调成本也是影响分布式算法优化控制效率的重要因素。因此,本文基于非协作步长和方差缩减技术,设计了有向网络环境下的分布式一阶随机梯度优化算法,并通过基于分布式逻辑回归和分布式最小二乘的仿真验证了算法的有效性和应用价值。综上,本文主要针对人工智能领域的大规模凸优化问题,基于一阶梯度法设计了一系列高效和实用的分布式一阶优化算法。本文的研究成果将拓展分布式一阶优化理论研究和应用场景,为复杂网络环境下高性能分布式一阶优化算法的分析与设计提供新理论、新技术和新工具。