非光滑凸情形Adam型算法的最优个体收敛速率

来源 :智能系统学报 | 被引量 : 0次 | 上传用户:gengyuefeng009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Adam是目前深度神经网络训练中广泛采用的一种优化算法框架,同时使用了自适应步长和动量技巧,克服了SGD的一些固有缺陷.但即使对于凸优化问题,目前Adam也只是在线学习框架下给出了和梯度下降法一样的regret界,动量的加速特性并没有得到体现.这里针对非光滑凸优化问题,通过巧妙选取动量和步长参数,证明了Adam的改进型具有最优的个体收敛速率,从而说明了Adam同时具有自适应和加速的优点.通过求解l1范数约束下的hinge损失问题,实验验证了理论分析的正确性和在算法保持稀疏性方面的良好性能.
其他文献
为适应未来无人化、智能化、数据化和信息化的复杂系统,必须建立智能系统以代替人的工作.该智能系统的目标是使功能系统达到预定功能并保持功能稳定,即控制系统可靠与失效状