基于随机投影的高效自适应次梯度方法

来源 :南京大学 | 被引量 : 0次 | 上传用户:yeshi804883653
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线学习是一个计算高效且具备理论保障的通用学习框架,能够利用实时收集的数据快速地进行参数更新。随着大数据时代的来临,为了处理规模大、增长快的数据,在线学习受到越来越多的关注。自适应次梯度方法由于可以动态地利用已观测数据的几何结构去指导参数更新而成为常用的在线学习方法。根据使用的信息量大小,自适应次梯度方法可以被划分为对角矩阵版本和全矩阵版本。由于全矩阵版本处理高维数据时需要难以接受的开销,对角矩阵版本在实践中被广泛应用。然而,对角矩阵版本仅仅维护了梯度外积矩阵的对角线元素,无法捕捉梯度之间的相关性。当高维数据是稠密且具备低秩或近似低秩特性时,它的效果会比全矩阵版本差。本文主要研究如何在不影响性能的前提下降低自适应次梯度方法的复杂度,取得了以下进展:第一,针对全矩阵版本自适应次梯度方法复杂度过高的问题,提出基于梯度投影的高效自适应次梯度方法。该方法的核心思想是利用随机投影方法去生成一个可以近似梯度外积矩阵的低秩矩阵。在后续的计算过程中,我们通过维护和操作这个低秩矩阵去加速梯度外积矩阵的开方和求逆运算,从而得到一种更加高效的自适应次梯度方法。实验结果表明,该方法取得了与全矩阵版本自适应梯度方法相接近的效果,并显著地降低了运行时间。然而,该方法在参数更新过程中存在依赖性问题,我们难以利用现有的数学工具从理论上分析其遗憾上界。第二,针对基于梯度投影的高效自适应梯度方法不具备遗憾上界的问题,进一步提出基于数据投影的高效自适应次梯度方法。具体而言,对于机器学习领域常见的广义线性模型,我们首先提出将全矩阵版本自适应次梯度方法中的梯度外积矩阵替换为数据外积矩阵,这一简单的变化直接避免了基于梯度投影的方法中存在的依赖性问题。然后再利用随机投影方法去生成一个可以近似数据外积矩阵的低秩矩阵,并利用该低秩矩阵加速参数更新,得到与基于梯度投影的方法相同的存储和计算复杂度。更重要的是,我们通过理论分析建立了该方法的遗憾上界。理论结果表明,针对广义线性模型,当数据具备低秩或近似低秩特性时,该方法的性能与全矩阵版本的性能相接近。实验结果表明,该方法取得了与基于梯度投影的方法相似的效果,成功降低了全矩阵版本的复杂度。
其他文献
谷氨酰转肽酶(gamma-glutamyltransferase,γ-GT/GGT)是临床常见的肝损指标,常用于病毒性肝炎及酒精性肝病的诊断,但是近年来有一系列临床研究显示其对非酒精性脂肪肝、胰岛素
作为外语教学中最为古老的教学方法,语法翻译教学法虽无法满足现代英语人才培养的需要,但其鲜明的特点和优势及在教学目的和教学方式等诸多方面对自身的修订显示了其在当前大
【正】 引言芒果是云南省景谷县的特产。景谷是一个有傣、彝、拉祜、哈尼、布朗、回、汉等民族聚居的亚热带多民族地区。全县254915人,其中:少数民族112338人。占44%。因盛产
利用恒定市场份额模型,对1992年以来我国对美国纺织品服装出口的增长情况分3个阶段进行了分析.结果表明:在不同阶段,贸易规模效应、商品结构效应和竞争力效应对我国对美纺织
<正> 1 瘀血阻络王××,男,54岁,干部。1985年10月27日初诊。主诉:患慢性肝炎20年,肝硬化5年。现症:五心烦的,入夜尤甚,夜寐手足不欲被,烦躁失眠,右肋部疼痛,腰膝酸软,倦怠乏
本文对求解矩形薄板弹性弯曲问题采用先建立微分方程的一般解,然后根据问题的边界条件确定积分常数,这样求解比采用迭加法求解要简单容易。
以某山地建筑设计工程为例,探讨了山地建筑设计中如何进行总体布局,建筑设计及环境景观如何与山地有机结合,交通如何组织及场地工程技术等问题.
<正> 如何在外商投资企业建立并推行职工民主管理制度,这是社会主义市场经济体制条件下工会组织面临的一个重要课题.对此,人们一直十分关注,努力寻找突破的契机。最近,我们在
<正> 用皂荚汤治疗口眼歪斜,经临床观察疗效满意。一般服药二个疗程(每个疗程四剂药),大部分病例可达到症状消失,功能恢复正常。部分病例疗程稍长,病程长者可配以丸药服用。
2001年基础教育新课程改革启动至今,走过了14年路程。由于历史原因,我国基础教育的着力点一直偏重于课堂教学,对于“课程”这个概念,有一个从零开始逐步深入的学习认识过程。