基于梯度监督学习的理论与应用(Ⅰ)——基本算法

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:hewanjiang1975
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
讨论了一类基于梯度的监督训练算法及其用于神经网络的参数优化。文中详细讨论了LM算法,它是梯度下降法与高斯牛顿法的结合,既有高斯牛顿法的局部收敛性,又有梯度下降法的全局特性。μ很大时,LM算法近似于梯度下降法;μ为零时,则是高斯牛顿法。由于利用了近似的二阶导数信息,LM算法比梯度法快得多。就训练次数及准确度而言,LM算法明显优于共轭梯度法和变学习率的BP算法。由于主矩阵的正定性,解总是存在的,从这种意义上说,LM算法优于高斯牛顿法 A class of gradient-based supervised training algorithm and its parameter optimization for neural networks are discussed. In this paper, LM algorithm is discussed in detail. It is a combination of gradient descent method and Gauss Newton method, both the local convergence of Gauss Newton method and the global characteristics of gradient descent method. When μ is large, the LM algorithm approximates the gradient descent method; when μ is zero, it is the Gauss Newton method. The LM algorithm is much faster than the gradient method due to the use of approximate second derivative information. In terms of training times and accuracy, the LM algorithm is obviously superior to the BP algorithm with conjugate gradient method and variable learning rate. Due to the positive definiteness of the main matrix, the solution always exists. In this sense, the LM algorithm outperforms the Gauss Newton method
其他文献
目的 :探讨白内障术前、术后结膜囊细菌学分布状态 ,为临床用药提供依据。方法 :将无睑缘炎、结膜囊外观清洁、泪道冲洗通畅的白内障住院患者 94例分别于入院未用抗生素眼液
目前,区域特征的水资源环境景观规划以及设计方法有很多种。本文从地质学、背景和社会经济三个方面入手,介绍了安徽临淮岗水利风景区。以区域特色为基点,探究基于区域特征的
2005年10月,中石油向下属3家上市公司(辽河油田、锦州石化、吉林化工)流通股股东同时发出回购要约,成功回购后,3家公司股票终止交易,退出市场。文章以此次收购为研究对象,从
全方位行走AGV的主要技术组成为全方位轮系、控制系统和导引系统的设计。本文简要介绍了常见的全方位移动机构 ,介绍了一种新型的类似于麦卡那姆轮的全方位轮系 ,着重介绍了
江泽民主席在“亚太经合组织人力资源能力建设高峰会议”上指出,“信息技术的发展,使人们的学习和交流打破了过去的时空界限,为人类能力的提高和发挥作用带来了新的空间。”二十
新疆的手工业有着悠久的历史,它和'丝绸之路'一样,早就闻名于世。然而近代以来,由于帝国主义的侵略以及政治、教育、交通等各方面的原因,直接或间接地对其发展起了阻
婚姻家庭法作为“私法”的重要组成部分与每位公民的生活息息相关。它在适用上具有极大的广泛性 ,在内容上具有鲜明的伦理性和强烈的民族传统特色。现行婚姻法存在诸多缺陷和
少数民族文学的文学性与汉族文学呈现别样风姿,有自己民族的特色。本文从形象意象和形而上两个层面,对蒙古族著名作家满都麦的小说作品进行文学性分析。首先,在形象意象层面,作者
<正>隐喻的认知加工过程在言语理解领域中得到越来越多研究者的关注,然而对于隐喻的内在加工过程仍存在不一致的看法。当前研究将隐喻区分为词源性隐喻和引发性隐喻两种类型,
该文基于理性经济人批判,提出符合时代要求与社会进步的“国家理性行为体”假说,即假设国家作为一个整体,国家行为必须要从事物发展的客观规律出发,综合权衡全体国民短、中、长期