基于学习率衰减的深度学习超参数优化方法的研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:himail
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
学习率衰减策略是深度学习算法优化中常用的学习率设定方法,好的学习率设定方式可以训练出更好的深度神经网络模型。因此,如何设定好的学习率衰减是深度学习领域的一个前沿问题,非常值得研究。在本论文中,我们详细研究了不同指数的多项式学习率衰减对深度神经网络模型性能的影响,并提出了一种对任意可导的衰减函数都适用的学习率衰减函数的调整方法——k-Decay方法。基于k-Decay方法可对原衰减函数的衰减变化率进行不同程度的加强或减弱,得到新的衰减函数,利用新函数训练出的模型其精度要优于原函数。在基于该方法的新衰减函数中引入新的超参数k,可以控制衰减函数的学习率的衰减程度,而原衰减函数恰好是新衰减函数在k=1时的特例。我们将k-Decay方法应用于多项式衰减、余弦衰减和指数衰减,分别给出了基于该方法的新衰减函数的解析表达式。为了验证k-Decay方法的有效性,我们采用了基于该方法得到的新多项式衰减函数作为学习率的设定方法,选用了当前最先进架构的几个深度神经网络(ResNet、Wide ResNet 和 DenseNet),在 CIFAR10和 CIFAR100 数据集上进行了广泛的测试,证明了该方法的有效性。模拟实验表明随着超参数k的增大,模型的精度会逐步提升。在CIFAR10数据集上,可提升1.08%的正确率,而在CIFAR100数据集上,可提升2.07%的正确率。本方法在没有引入任何额外计算的情况下,就能很大的提升模型的性能。
其他文献
随着陆地资源的日益枯竭,人类对海洋资源的开发和利用越来越关注,海洋在国家经济发展格局和对外开放中的作用也更加重要。由于濒海作业对海洋经济发展、海洋科学研究等领域至
国内外研究表明,橡胶混凝土是一种延性较强但强度弱于普通混凝土的复合材料,适用于有抗震要求的结构中。为验证橡胶混凝土的抗震性能,本文将其用于钢管混凝土(CFST)拱桥的拱
铸牢中华民族共同体意识,是习近平总书记深刻把握中国历史文化和世界民族发展规律作出的重大论断,是我们党对民族工作认识的一次历史性飞跃,是新时代民族工作的鲜明主线和战
应用于液晶平板显示屏自动光学检测仪器中的气浮工作台运载单元因为其具有几乎无磨损、精度高、无污染等优点,广泛应用于光学测量加工、超精密机械加工、航空发动机测量制造
导航是智能机器人系统的核心技术,已成为当今众多学者的研究热点。深度强化学习作为提高移动机器人自适应能力的有效算法,在移动机器人自主导航领域有广泛的应用前景。本文以
近年来,伴随着城市化进程的不断加快,我国交通发展日新月异,交通工具数量持续增多、种类日益丰富,道路基础设施不断完善。据公安部统计,截至2019年末,中国机动车保有量达3.48
GFRP-混凝土组合桥面板作为桥面板的一种新形式,通过界面将GFRP与混凝土连接起来,以便充分利用GFRP抗拉性能和混凝土抗压性能优良的材料优势,提高截面抗弯刚度,减小受力变形,
深度前馈架构为计算机视觉及其他领域的各种任务带来了令人印象深刻的先进技术。但只有当有大量标记的训练数据可用时,才会出现这些性能上的飞跃。由于数据集偏差或域移位的
由于快递末端配送服务的客户数量多、位置分散,而且服务时间等需求差异大,所以一直存在着配送成本高、取送件不及时等问题。虽然智能柜及他人代收等技术和管理手段的应用提高
随着互联网技术的应用与发展,数据获取方式的多样化使互联网中的数据呈爆发式增长,如何处理海量数据并为用户推荐其感兴趣的信息成为了数据库研究领域的重要课题之一。轮廓查