极速学习机的训练残差、稳定性及泛化能力研究

被引量 : 0次 | 上传用户：hmtllgh

【摘要】

：

极速学习机是一种新型单隐含层前馈神经网络的训练方法.它将整个神经网络视为一个线性系统,通过线性系统的最小二乘最小模解来得到最优的网络参数,不仅有极快的训练速度,同时

【作者】

：

付爱民

【发表日期】

：

2015年期

【关键词】

：

极速学习机训练残差稳定性泛化性能样本分治策略

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

极速学习机是一种新型单隐含层前馈神经网络的训练方法.它将整个神经网络视为一个线性系统,通过线性系统的最小二乘最小模解来得到最优的网络参数,不仅有极快的训练速度,同时解决了局部最优与过适应的问题.大量的参考文献和技术报告显示极速学习机由于其极快的学习速度故可应用于众多的实际领域,特别是大数据领域的预测问题,表现出了良好的泛化性能.本文对极速学习机模型的中一些最基本、最关键问题进行了研究,包括训练残差的表示、模型稳定性,输入矩阵的秩在模型中变化,泛化能力与模糊性的关系,样本分治策略等.1.着重研究了极速学习机输入矩阵的秩,给出了这个秩与极速学习机的训练误差之间的关系,此关系被公认为极速学习机的一个关键问题,它对于剖析极速学习机的结构、分析稳定性和泛化能力、改进极速学习机作为一个逼近模型的性能有着不可替代的作用.给出了一个基于矩阵秩分析的极速学习机逼近能力和误差分析的一般模型,研究了输入矩阵维数的增长以及输入矩阵同中间矩阵的秩的变化关系,同时进行了训练误差的估计以及结果的稳定性的评价.2.提出一个基于固定误差的最小化L1模-极速学习机的遗传算法.考虑到L1空间与L2空间的解析性问题以及求解优化问题的本质性差异,提出了使用L2模型的解作为遗传算法的初始种群,实验证明,此模型极快地在有限步内收敛到L1空间的解.与随机产生初始种群相比,该模型在收敛性能与收敛速度上有着本质的改进,改进的原因主要是L1空间与L2空间问题最优解的关系以及L2模型的极速学习机有着极快的训练速度.3.研究了极速学习机的泛化能力和稳定性.有监督学习模型包括极速学习机的最重要的评价指标就是它的泛化性能,即使用极速学习机训练而得来的模型来预测未知样本类别时的正确率.有很多因素可以影响这个泛化性能,这些因素包括：训练样本是否足够、训练算法的收敛性、所选择的学习模型是否适合,以及网络的稳定性.基于这些因素,研究了极速学习机的稳定性,并从实验的角度来探索极速学习机的泛化性能和训练集输出的不确定性之间的关系.对一个训练好的前馈神经网络,如果输入与输出都视为随机变量,则输出的方差也表示了网络的某种稳定性.即使输入随机变量的分布密度已知且具有良好性质,输出随机变量的分布密度表达式导出也异常困难.故采用了蒙特卡洛模拟研究了包括极速学习机在内的几种前馈神经网路的输出方差,给出了稳定性的一个排序.这个排序对用户选择使用神经网络模型提供了有益的参考.4.研究了一个极速学习机的一组训练样本的输出不确定性与样本错分率的统计关系.该研究方法不仅适用于极速学习机,而且适用于任何具有向量输出的有监督学习模型.对一组样本而言,其输出的模糊性越大则被错分的可能性就越大.这种观察在不同类型的数据库上得到的实验证实,而且可从边界点的副作用角度得到合理的解释.基于这种观察,提出了一种学习模型的样本分治策略,该策略首先将训练样本按其输出的模糊性大小分开为两个部分,即低模糊性样本子集和高模糊性样本子集,然后使用一种半监督训练机制将低模糊性样本和它们的预测类标加入到训练集.实验证明,这种分治策略可以进一步提高极速学习机的泛化性能.

其他文献

土河与游弈

土河与游弈徐志斌“土河”与“游弈”是古代军事上的两种不同的侦察手段，责在侦察敌情，以确保战争的胜利或防御敌寇骚扰入侵以避免损失。它们是取得战争和防御胜利所不可或缺的

期刊

归义军时期

犯罪化原则与我国的“严打”政策

由于“严打”政策本身蕴含着强烈的犯罪化观念及其行动 ,因此 ,在“严打”政策法治化的过程中 ,必须正确处理好与犯罪化过程中的一些基本原则的关系。尤其要遵循最低限度干预

期刊

严打刑事政策刑法

难治性癫痫动物模型研究进展

难治性癫痫动物模型是研究难治性癫痫的药物筛选、治疗、发病机制的重要手段。常见的慢性癫痫动物模型包括遗传性癫痫模型、慢性简单部分性发作模型、癫痫状态后模型、复杂部

期刊

难治性癫痫动物模型慢性点燃

基于财务造假识别模型的公司授信风险预警研究及应用

为更好地发挥新形势下银行公司授信业务内部审计的作用,本文基于财务造假企业的基本特征,建立了横纵维度的财务指标综合体系,构建了包括基础数据模块、横向指标体系模块和纵

期刊

财务造假识别模型内部审计公司授信风险预警

骨关节炎诊治指南(2007年版)

<正>一、背景世界卫生组织(WHO),于2000年1月23日在全球范围内启动一项旨在引起各国政府、医疗研究机构、民众以及社会各界对骨骼疾病重视的"骨与关节十年"活动,其中包括骨关

期刊

骨关节炎关节腔内注射糖皮质激素

玻璃纤维混凝土的力学性能研究

通过力学试验,研究不同纤维掺量的玻璃纤维混凝土的抗压强度、抗拉强度、弹性模量、泊松比等力学性能,并提出了玻璃纤维混凝土力学性能的其他影响因素,为玻璃纤维混凝土这种

期刊

玻璃纤维混凝土力学性能新材料

不孕不育门诊开展健康宣教的效果分析

目的分析不孕不育患者门诊治疗时开展专科健康宣教的临床效果。方法 2010年1~12月门诊不孕不育接受综合治疗的712例患者,按自愿原则,分为参加组和未参加组,参加组按专科护士

期刊

不孕不育健康宣教效果分析

衰老分子生物学研究进展

衰老分子生物学研究进展王英杰（杭州大学生物科学与技术系杭州３１００１２）自从本世纪中期完全证明了遗传物质的化学本质井提出了ＤＮＡ的双螺旋结构后，分子生物学的发展突飞猛进。继之而来的是它

期刊

分子生物学研究王英杰细胞衰老染色体生物科学与技术生命科学染色质氧化性损伤高等动物活性中心双螺旋结构

基于游客感知的民族文化主题公园旅游发展研究

随着我国经济实力和人们精神层面消费需求的不断增强和提高,休闲旅游已成为现代人生活中的重要组成部分；同时国家也非常重视文化产业的发展,在十八大报告中特别提出要将文化产

学位

民族文化主题公园游客感知旅游发展五千年文博园

数据仓库体系结构分析

通过分析数据仓库与数据库的区别,明确了数据仓库的概念,探讨了在设计数据仓库系统时所采用的几种体系结构以及各自的优缺点,并对数据联合对数据仓库体系结构的扩展做了分析

期刊

数据仓库体系结构数据集市数据联合

极速学习机的训练残差、稳定性及泛化能力研究

与本文相关的学术论文