增量机器学习算法研究

被引量 : 28次 | 上传用户:liyang137963
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的发展,许多应用领域获取新的数据变得很容易。但是对于传统的批量学习技术来说,如何从日益增加的新数据中得到有用信息是一个难题。随着数据规模的不断增加,对时间和空间的需求也会迅速增加,最终会导致学习的速度赶不上数据更新的速度。机器学习是一个解决此问题的有效方法。然而传统的机器学习是批量学习方式,需要在进行学习之前,准备好所有的数据。为了能满足在线学习的需求,需要抛弃以前的学习结果,重新训练和学习,这对时间和空间的需求都很高,因此,迫切需要研究增量学习方法,可以渐进的进行知识更新,且能修正和加强以前的知识,使得更新后的知识能适应新增加的数据。本文分别对奇异值分解和模糊神经网络的增量学习进行了深入地研究和探讨,主要工作及贡献如下:1.提出无协方差的增量奇异值分解传统的奇异值分解(Singular Value Decomposition:SVD)采用批量计算方法,需要在计算之前将所有数据准备好,因此无法满足在线处理需求。本文提出了一种无协方差奇异值分解(Candid Covariance Incremental Singular Value Decomposition:CCISVD)方法。该方法通过当前样本估计样本协方差阵,提出了从顺序到达的样本中增量求取协方差阵的第一个特征向量的方法,从而避免了样本协方差阵的求解,从理论和直观上分析了该方法的可行性。在求解其他特征值的过程中,从当前估计的特征向量的补空间中寻找样本,从而始终保证了求取的特征向量的正交性,节约了时间和空间成本。2.提出免修剪连续增量学习模糊神经网络模型模糊神经网络的结构识别很耗时。为了避免产生冗余规则,通过把修剪策略引入模糊规则的增加过程来提高学习效率,本文提出一种免修剪增量连续学习算法,利用误差下降率,来定义规则对系统的输出贡献,作为规则的增长标准,从而在规则的增长过程中避免产生冗余规则。同时,由于计算规则对系统的输出贡献是根据当前输入数据,从而实现了增量学习。3.提出优化修剪的增量极速学习模糊神经网络算法ELM (Extreme Learning Machine)是为训练单层前馈人工神经网络(Singular Layer Fuzzy Neural, SLFNs)的一个简单而有效的学习算法,该网络的神经元随机产生。理论和实验都表明ELM准确而快速。为了能实现在线增量学习,本文对ELM进行了扩展。该算法中,模糊规则的前件参数和初始规则数量随机产生,然后使用SVD对规则按照重要性排序,通过留一法(Leave-One-Out:LOO)选择出最佳的模糊规则数,最后模糊规则的后件参数通过基于风险最小化分析计算得出。仿真实验结果表明,与其他算法相比有较好的鲁棒性,在准确率和计算速度上都具有优势。4.提出基于规则影响的自适应增量模糊神经网络模型在模糊神经网络中,一个模糊规则可能初始时比较活跃,之后慢慢变得对系统的贡献很小。本文提出一种基于规则影响的增量学习模糊神经网络(Self Adaptive Incremental Learning-Fuzzy Neural Network),引入模糊规则影响的概念,基于当前数据计算模糊规则对系统输出的影响,作为模糊规则增长或删除的标准。并且将规则的增长标准同系统的准确性联系起来,只有该模糊规则对系统的贡献值大于某个阈值,才考虑增加一条新规则,同时还检测已有规则库中规则对系统的影响值,如果低于某个阈值,说明该规则已经变得不再活跃,则删除该规则。无论是新增规则还是已有规则都通过扩展的卡尔曼算法更新参数。通过仿真实验表明该方法能获得比其他高代价的技术更简单的结构、更短的训练时间和较好的泛化性能。5.基于增量模糊神经网络和小波的人脸识别为了能提高样本质量从而提高识别准确率,本文提出一种新的提取人脸图像特征的方法。首先使用Harr小波对人脸进行分解,小波变换后的高频部分是人脸很重要的特征,这部分将作为人脸特征向量保存起来。然后使用Fisher线性鉴别分析(Fisher Linear Discriminant,FLD)对低频子图进行再次降维。降维后的向量和保存的高频部分特征向量连合起来作为模糊神经网络的训练样本,使用本文提出的自适应增量模糊神经网络学习算法训练网络。仿真实验表明,这种经过预处理后学习的模糊神经网络,其识别率高于不使用Harr做预处理的网络。
其他文献
在西宁地区采用裂区设计将不同品种沙棘种植于不同种肥用量下进行实验结果表明:中华沙棘在其株高、根长、根茎、干重四项指标的测定中均高于向阳、楚伊两个大果沙棘品种。在3
<正>据archdaily.com讯继去年诺曼·福斯特在其家乡曼彻斯特获得规划许可之后,今年又提出了新麦琪癌症中心的方案设计。该项目建在欧洲主要癌症中心之一、欧洲最大的单点中心
<正> 25年前Solomon和Moos根据免疫学的进展、心理生理学对应激反应(stress)的阐明、情绪对疾病的影响和发现免疫障碍同时发生有精神病等的新进展,发表了题为“情绪、免疫和
<正>1问题的提出《数学通讯》2012年第12期问题221为:若椭圆x~2/9+y~2/4=1上动点P到定点A(a,0)(0<a<3)的距离的最小值为1,则a的值是_____.错误的解答如下:以点A为圆心,1为半
现今婚内侵权的事情时有发生。由于婚姻的特性,该类事情具有很强的隐蔽性和伦理性,公权力很难直接介入。受害人想维护自身的权益,又面临着法律缺失的尴尬。之所以出现法律缺失,可
为了有效打击、遏制我国恶意欠薪现象愈演愈烈的趋势,2011年我国《刑法修正案(八)》将其入罪并确定为“拒不支付劳动报酬罪”。对于这一新罪名的适用,我国理论界和实务界存在众多
创作地域性的版画作品,要充分考虑当地独特的人文地理等景观。要尊重浓郁的民族文化对创作版画内容的影响,在创作中把现代化的创作元素、创作观念,以及地域的民间文化,融入版
放射性源项计算研究放射性核素种类、数量、形态,以及在不同系统之间的迁移过程,它可以为反应堆的屏蔽设计、废物评估和环境影响分析提供参考。铅铋反应堆是快中子反应堆,与
基于自身特殊历史背景、社会发展特质以及人口与教育发展等现实状况,我国台湾地区在2011年1月正式启动了十二年国民基本教育计划。该计划是台湾地区的重要教育改革之一,共分