论文部分内容阅读
神经网络一直以来都很难被广泛应用于实时计算领域,其中最主要的原因是神经网络的训练时间太长导致的计算效率较低,近年来,极限学习机(ExtremeLearning Machine, ELM)的提出使得前馈神经网络的训练时间大大缩短,重新燃起了科研人员对于神经网络应用的重视,然而但当原始数据混杂入大量噪声变量的时候,极限学习机算法的分类和回归正确率却有极大程度的下降,这就对极限学习机的鲁棒性提出了新的要求。集成学习算法的应用有效的提升了机器学习系统的鲁棒性,因此我们思考利用集成学习的优势特性来弥补极限学习机的弱势特性从而改善极限学习机的鲁棒性差的缺陷。本论文旨在讨论基于集成学习的极限学习机的算法研究及其在高维度混杂数据条件下的应用。本论文提出了三种新算法EOP-ELM,AEOP-ELM和LARSEN-ELM解决了极限学习机算法鲁棒性的问题,特别是LARSEN-ELM能够在高维度混杂数据条件下工作良好,主要是因为以下原因:新算法LARSEN-ELM首先采取了对数据进行特征提取的预处理步骤,在这里利用LARS算法选取与输出结果最为关联的输入数据从而加强输入数据和输出数据之间的关联度,这就从本质上确保了算法的鲁棒性。其次我们将一组原始的极限学习机作为算法训练的内核,这样可以加快算法训练速度降低训练耗时。最后我们利用了选择性集成的鲁棒性特点针对内核进行有效筛选,并均值集成选择出的最优内核,从另外一个角度上确保了算法的鲁棒性效果,以上步骤形成我们LARSEN-ELM算法的整体框架,我们从理论角度说明了其对极限学习机算法鲁棒性的改进。最后本文采用大量的matlab实验进行仿真,特别是采取了国际通用的UCI数据集进行算法性能测试,具有可靠性。从性能推广角度来看,LARSEN-ELM的算法更具有扩展意义,可以作为今后继续研究的一个方向。