泛化误差相关论文
在机器学习中,人们期望神经网络对微小输入扰动也应有较小的输出扰动,说明网络具有较高的鲁棒性,也反映了网络具有较高的泛化能力......
传统配电网故障停电指标关联因素分析方法存在停电预测耗时长和准确率低等问题.为此,研究基于大数据的配电网故障停电指标关联因素......
核矩阵近似是提高核方法计算效率的基本方法。已有的核矩阵近似方法独立于学习问题,且用于在线核方法时每回合重新求解近似核矩阵......
在机器学习与模式识别的诸多任务中,如何真实而有效地度量两个数据样本之间的相似程度是一个极其重要的问题,并极大影响着后续识别......
随着交直流混联电网规模的扩大与电力电子化设备的大规模并网,以新能源为主体的新型电力系统的动态特性愈加复杂.物理模型的机理可......
构建基于数据挖掘技术的心理障碍预测模型,有效预测心理障碍,提升预测能力.依据随机森林原理,通过投票或计算平均数的决策方式重组......
在机器学习领域,当训练样本稀少时,模型容易发生过拟合现象,训练出的模型泛化能力差,因此不能满足实际需要。在很多现实场景中,获......
世界是充满联系的,这种联系通常以某种形式表现出来,从数学的形式就是一种映射关系,或者说是函数关系。在信息的时代里,这种映射关......
在人脸识别过程中,人脸检测是人脸识别的前提和基础,人脸检测的结果对人脸识别的精度有直接的影响。人脸检测的主要工作是从静态图......
主动学习是机器学习领域中一个重要的研究分支。主动学习研究的是如何通过有选择性的获取那些最有信息量的样本的标签,使得我们可......
卫星在轨运行期间,遥测数据表现形式通常为多维时间序列.高斯过程回归(GPR)模型可以为重要的遥测参数提供动态门限,及时发现隐藏在......
传统Boosting算法的目标是获取高训练精度的学习器;在此基础上,本文提出了一种基于元泛化的BaggedBoosting算法,以获取高预测......
模糊神经网络(f-NN)为从控制操作的传感器数值数据中获取“if-then”控制规则提供新的工具,这种方法把模糊控制规则的抽取过程转化......
采用三层前向神经网络描述混沌时间序列的动力学模型,给出了该网络拓扑结构的确定方法。仿真结果表明,该方法不仅优化了网络的结构,而......
针对模糊规则分类中数据边界硬性划分的局限性问题,建立了云-神经网络模型,并提出了基于云-神经网络的模糊规则分类算法.在不影响......
在当今的现实生活中存在着很多种微信息量的数据,如何采集这些数据中的信息并进行利用,成为了数据分析领域里一个新的研究热点。机器......
分类与回归是机器学习领域的两大重要问题.研究过程中,人们通常采用与之相关的学习算法来处理这两类问题.由于学习算法的泛化性能......
神经网络的结构学习就是要确定网络的拓扑 ,使之有较好的泛化能力 .本文考虑了确定性前向网络 ,而其训练集合是随机点集的结构学习......
Boosting 和 Bagging 是两种用来提高学习算法准确度的方法,这两种方法通过构造一个预测函数系列,然后以一定的方式将它们组合成一......
神经网络集成是机器学习和神经计算重要研究领域,通过训练有限个神经网络个体,并将其结论进行适当的合成,可以极大提高学习系统的泛化......
采用3层前向神经网络描述混沌时间序列的动力学模型,给出了该网络拓扑结构的确定方法。以及使网络泛化误差达到最小为依据确定网络的......
神经网络的性能可以通过泛化误差表达。泛化误差越小,则说明该神经网络在未知样本中的预测能力越强。反之,说明该神经网络的预测能......
针对原有的随机森林算法没有区别各个单分类器之间的分类优势,对分类器的组合方案进行优化,提出一种基于最大共识的模型组合算法.......
借鉴Friedman提出的基于函数空间的梯度下降搜索的思想,提出了一种新的集成学习算法——LS-Ensem算法.该算法只要求个体函数满足一......
Boosting和Bagging是两种用来提高学习算法准确度的方法,这两种方法通过构造一个预测函数系列,然后以一定的方式将它们组合成一个预测函数。文章将介......
为了提高神经网络集成中个体网络的差异性,并减少将集成用于预测时的计算量,本文结合粒子群优化算法和个体网络的并行学习机制,提出了......
提出一种动态性神经网络集成方法,该方法针对若干不同的神经网络,采用加权最近邻技术收集它们的泛化误差信息构成性能矩阵,在此基......
多类分类是机器学习领域中的重要问题.目前普遍采用的多类分类方法:“oneversus all”(OvA)直接利用“标准”的两类分类器重复构造两类......
在泛化误差(GeneralizationError)的估计中,交叉验证(Cross—validation)是最常用的方法.基于均方误差准则下,采用生物信息数据比较了泛化......
神经网络的结构学习就是要确定网络的拓扑,使之有较好的泛化能力.本文考虑了确定性前向网络,而其训练集合是随机点集的结构学习问题.......
建模是分析问题和解决问题的一种重要手段。随着对象复杂性的增加,越来越多地采用基于数据的经验建模方法。对于复杂的非线性系统......
统计机器学习的主要目的是依据训练数据集建立预测模型,用以描述给定数据的统计规律,并通过已有的模型对新数据进行预测。其中,模......
对广义凸损失函数和变高斯核情形下正则化学习算法的泛化性能展开研究,其目标是给出学习算法泛化误差的一个较为满意上界,泛化误差......
在机器学习中,泛化误差(预测误差)是用于算法性能度量最常用的指标,然而由于数据的分布未知,泛化误差不能被直接计算,实际中常常通......
间隔分布是Boosting算法的关键,现有的间隔分布泛化误差界难以计算,限制Boosting算法的发展.基于此问题,文中提出直接优化间隔分布的矩......
基于差异的半监督学习属于半监督学习和集成学习的结合,是近年来机器学习领域的研究热点.但相关的理论研究较缺乏,且都未考虑存在分布......
在统计机器学习中,交叉验证方法利用对一个数据集的多次切分,来构造多次重复实验,并以此估计机器学习模型的预测误差.然而交叉验证......
为了更合理地确定岩体质量类别,将主成分分析(PCA)与随机森林(RF)算法相结合,提出一种岩体质量分类的PCA-RF模型。选取能够充分反......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
为使城市环境空气质量评价方法具有更高的准确性和鲁棒性,提出将随机森林模型引入城市环境空气质量评价中的方法。通过对随机森林......
Bagging集成通过组合不稳定的基分类器在很大程度上降低"弱"学习算法的分类误差,Out-of-bag样本是Bagging集成的自然产物。目前,Out-......
粗糙集预测旨在从决策信息系统中学习规则从而预测新样本的标签.文中利用置信度刻画规则的可信程度,从而设计基于粗糙集的置信度预......
随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.随机森林模型是决策树的集成,并且由一随机向量决定决策树的构......