机器学习中的权重学习与差分演化

被引量 : 0次 | 上传用户:loserlu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习是人工智能的核心研究问题,是计算机获得智能的根本途径。自从20世纪50年代人工智能学科建立以来,人们已经提出了大量的机器学习算法,如决策树、神经网络、支持向量机、K均值聚类及KNN算法等。而实际问题中的真实数据往往具有以下的一个或几个特点:含噪音的、具有缺失数据、数据类别分布不平衡、特征重要程度不同、大数据以及数据含有不确定性等,特别是当前随着计算机技术及通讯网络的迅猛发展,这些问题变得更加突出。为了处理这些不完美的数据,人们提出了许多改进的算法,比如可以集成多个学习器的集成学习系统,能够处理模糊数据的模糊系统,引入权重的加权学习算法,基于高性能进化计算技术的学习算法等。其中加权技术和模糊系统是经常使用的两种技巧,在这两个课题上仍然存在着一些问题值得我们进一步研究,如在学习系统中如何获取“良好”的权重以提高加权学习算法的性能?模糊分类器的性能与其模糊输出向量之间有没有关系?本文在选定的几个学习模型上深入研究了权重的优化模型及模糊分类器的模糊度与其性能的关系,并将改进的差分演化技术引入到权重的学习问题中。具体工作主要包括:首先,提出了基于多进化策略的混合差分演化算法,并将之用于求解加权模糊聚类中的权重;其次,针对更复杂的极速学习机(Extreme learning machine,ELM)中的网络结构及随机参数优化问题,我们将进化策略及参数自适应技术引入前述差分演化算法,提出了一个基于自适应差分演化的2阶段进化ELM算法;随后,在加权模糊规则推理系统中,我们研究了加权模糊规则中的权重与推理系统的泛化能力之间的关系,随后提出了一种基于最大模糊熵的权重精炼方案;最后,在集成学习系统中,我们分析了模糊基分类器输出向量的模糊性与集成系统泛化能力的关系,并通过实验及理论给出了几个有意义的结论,同时对集成学习中基分类器的学习提出了一些实用的建议。基于以上工作,本论文主要贡献可总结为如下几个方面:(1)提出了一种包含多种进化策略的混合差分演化算法并将之用于学习基于相似度的加权模糊聚类中的特征权重。提出的差分演化算法相对于已有算法,其即使用适于全局搜索的策略,也使用适于局部搜索的策略,从而增强了搜索能力,同时算法也没有增加过多额外的计算。(2)提出一种自适应多进化策略混合差分演化算法,该算法通过依次选用多种进化策略以提高搜索能力,同时其可实现进化策略及控制参数的自适应。进一步基于该算法提出了一种ELM网络的2阶段训练方案。该方案分两个阶段分别对ELM的网络隐单元个数及隐单元参数进行优化,即实现了网络结构及随机参数的自动获取及优化,又避免了传统trial-and-error方法的高耗时性以及已有其它进化ELM同时优化隐单元数及随机参数时解空间的超高维、多峰值及冗余性,从而可以自动以较小的网络结构获得与基本ELM相当甚至更好的测试性能。(3)针对加权模糊推理系统,提出了一种基于模糊最大熵原则的权重优化模型。该模型与传统大多数方法最小化训练精度或验证精度不同,其将加权模糊规则中的权重等参数看成变量,然后对于初始获取的一组模糊规则(权重都为1),在模糊规则满足所有已知约束(一般为训练样本的类别分对)的前提下,通过最小化模糊规则推理系统在训练集上的输出模糊熵来学习规则中的权重等参数的值。我们的数值仿真试验也验证了该方法可以很好地避免过拟合问题,从而得到满意的分类器。(4)针对基于一般模糊分类器(或输出为样本属于各个类别隶属度的多类分类器)的集成学习系统,我们首次研究了模糊基分类器的输出不确定性(如模糊性、不可指定性等)与集成分类器的测试精度之间的关系。并得到了几个有意义的结论,如:a)对于带有复杂边界的分类问题,模糊性大的样本比模糊性小的样本更容易被错分;b)距离边界近的样本集与具有较高模糊性的样本集一致,但是难于得到两者之间的映射,该映射基于边界样本的定义;c)若训练准确率可以被接受,带有较高模糊性的分类器对复杂边界问题具有较好的泛化能力能,并对该结论进行了实验验证。
其他文献
<正>国际大宗商品价格在经历了2008年暴跌后,2009年和2010年在震荡中逐步回升,2010年5月初开始明显上升。但是在二季度以后,由于欧元区的风险加大带来金融市场波动性增强,导
人口数量不断地增加,对地球带来的巨大的压力。不仅是能源的一个紧缺,土地也是越来越紧张。因此,为了缓解严峻的土地问题,高层建筑成为了现在的建筑主流物。在城市人口愈发的
<正>"十二五"时期是我国转变经济发展方式,完成产业结构优化升级,实现经济社会重大战略调整的关键时期。这一时期经济社会发展目标的实现,金融的协同配合与支持至关重要。因
目的探究奥曲肽应用于肝硬化上消化道出血治疗中的临床效果。方法 100例肝硬化上消化道出血患者,随机分为观察组和对照组,各50例。观察组采用奥曲肽进行治疗,对照组采用垂体
目的中药为主治疗颈性眩晕,并观察其疗效。方法随机选取本院150例颈性眩晕患者,将其分成常规组和观察组各75例,常规组采用常规理疗手法治疗,观察组用中药熏蒸为主综合治疗。2
从图形在标志设计中的应用方法及表现方式入手,通过学习和研究,探索具象图形、抽象图形及中国传统图形图案怎样在现代标志设计中更好的展现其独有的艺术形式并发挥出深远的文化
关于审计任期与审计质量的研究最早可追溯到20世纪60年代。21世纪初,公司一系列财务欺诈案件连续曝光,严重打击了投资者对资本市场的信任。2002年美国国会讨论通过了举世闻名
[目的/意义]分析国家安全情报学的研究现状,梳理国家安全情报学的主要研究议题。[方法/过程]梳理了国家安全情报学科发展的历史脉络、主要研究现状,并对现状进行了述评。[结
董事会是一个需要完成多重任务的部门,它需要做出旨在完成多个目标的决定。这些决定通常委托给董事会中的各专业化的委员会来做。各委员会的目标不同可能产生利益冲突的结果进
针对预湿上浆工艺浆纱上浆率不能利用浆纱压出回潮率和上浆率直接求得这一问题,探讨依据上浆率与浆纱压出回潮率间的关系式,预测预湿上浆工艺中浆纱上浆率的方法。利用带预湿