构造性神经网络的集成分类模型及应用

来源 :安徽大学 | 被引量 : 0次 | 上传用户:xujin2003cn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经网络集成是目前机器学习的热门研究方向之一,在许多领域有着广泛的应用,如数据挖掘、模式识别、文本分类、预测等方面。神经网络集成通过训练多个神经网络并将其结果进行合成,可以显著地提高学习系统的泛化能力。它加深了学者们对于机器学习和神经网络的研究,并且利于工程技术人员利用神经网络技术解决实际问题。神经网络集成实现的方法主要集中在两个方面,即怎样将多个神经网络的输出结果进行结合和如何产生集成中的个体网络。因此要增强神经网络集成的泛化能力,一方面应尽可能提高个体网络的泛化能力,另一方面应尽可能增大集成中各网络之间的差异。  现在常用的神经网络集成学习方法都是通过扰动训练数据来获得差异较大的个体网络,使个体学习器的误差分布于不同的输入空间而取得较好效果,其中Bagging和Boosting是目前比较流行的两种集成学习方法。  而本文主要讨论如何将扰动数据集和扰动输入属性结合起来,来生成精度更高且差异度更大的个体学习器,再将这多个学习器构建成集成分类模型来解决分类问题。具体的做法是在Bagging方法的基础上,将特征选择技术Relief算法引入集成学习模型的构建中;采用一种构造性的神经网络即覆盖算法作为基础分类器。并且在论文中对传统的Relief算法进行了改进,引入了抽样选择的思想。为了验证所提出的集成分类模型的分类能力,论文中选择了UCI上的一些公共数据集进行了实验。结果表明,本文提出的方法能有效提高普通覆盖集成的泛化能力和分类精度。  最后本文将所提出的方法应用到手写体的0到9的数字识别中,实验取得了较好的效果。
其他文献
软件测试对确保软件质量有着极其重要的作用,但是手工的测试工作是非常繁琐和低效率的,因此测试的自动化就越来越成为重点。软件测试自动化主要包含了:(1)测试用例的自动生成;(
近年来,随着数据的飞速增长,以DAS、NAS、SAN为代表的存储网络系统成为大多信息系统的数据存储中心。随着存储系统的网络化趋势,存储系统逐渐成为恶意攻击者的重要目标,攻击
随着互联网的发展和人们生活水平的提高,电子商务成为了一种时尚和潮流,随之也产生了不少以商品为中心的推荐系统,这类推荐系统利用用户的浏览(购买)记录来给用户其可能想了解或购
随着近年来我国教育水平的提高和国家及各教育机构对人才培养的重视,教育相关的数据量逐年增加。在关于教育信息的申报和评审类系统中,需要对申报的关键信息进行重复检查,以保证
当今是高速发展的信息时代,互联网作为这个时代的重要标志,已经渗透到人类社会的各个领域,互联网的核心TCP/IP协议更是在人们日常的网络信息交换中起到了至关重要的作用。然
近年来,对于视频序列中人体运动行为的视觉分析是计算机视觉领域中日益受到重视的一个研究方向。随着时代的进步,这项技术也在不断的发展完善,在未来必将有广阔的应用前景并
软件测试是保证软件质量的一个重要手段。随着面向对象技术的广泛应用,特别是基于统一建模语言(UML)软件开发技术的逐渐普及,为了满足软件测试自动化的要求,基于UML的面向对
随着人类基因组计划的开展与现代生物技术的迅猛发展,生物信息数据的增长呈现爆炸之势,这为揭开生命奥秘提供了数据基础;计算机运算能力的提高和国际互联网络的发展使得对大规
随着移动互联网时代的全面来临,智能手机与平板电脑日趋大众化,移动智能终端已经成为接入移动互联网的最佳入口。互联网、电信网和广电网内容不断相互渗透,逐步形成三网内容业务
移动机器人可以代替人到各种艰苦、危险的野外环境中执行任务,而野外环境具有复杂性、多变性、随机性等特点,为了保证机器人安全、有效的完成任务需要保证地形分类的实时性和适