【摘 要】
:
集成学习是一种机器学习范式。相对传统的单个分类器,通过组合多个分类器,集成学习能显著地提高分类器的泛化能力。目前,集成学习在疾病诊断、生物特征识别、文本分类和信息
论文部分内容阅读
集成学习是一种机器学习范式。相对传统的单个分类器,通过组合多个分类器,集成学习能显著地提高分类器的泛化能力。目前,集成学习在疾病诊断、生物特征识别、文本分类和信息处理等领域获得了广泛应用。作为集成学习的一个研究方向,选择性集成学习试图从已有的个体学习机中剔除一些性能不佳的,从而获得更好的集成性能。然而,在选择性集成系统中如何选取基分类器,确定最优分类器组合等,仍需进一步深入研究。论文研究对提高集成系统性能,促进集成学习在实际中应用,具有重要的理论与现实意义。论文从集成学习基础理论、集成方法、选择性集成及应用等方面进行研究,重点研究了集成学习中基分类器选取问题,主要研究内容和工作成果如下:1、对集成学习理论进行了深入分析,研究了集成学习理论基础,基分类器产生、基分类器融合方式及集成性能评价指标。考虑到实际应用数据复杂性,研究了数据预处理、归一化、降维及不平衡数据处理方法,为后续研究奠定基础。2、集成学习因其显著提高一个学习系统的泛化能力而得到机器学习界的广泛关注。以决策树分类方法为基础,运用Bagging算法,结合医疗疾病数据,构建基于Bagging的决策树集成诊断模型。对比集成学习模型与单一决策树模型的诊断性能,实验结果验证了集成学习诊断方法具有更好的泛化能力。3、基分类器的准确率与多样性在集成学习机的构建中起着至关重要的作用。针对基分类器选取问题,提出了一种兼顾准确率和多样性的BAD(Balancing Accuracy and Diversity)选取准则;在此基础上,建立了BAD的选择性集成模型,实验分析了BAD准则中,不同权值的准确率和多样性对集成模型准确率的影响,同时也验证了BAD准则的有效性。在基分类器选取方法上,以遗传算法为基础,结合前序和后序选择思想,提出了一种FBGA(Forward and Backward Genetic Algorithm)选取方法,实验结果表明,FBGA方法在搜索结果上表现出较好性能。
其他文献
精确的原子光谱参数可用于天体等离子体和实验室等离子体中的谱线识别以及等离子体的模拟和诊断,在理论和实验上都有非常重要的研究价值。本文采用多组态Dirca-Fock(MCDF)以及多体微扰理论(MBPT)两种最先进的完全相对论方法对类氮Se XXVIII和类氮Sr ⅩⅩⅩⅫ的能级结构和辐射跃迁特性等原子光谱参数进行了理论计算,建立了高精度的原子光谱参数数据库。本文主要包括:一、类氮Se ⅩⅩⅧ的激发
试验旨在比较研究不同羽速太行鸡生产性能、蛋品质、主要消化酶及营养物质表观代谢率和免疫机能的不同,为太行鸡的合理利用提供参考依据。试验选取健康初生快慢羽太行鸡母雏
伪蝎身形似蝎,但个体非常小,螯伪蝎科Cheliferidae全世界广泛分布,隶属于节肢动物门Arthropoda蛛形纲Arachnida伪蝎目Pseudoscorpiones有毒亚目Iocheirata螯伪蝎总科Cheliferoidea。本文对中国螯伪蝎科进行了系统的分类研究,第一章和第二章对螯伪蝎科的形态特征、分类地位、国内外研究进展以及采集和处理方法进行了较为详细的介绍。第三章对本实验室保存
近年来弹性金属塑料瓦推力轴承广泛适用于水轮发电机组、舰船传动装置、水泵机组和大型矿山挖掘机等机械设备。与传统的巴士合金瓦推力轴承相比,弹性金属塑料瓦推力轴承具有摩擦系数小、自润滑性能好以及绝热性强等优点,在一些领域已成功取代巴士合金瓦推力轴承的地位。本文以中心点支承的圆形弹性金属塑料瓦推力轴承为研究对象。首先,建立该类轴承流体润滑数学模型,并确定各基本方程的边界条件,采用有限元法求解上述数学模型。
变频空调、变频冰箱已经成为每个家庭的主要设备,而且使用量也在逐年增加,同时也带来了许多的谐波污染,另外,此类设备中主要采用直流变频压缩机,变频压缩机的COP值的提高对节
随着工业的发展,在实际工业过程控制系统中,有很多工业系统的过程模型存在不稳定环节如不稳定极点。由于这些不稳定环节的存在,系统的稳定性会受到强烈影响,其动态性能和鲁棒
为了能在低温下通过浮选方法有效的分选出四川清平地区中低品位难选胶磷矿中的磷矿物,论文以十二醇、酒石酸、烷基酚聚氧乙烯醚和碘值135的棉油脂肪酸为原料合成并复配的得到
环氧化合物作为常见的环状结构单元,广泛存在于天然产物及药物活性分子中,并是重要的有机合成中间体。因其本身固有的环张力,环氧化合物容易开环-官能团化,从而能实现众多有价值有机分子的合成。近三十年来,催化环氧化研究已经取得显著进展,包括以Sharpless环氧化为代表的烯烃环氧化反应已证明是工业界和学术界合成环氧化合物的有力工具;此外,硫叶立德或α-卤代羧酸酯与羰基化合物间的环氧化反应,同样也是合成环
磨矿过程是选矿工艺中很重要的一环,磨矿产品的粒度是磨矿工艺的一个重要指标,粒度检测的方法较多,为适应选矿自动化发展的需求,发展出了多种较为先进的粒度检测方法技术,如
近年来,多智能体系统受到越来越多的关注,如一致性控制,分布式编队控制和分布式优化等。其中,分布式优化在无线传感器网络,智能电网和机器学习等许多军事领域或民用领域具有