【摘 要】
:
近年来,机器学习和人工智能迅猛发展,广泛用于人们的日常生活中,为社会带来了巨大的影响。特征选择的任务是选择相关特征并丢弃不相关或冗余的特征。然后机器学习算法利用这些包含更多有用信息的特征学习更好的模型从而提高分类性能。近年来,将多个模型的输出结合起来的集成学习通常比单个模型表现更优。因而,特征选择也与集成学习相结合实现集成特征选择以期望进一步提高机器学习的性能。现有的大多数集成特征选择方法都只通过
论文部分内容阅读
近年来,机器学习和人工智能迅猛发展,广泛用于人们的日常生活中,为社会带来了巨大的影响。特征选择的任务是选择相关特征并丢弃不相关或冗余的特征。然后机器学习算法利用这些包含更多有用信息的特征学习更好的模型从而提高分类性能。近年来,将多个模型的输出结合起来的集成学习通常比单个模型表现更优。因而,特征选择也与集成学习相结合实现集成特征选择以期望进一步提高机器学习的性能。现有的大多数集成特征选择方法都只通过最小化训练误差来选择多个特征子集。但是,机器学习的关键是提高模型的泛化能力,即准确预测未来未知样本的能力。具有好的泛化能力的模型不仅在训练数据中获得了良好的训练效果,而且在输入发生微小变化时仍保持稳定。过度强调最小化训练误差会导致过度拟合,因此模型对于输入数据的特征的细微变化过于敏感。这样模型无法很好地泛化到未来样本上。同时,目前的很多集成特征选择方法单独地选择多个特征子集。但是,最终分类模型是由这些特征子集训练的一组子模型的集成。多个子模型之间可能存在相互作用从而限制分类性能上的任何进一步改善。针对现有方法存在的以上问题,本文提出了一种利用径向基函数神经网络(Radial Basis Function Neural Network,RBFNN)的基于训练误差和敏感度的集成特征选择(training error and sensitivity-based ensemble feature selection,TESEFS)方法。将训练误差和整体灵敏度作为两个目标函数,然后利用多目标遗传算法NSGA-III(Non-Dominated Sorting Genetic Algorithm III)为所有基本分类器选择最佳特征子集。在18个数据集上的实验结果显示,所提出的方法优于最新的集成特征选择方法,并在大多数情况下取得了显著的提升。
其他文献
[目的]已有大量的参考文献证明,氟化物能够引起肝脏的损伤。本试验通过添加不同浓度的钙研究氟化物对大鼠肝脏相关凋亡的蛋白及基因的表达量的影响,发现缓解氟中毒的最佳钙浓
随着全球化的发展,各国间的交流与合作日趋频繁。在这种跨语言的交际活动中,口译扮演着不可替代的角色。巴黎高翻首任校长达妮卡·塞莱丝柯维奇提出的释意理论对口译研究和口
本文研究Degasperis-Procesi方程孤立子的轨道稳定性及孤立子附近的爆破解.应用广义伪共形变换方法,将Degasperis-Procesi方程Cauchy问题在孤立子附近的解分解如下:λ1/2(t)u
当前由于二氧化碳和甲烷等温室气体排放导致全球变暖,土壤温度也随着温室气体排放逐渐升高。紧接着会对土壤有机质的含量产生影响。作物的生长与土壤养分含量息息相关。土壤
我国城市交通处于快速发展阶段。但是发展的过程中也带来了许多问题,比如空气污染和交通拥堵问题。其中,城市轨道交通具有高效、速度稳定、运量大的特点,可缓解城市交通发展带来的问题,有助于建立一个高效的城市交通系统。本文旨在探讨城市轨道交通运营者如何运用优化模型和模拟退火算法,结合线路具体运营状况,以缩短乘客总等待时间和节省运营成本为综合目标,得到列车时刻表和车底协同优化调度方案。在目标函数的设定中,不仅
近年来,为缓解油气资源紧张,国内外均在页岩气、天然气水合物等非常规油气资源勘探与开发方面取得了长足的进展。但整体而言,我国在该领域尚处于起步阶段,与国际先进水平相比
近年来中央出台了《农业科技发展纲要(2001-2010年)》、《关于引导农村土地经营权有序流转发展农业适度规模经营的意见》等一系列政策性文件,肯定了涉农企业在我国农业现代化
土壤生物群落复杂而多样,不同生物的体型大小不尽相同。体型大小作为土壤生物最基本的生活史性状,其与丰度之间的关系能解释资源在生态系统中的分配及与生态系统功能的关系。
近年来,金属磷化物由于其在半导体和催化剂工业中的潜在应用而受到人们的广泛关注。钼磷化合物是金属磷化物中的重要一类,其具有优异的物理性能和奇特的结构特点,因此对钼磷
电力系统规模不断扩大,风能等清洁能源接入比例越来越大,直流输电容量与规模不断突破新高,交直流混联系统电压稳定控制愈加复杂。负荷特性对电压稳定起着重要的作用,交直流系统静态电压稳定域的研究对系统稳定运行控制提供了新的参考,本文综合考虑负荷静特性、风电接入及直流控制方式等因素,对交直流系统静态电压稳定域进行相关研究。首先,根据负荷电压、频率静特性模型,寻找其与电力系统静态电压稳定的紧密联系,基于连续潮