【摘 要】
:
在这个信息科学时代,随着软件和硬件的快速发展,现在的数据的获取和存储速度越来越快。在现今社会,数据无处不在。另外一方面,大量的数据中也产生了数据的噪音和数据的冗余。
论文部分内容阅读
在这个信息科学时代,随着软件和硬件的快速发展,现在的数据的获取和存储速度越来越快。在现今社会,数据无处不在。另外一方面,大量的数据中也产生了数据的噪音和数据的冗余。如何正确地对该类数据进行正确的处理,并挖掘其中有用的信息,是当今信息技术时代的的一个难题。计算科学领域中的机器学习和数据挖掘算法就是其中的一个解决问题的方法。机器学习和数据挖掘算法可以从大量的数据中挖掘有用的信息,并建立有效的学习模型。集成学习作为机器学习和数据挖掘领域的重要研究分支之一,吸引了越来越多的研究者的兴趣。这也是集成学习算法的有效性、鲁棒性的结果。可是,研究者一般只针对其中的样本维或者属性维进行一定的研究,没有把两者结合起来一同处理。为了解决这个问题,并有效地应用到带噪音的冗余的数据中,该论文提出了渐进式集成学习算法。该算法将一起对数据集的样本维和属性维一起进行研究,并应用在分类领域中。另外,不同分支的分类能力也有所不同,使用渐进式的分类器选择算法可以有效地选择强壮的分支,从而达到提高整体模型的分类准确率和鲁棒性。作为一个分类算法,渐进式集成学习算法可以很好地应用在带噪音标签数据的分类、数据流的分类、文档图像的分类等场景。
其他文献
在深化改革和现代化建设的大环境下,回顾参政党理论建设历程,把握最新研究动态,拓宽思考参政党自身建设问题的视野,改进研究方法,仍然是深化参政党建设理论研究,提高民主党派自身建
钢铁企业电力系统具有负荷大、能耗高、生产连续性强、单机容量大、冲击负荷大且三相不平衡等特点,这些特点决定了钢铁企业电力系统的监测、调度与优化控制涉及发电、输电、
尊敬的中央社院叶小文书记、各位副院长、各位专家、同志们:大家上午好!在这秋风送爽,丹桂飘香的金秋时节.正值中国2010年上海世博会开幕160天之际,中央社院和各省区市社院的领导
农历六月.正是“绿树荫浓”的炎炎盛夏,而HP即将推出的“全能由您掌握,惠普好礼物任您选”活动,却比这如火骄阳更加热力四射。HP以全面引领一体化办公简约潮流之势,携旗下喷墨一体
本文概述了王仲仁教授在应用塑性力学解决有关塑性加工理论问题的基本思路和所取得的主要进展,它不仅为用塑性力学分析塑性加工问题提供了工程塑性理论,也是对塑性力学的发展
目的探讨学龄儿童行为问题与感觉统合的关系.方法选取太原市3所小学419名6~11岁儿童为研究对象,采用Achenbach儿童行为量表(CBCL),感觉统合检核表及环境因素问卷.结果行为问题
<正>近日,省政府印发了《四川省"十三五"脱贫攻坚规划》(以下简称《规划》)。《规划》明确了"十三五"时期全省脱贫攻坚总体要求、目标任务、建设内容和保障措施,提出了打赢脱
随着我国社会转型和阶级阶层的不断分化,要求我国的多党合作制度发挥更强的包容力与适应性,扩大政党的社会基础和群众基础,把多党合作事业推向前进。其中采取“不变形式变内涵”
以历届国际板料成形数值模拟会议(NUMISHEET)及其标准考题研究结果为主要线索,对板料成形数值模拟的研究历史及发展现状作了简要综述,并对当前的研究热点和发展方向进行
目的对直肠癌患者术后的临床护理进行探讨,并实行有效的护理对策。方法 32例行直肠癌根治术的直肠癌患者,均给予术后临床观察及护理、术后常见问题护理及出院指导,观察护理效