UDEED算法改进及其在Boosting中的应用

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:highlove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
半监督集成学习(semi-supervised Ensemble)是利用半监督和集成学习来提升模型性能的一种方法。半监督学习改善了集成学习中样本量存在不足的问题,在基分类器的训练过程中提升了集成学习多样性;集成学习又提升了半监督学习的收敛速率,降低使用无标签样本的风险。UDEED(Exploiting Unlabeled Data to Enhance Ensemble Diversity)算法是一种半监督集成算法,它在最大化准确率的同时,引入无标签样本以增强集成学习器间的多样性。它以线性Logistic函数为基分类器,以梯度下降法求解模型参数达到最小化目标函数的目的。本文针对UDEED算法采用线性Logistic函数适应性不足的问题,提出了一种基于多项式核函数的非线性Logistic模型,改进了核函数的参数估计方法,通过实证方式验证了该方法的有效性和可行性。在此基础上将多项式核函数的非线性Logistic模型引入到半监督集成学习方法UDEED算法中,得到了在该模型下的参数估计方法,建立了基于经验误差和多样性度量的目标损失函数最小化模型,得到了非线性Logistic模型下目标函数的梯度公式。另外,受UDEED算法的启发,提出了改进的Adaboost算法,将无标签样本的余弦相似度引入集成学习弱分类器选择规则中,在同时考虑经验误差和分类器多样性基础上,构造基分类器选择公式。为验证UDEED原理对Boosting算法的普遍有效性,将无标签样本的余弦相似度也引入到LogitBoost算法中,以准确率和ROC曲线作为指标,实证了改进LogitBoost算法的优越性。
其他文献
随着工业化进程的不断加快,雾霾天气频发,导致了空气中气溶胶颗粒增多。气溶胶会使到达地面的辐射光谱组成,即光质,发生变化。而光又是影响光合作用的重要因子,因此针对光质
随着监控网络规模的不断扩大,由此产生的海量信息对传统的视频监控技术带来了巨大挑战。行人重识别作为智能视频监控领域中的一项新兴技术,旨在海量监控视频资源内寻找不同监
近年来,随着航天技术的不断进步,我国对外太空的探索变得更加频繁,尤其是在探月工程上,到目前为止我国已领先世界各国,比如嫦娥四号的圆满成功,使我国成为了人类首次在月球背
随着石油工业和其他工业的发展,工业和生活中不可避免的产生了大量的含油废水,对生态环境和人类健康造成了一定的影响。因此,研究含油污水的处理技术具有重要的现实意义。传
我国幅员辽阔,山区面积大,尤其是我国西部地区分布着大量自然边坡和人工边坡。近年来,地球地壳活动频发,我国发生了多起破坏力极强、作用面积极广的大地震,对我国山区建筑和
砒砂岩是一种发育不充分的岩石互层,因成岩程度较低,砒砂岩具有易风化、抗侵蚀能力弱及遇水容易溃散等特性。砒砂岩易水蚀溃散的特性加剧了黄土高原的水土流失及生态退化,产
锂离子电池凭借其高比能量,高工作电压,优异的循环性能以及快充快放能力在储能领域占据不可取代的地位。而市场需求的增长,对锂离子电池的高能量密度提出了进一步的要求,尤其是锂离子电池正极材料的发展,已经成为锂离子电池发展的重要瓶颈之一。层状正极材料因其具有较高的理论容量以及循环性能而受到广泛关注。其中LiCoO2材料以其优异的循环寿命,倍率性能和高能量密度最早走上商业舞台,尤其是在 3C(Compute
尿液是人体代谢的主要排泄物,尿液中含有大量营养素,其虽然只占污水处理厂处理量的1%,但却贡献了大约80%的N、50%的P及90%的K,因此从生态卫生和资源回用的理念,采用尿液源分
随着近些年我国水运行业的快速发展,船闸作为内河航运重要节点的交通枢纽,满负荷运转的状况日益增多,导致其结构安全隐患也愈发凸显。包括船闸人字门、蘑菇头等船闸主体部件,在巨大的水压差、动水载荷及涌浪等外界条件的长期作用下,会逐渐出现裂纹以及一定的形变,从而引发船闸部件断裂等严重后果。这样不仅影响通航船只的安全,而且还会对国家产生巨大的经济损失。针对船闸结构安全,特别是水下闸门门体、门中缝和底止水等关键
地表温度(land surface temperature,LST)是表征气候变化的重要环境参数,且在表征地表能量转换方面具有重要的作用。目前获取的高分辨率遥感影像,通常没有热红外波段,而能够