基于混合集成模型的不完全标记数据流分类方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:kangliwonuer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据流分类在网络监控、传感器网络等实际领域有着广泛地应用。然而,实际数据流中存在类标签大量缺失、概念漂移和类分布不平衡的问题,这些问题严重加剧了数据流分类问题求解的难度。本文针对类标签大量缺失数据流中的概念漂移和类分布不平衡问题开展分类方法研究,因而选题具有重要的理论和应用价值。论文主要工作如下:  (1)概述了数据流、概念漂移和倾斜数据流的相关定义、存在挑战、处理方法以及评价标准等。  (2)针对已有的不完全标记数据流分类方法多采用集成模型自适应概念漂移环境而忽略了概念漂移检测等问题,提出基于概念漂移检测和模型选择的集成分类方法,该方法采用基于分类器与聚类簇模型的混合集成模型,其次,为了适应概念漂移环境,采用一种基于概念分布差异度的概念漂移检测方法;同时,为了适应无限数据流环境,先对集成模型中的基模型采用基于时间戳加权机制,同时考虑加权因子和概念分布差异度选择基模型以进行模型更新。实验结果表明该方法可以快速的检测出概念漂移并提升分类精度。  (3)针对不完全标记数据流的类分布不平衡问题,提出一种基于距离和采样机制的数据流分类方法。该方法首先计算无标签数据与有标签正负类数据块的中心点距离来标记正负类示例,其次通过正类样本的上采样和负类样本的下采样机制重组数据流块以平衡数据块的类分布,并在其上构建基于分类器与聚类簇模型的混合集成分类模型。实验结果表明:与经典的同类算法相比,所提方法可以有效的提高不完全标记数据流的分类精度。
其他文献
构建安全的校园环境,营造和谐的寝室氛围,建立良好的寝室人际关系,是全社会、各高校、众多师生的共同愿望.本文对影响寝室人际关系的主要因素进行梳理,结合三全育人理念的具
[摘 要] 思想政治教育是大学生思想政治工作的核心。虽然高校在经济上已经给予贫困生较大力度的支持,保证他们能够顺利入学完成学业,但是仅局限于物质上的帮助并不能真正解决家庭经济困难学生的“贫困”问题。医学贫困生作为一个特殊的群体,是未来生命的守护者,如何对其进行有效的思想政治教育,培养良好的医德,帮助其健康成长成才成为一个重要课题。本文对医学院校中困于家、困于学、困于心的贫困生展开研究,分析医学贫困
在金刚石氮空位色心的高灵敏传感探测研究中,光学调控是氮空位色心实现高效光学初态制备及信息提取的关键.本文基于高浓度的金刚石氮空位色心系综检测展开,采用脉冲光学探测
随着P2P网络的发展,如何保障交互安全成为P2P网络需要解决的首要问题。而信任系统被证明是解决P2P网络安全问题最有效的技术之一,但现有的信任系统在信任更新机制方面还不够
目前,获取遥感数据的手段越来越多,遥感数据的最大特点是信息的多源性。如何有效的利用这些数据,实现多源数据的优势互补,遥感图像融合技术为解决这些问题应运而生,并成为图像处理
随着社会信息化程度的不断加快,海量数据的处理越来越受到人们的重视,如何安全高效的存储和处理这些庞大的数据成为了一个亟待解决的问题。分布式存储系统(DSS)的出现则很好
Objective To explore tissue expression of cyclin-dependent kinase inhibitor p27~(Kip1) andβ-catenin in multiple endocrine neoplasia type1(MEN1)-related parathy
2016-2018年,在四川省广汉市分析了深旋耕播种(DRT)、浅旋耕播种(SRT)和免耕带旋播种(NT)3种耕播方式对稻茬小麦生长和养分吸收利用的影响.结果 表明:与DRT相比,SRT和NT处理
发布/订阅系统属于分布式计算范围,其系统具有一定的复杂性。监控发布/订阅系统中各个参与者的收发状态及连接关系是很重要的组成部分,可以有利于系统管理员妥善的管理该系统并
新时代新使命,高校德育要以习近平新时代中国特色社会主义思想为指导,全面贯彻党的教育方针,坚持社会主义办学方向,落实立德树人的根本任务,努力培养担当民族复兴大任的时代