基于知识整合的数据流分类算法研究

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:hrbwqwq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据流中概念漂移的产生不仅仅会引起分类结果的变化而且会引起分类器模型的变化。本文针对这一问题提出了一种基于决策树知识整合的处理方法KIDDT(Knowledge Integration Dynamic Decision Tree)。该方法考虑在数据流中截取适当的数据块儿来构造部分决策树知识模式,然后对这些部分知识模式进行知识整合。整合过程将系综分类算法中的加权思想应用于属性的选择中以处理概念漂移问题。整合后的知识模式即最终决策树综合了多个分类器的不完整知识模式,形成相对完整统一的知识结构,预测样本时仅仅利用经过虚拟剪枝处理后的分类器进行一次决策就可以判断样本的所属类别。该算法具有较高的分类精度与可理解性。KIDDT知识整合系统开发使用开源数据挖掘软件WEKA以及JAVA编译环境Myeclipse6.5。系统实现后利用一系列的实验验证了KIDDT算法在数据流分类中的优越性和有效性。
其他文献
随着信息技术和网络技术的发展,互联网上的信息和资源出现了爆炸性的增长。为了提高用户的有效信息获取能力,个性化推荐系统将会发挥越来越重要的作用。传统的协同过滤推荐技
近年来,计算机和互联网技术的迅速发展越来越显著地改变着人们的生活,多媒体就是借助这两项技术而诞生的应用领域。因此,保护多媒体信息的安全成为人们日益关注的问题。加密
随着无纸化办公成为当前的发展趋势,电子文档得到了广泛应用。各级政府及军事科研机构等部门大量涉密信息都以电子文档的形式存在。电子文档的安全问题便成为一个亟待解决的
虹膜识别是新兴的生物识别技术之一,受到了信息安全领域研究者的广泛关注。与其他生物特征识别技术相比,虹膜识别具唯一性、稳定性、防伪性、非侵入性等特点,使得虹膜识别技
随着网络在全球的普及,Internet已经深入到人类社会的方方面面,随之而来的,与Internet相关的安全事件愈来愈多,对人类生产与生活的影响也日益严重。尤其是蠕虫、僵尸网络以及DDOS
近年来,随着交互式问答应用的兴起,越来越多的人关注人机交互式的信息获取形式,大部分的自动问答系统都是基于FAQ的形式,而没有对问题本身进行理解,本文面向对用户问题的理解,针对
Petri网的可达性是Petri网的重要性质,其判定问题在Petri网理论中是一个重要课题。本文对Petri网的可达标识集做了一些分析,主要内容包括以下几个方面:1)提出了Petri网的表征
网络流量分类是指按照一定的规则识别应用层的网络协议。由于传统的端口和特征匹配的方法的效率和准确率都不够理想,很多学者将机器学习应用到网络流量分类领域,基于统计的网
随着信息技术的普及和互联网技术的飞速发展,人类积累的数据量正在以指数的速度迅速增长。在数字图书馆领域,CADAL已经积累大量的数字图书,并提供了相应的图书阅读服务。显然
可大规模部署的、廉价的无线传感器网络有着十分重要的研究和应用价值。通过对传感器网络所获得的感知数据进行查询和分析,可以对物理世界进行有效地监测。基于传感器节点产生