【摘 要】
:
决策树是一种有监督的归纳学习算法,它用于对有类标的数据集进行分类,而聚类是一种无监督的学习算法,它可以对无类标的数据集进行分组,使组内的数据相似性最大,组间相似度最
论文部分内容阅读
决策树是一种有监督的归纳学习算法,它用于对有类标的数据集进行分类,而聚类是一种无监督的学习算法,它可以对无类标的数据集进行分组,使组内的数据相似性最大,组间相似度最小。21世纪以来,越来越多的学者开始关注两种方法的融合。本文提出了一种新型的基于无监督决策树的聚类算法,可以对没有类标的数据进行学习,从而对数据集进行划分。新型的基于无监督决策树的聚类过程实际上是构建一棵无监督决策树的过程,测试属性的选择采用离散度和不一致性评估的方法;结点的分裂采用改进的山峰山谷分裂法;算法最后一步规定了树生长延伸的停止标准用以限制树的生长。最终建成树的叶子结点代表聚类结果的簇。实验验证了这种算法划分数据集的有效性,结果表明该学习算法无论是与有监督的学习算法C4.5相比还是与无监督学习算法k均值相比,其划分数据的正确率在一定程度上都有所提高。同时,从生成树的规模角度与C4.5算法作比较,结果表明该算法在一定程度上优于C4.5算法。此外,分析了这种算法的时间复杂度,与其它算法比较说明了此算法有较高的效率。
其他文献
P2P技术是近年来流行的计算机网络结构,不同于客户机服务器结构,P2P中所有的节点都是平等的,没有严格的提供者和消费者的区分,网络中也不存在权威中心对这些节点进行管理。开
随着大数据时代的到来,数据的维度越来越高而且数据中的冗余信息越来越多,统计学习和机器学习从包含大量的冗余信息的数据中学习或发现有用的信息越来越困难,因此在对数据建
分布式信息处理、传感器技术、网络技术的发展推动了多传感器数据融合技术的发展,该技术目前已被广泛地应用于军事和民用的各个领域,在各个方面对人们的生产和生活起了积极的
随着计算机技术、人工智能以及计算机网络技术的快速发展,计算机快速转向开放的、网络平台的、协同工作方式,在这十多年来,源于分布式人工智能(Distributed Artificial Intel
无线Mesh网络(Wireless Mess Network)简称WMN,是一种新型的无线通信网络。它具备网状的拓扑结构的自组织性和自愈特点,并具有有效的移动用户管理和跟踪机制。无线mesh网络既
列车运行系统(TOS)是铁路智能系统(RITS)中的核心系统,也是典型的混杂系统。如何对TOS进行建模分析是RITS研究中的关键问题。由于TOS是一类强实时性的反应系统,其动态行为与
从《机器能思考吗》一文的发表开始,人工智能已经经历从专家系统到神经网络,再到今天统计学习理论几个阶段,这期间涌现了大量优秀的算法和理论。但我们也看到,在智能领域尤其
随着“互联网+”概念的提出,计算机相关技术的应用逐渐与传统的行业结合在一起,为其在现代化的发展道路上创造了新的契机。然而在发展的过程中,传统行业的进步也对计算机技术
机器博弈是人工智能的一个重要研究领域,它在人工智能中的作用与果蝇在遗传学中的研究所起到的作用相似。机器博弈研究的大量成果已经被应用到很多实际的领域当中,如天气预报
随着视频编码技术、网络基础设施、信息家电以及消费电子的迅速发展,以视频内容为核心的流媒体服务已成为信息产业中最具发展前景的业务之一。基于典型的分布式系统Internet