基于元学习的决策树分类算法研究

被引量 : 0次 | 上传用户:lichlei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类是一种预言模型技术,是数据挖掘的重要内容之一,在许多领域应用广泛,研究数据分类对数据挖掘技术意义重大。本文总结了分类的相关内容。在众多的分类算法中,决策树算法以其快捷、简单、准确、方便等特点在海量数据环境中应用最为广泛。本文总结了决策树算法的相关内容。决策树算法中,SPRINT算法因为具有良好的伸缩性、加速性和扩容性,以及易于实现并行化等优点,成为了数据挖掘中的优秀算法之一。本文提出了一种通过改变SPRINT算法中属性列表的数据结构来提高建树速度的新方法。实验表明:改进的算法减少了属性列表占用的存储空间以及分割节点操作所需的时间,能在一定程度上有效地提高SPRINT算法的建树速度。分布式数据挖掘是数据挖掘技术与分布式计算的有机结合,主要用于分布式环境下的数据模式发现。将决策树分类算法应用于分布式数据挖掘中,有利于数据挖掘技术在当前分布式数据环境中更好的应用和发挥。本文研究了改进SPRINT算法在分布式环境下的工作过程,进一步研究与实现了基于元学习同构分布式环境下的改进SPRINT算法。实验表明:基于元学习的算法实现结果与集中式环境下的结果大致相同,具有一定的准确性,并且与集中式环境下的实现相比在一定程度上提高了建树速度,提高了分布式环境的利用率。
其他文献
印刷质量的检测与控制可以分为基于密度测量的检测与控制和基于色度测量的检测与控制。传统的印刷质量检测与控制是建立在密度测量基础上的,通过一个闭环体系来进行,并且常用
导致油井修井作业发生故障的因素有很多,其中,最为常见的就是卡钻问题,其不但会造成油井开采工作难以正常有序的运行,而且,还使得油井的开采难度进一步提升。本文首先对油井
学术权力和行政权力是存在于现代大学中的两种基本权力,在对美国密苏里大学堪萨斯城分校发生的学术权力和行政权力冲突的真实案例进行回溯分析的基础上,认为大学自治、学术自
随着方舱在各个领域的广泛应用,如何保证舱内环境温度也得到了关注,而空调的合理选择则起到了至关重要的作用,在机动式方舱中合理选择民用空调也不失为一种经济可行的办法。
目的观察氯吡格雷联合阿司匹林治疗不稳定型心绞痛的疗效与安全性。方法将300例不稳定型心绞痛患者随机分为治疗组(氯吡格雷+阿司匹林)和对照组(阿司匹林),观察2周内心绞痛治
<正>国家烟草行业标准《卷烟条与盒包装纸中挥发性有机化合物的限量》的全面推广,不仅给烟包印刷企业增加了压力,也给为烟包印刷企业服务的油墨生产厂家提出了更大的挑战。要
社团的起源早于公司,公司与社团的契合是特定历史因素作用的结果。一人公司的出现对传统公司社团理论构成严峻的挑战,揭示了其历史局限性。事实上,公司并非天然具有社团性,社
<正>十一五:炭黑总量快速发展十二五:提高全球竞争力一、十一五期间行业发展情况"十一五"期间,我国炭黑总量得到快速发展;品种、质量满足了子午线轮胎发展的需要;节能环保技
本文通过案例中社会认知和法律评价的尴尬碰撞,导入对遗失物拾得问题法律规定的关注和思考;在对我国法律关于拾得人权利义务的规制现状及拾得人报酬请求权的缺位进行反思后,
用户宏程序在数控加工中有着广泛的应用。由于宏程序中使用了各种变量、运算指令和控制指令,大大的简化了程序,而且可以通过设置不同的变量,实现对简单立体型面的手工编程加