数据挖掘中的高速可伸缩分类算法

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:a81569476
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘又称数据库中的知识发现,是数据库研究最活跃的领域之一。通过数据挖掘可以从大量数据中提取出可信、新颖、有效并易于理解的知识、规律和高层信息。发现的知识可用于决策、过程控制、信息管理、查询处理等方面,因此数据挖掘的技术和应用有了飞快的发展。 分类是数据挖掘中的一个重要部分。分类的目的是学会一个分类函数或分类模型,也常常称作分类器。该模型能把数据库中的数据项映射到给定类别中的某一个。分类可用于预测,分类的输出是离散的类别值。 分类的方法很多,其中决策树是一种最常用的算法。与其他分类算法相比,他能够较快的建立简单、易于理解的模型,容易转换成规则,而且具有与其他分类模型同样的甚至更好的分类准确性。 高速可伸缩分类算法(FSCA)是我设计的一种数据挖掘算法。他通过预排序技术,着重解决当训练集数据量巨大,无法全部放入内存时,如何高速准确地生成决策树,能同时处理离散字段和连续字段。
其他文献
时下,各级党政公仆把怎样树立科学的政绩观当作一个重要命题来议论。仁者见仁,智者见智,认识各不相同。我曾在宁武县化北屯乡担任党委书记5年。我体会到:看不见的政绩最可贵
广义严格对角占优矩阵具有很广的实际背景,这类特殊矩阵在数值代数、控制论、电力系统理论、经济数学及弹性力学等众多领域中有着重要的实用价值。但实际中对此类矩阵进行有
学位
向量优化理论已被广泛地应用到了许多领域,如工程设计,经济与管理,军事与政治,生产与计划,资源的合理利用以及生态环境保护.而在解决这些实际问题时,总要牵涉到许多因素,如买卖商品
高光谱遥感作为遥感技术的发展前沿,它在农业、林业、地质、海洋、军事等方面发挥着越来越重要的作用。高光谱信息处理的一个重要研究方向是对高光谱图像进行分类,而更好地实现各种应用的先决条件是分类算法的精度高。高光谱图像具有多波段数、大数据量、高分辨率等特点,使用传统图像分类技术对高光谱图像进行分类难以取得好的效果。本文利用支持向量机在高维、非线性以及有限样本情形下表现出的优势,考虑到高光谱图像数据的特殊
本文将这种随机离散化方法应用到了分组数据的统计推断中,并把这种方法做了改进.分组数据是可靠性试验中常见的一类不完全数据,由于似然函数的复杂性,使得Bayes分析很困难.本
《义务教育英语课程标准(2011年版)》指出:“计算机和网络技术为学生个性化学习和自主学习创造了有利条件,为学生提供了适应信息时代需要的新的学习模式。”在信息时代的今天
近年来,很多从事编码理论的研究者将研究的兴趣从有限域上的编码理论转移到有限环上,尤其是Z码的研究,通过Gray映射,将Z上的码与域上二元码联系起来.在前人的研究基础上,本论
2004年2月,在河北省林业系统加强领导班子和干部队伍建设大会上,孟滦林管局被评为“全省林业实绩突出单位”,并就如何加强领导班子建设问题在大会上作了经验性发言。之所以获
Schr(o)dinger方程是描述物理系统的量子态随时间演化的偏微分方程,是量子力学的基础方程之一,在原子、分子、固体物理、核物理、化学等领域中被广泛应用,而分数阶Schr(o)dinger