基于数据抽取器的知识发现处理模型

来源 :计算机科学 | 被引量 : 0次 | 上传用户:kakayang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了基于数据抽取器的知识发现模型。在模型中,将知识发现过程分成数据预处理、数据抽取、数据挖掘和结果分析四个阶段。该模型利用标准的SQL语言构造数据抽取器,为不同的学习算法准备数据,减少数据挖掘算法对数据库直接调用的次数,避免了直接对大型数据库的数据进行调用,使得对大型数据库进行快速数据挖掘成为可能。可以加快知识发现过程,提高数据挖掘效率,实现对于大型数据库的知识发现。最后设计了SQL-C4.5算法,该算法实现了利用数据抽取器为决策树算法C4.5抽取必要的统计数据,实现了C4.5决策树的构建。
其他文献
单向Hash函数在数字签名、身份认证和完整性检验等方面得到广泛的应用,也是现代密码领域中的研究热点。本文中,首先利用神经网络来训练一维非线性映射产生的混沌序列,然后利用改
最大频繁项集的生成是影响关联规则挖掘的关键问题,Apriori算法从大量的候选频繁项集产生频繁项集的过程是非常耗时的过程。本文提出了一种新的算法,该算法结合项集的有序特性
本文基于移动Ad hoc网络的广播特性、分簇的普遍性等特点,在分析分布式服务发现协议GSD等的基础上,提出了新的服务发现机制,该机制考虑了各节点处理能力、存储能力以及所提供
嵌入式零树小渡(EZW)编码方法是一种简单而高效的图像编码算法。影响EZW算法性能的因素有很多,本文主要从图像类型、小渡基和小波分解层数这3种因素出发通过大量的实验数据对它
细支气管肺泡癌(BAC)是一种异源性肿瘤,起源于细支气管Clara细胞,肺泡Ⅱ型上皮细胞及化生的粘液细胞,是肺癌中独立存在的类型. 我院自1990年至2000年共收治BAC 8例,现报告如
对于高维复杂函数,一般粒子群优化算法收敛速度慢,易早熟收敛。本文重构一个适合高维复杂函数惯性权重函数,使粒子群算法寻优过程中的全局收搜能力和局部收搜能力良好平衡,以达到
空间数据库中关联规则挖掘不仅需要考虑关系元组属性之间的关系——纵向关系,更需要挖掘元组之间的关系——横向关系,如相邻、相交、重叠等。本文通过分析空间数据库的存储模式
本文对现有 Web 图像检索技术现状进行了归纳,分析阐明了图像降维算法在基于内容的 Web 图像检索技术中的地位和作用。在介绍了几种经典图像降维方法后,重点介绍了国外近来提出的基于拉普拉斯特征值映射(LE)的图像降维算法。针对 Web 环境下图像检索必须进行剧烈降维的特点,本文进而对基于 KL 变换的主成分分析(PCA)算法和基于 LE 的图像降维算法进行了实验分析和比较。实验结果表明:对于需要进
提出了一种基于复合离散混沌系统的对称图像加密算法。在该算法中,通过复合离散混沌系统隐藏了混沌序列产生时所经历的迭代次数,来避免常用的基于符号动力学的密码分析。理论分
临床教学是医学教育的主要组成部分,临床教学一般分为课间实习和毕业实习两部分.