基于单变量决策树的不完备信息系统规则提取研究

来源 :第二十三届中国数据库学术会议(NDBC2006) | 被引量 : 0次 | 上传用户:jay1222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
规则提取是数据挖掘研究的主要内容之一.目前基于完备信息系统的规则提取方法已经很成熟,而基于不完备信息系统的规则提取方法还不很完善.通常不完备信息系统的规则提取方法是,首先将不完备信息系统转变为完备信息系统,然后用完备信息系统规则提取的方法提取规则.而直接从不完备信息系统中提取规则的算法还不是很多.决策树方法是一种重要的数据挖掘方法,它尤其适合于挖掘分类规则.决策树方法是利用信息论中信息增益(互信息)寻找数据库中具有最大信息量的字段,建立决策树的一个结点,再根据字段的不同取值建立树的分支.每个分支子集重复建立树的下层结点和分支的过程.它提取出来的规则简单而精确,具有易于算法构造,规则易于理解,效率较高等特点.但是它不能有效地分析和处理不精确、不一致、不完备等各种信息,不能从中发现隐含的知识,揭示潜在规律.本文提出了一种基于单变量决策树的不完备信息系统的规则提取方法,将决策树方法应用到了不完备信息系统中,可以对不完备信息系统直接进行规则提取。
其他文献
CBCT的图像质量与扫描所采用的KV值、mAs大小、过滤方式以及重建方式有关;也与扫描过程中器官生理运动有关。本文首先影像引导系统XVI进行了介绍,阐述了CBCT的图像质量、CBCT
本文将形状与体积已知的模体分别置放于Conebeam CT的不同位置进行XVT扫描,并与普通螺旋CT中扫描结果及模体标称值进行比较,从而描述Conebeam CT进行XVI扫描重建精度,并检查
近日,永诚保险上海分公司在“兴业银行2009年度保险供应商”招标活动中,成功中标意外险项目。永城保险表示,该此项目的中标是永诚保险上海分公司在拓展银行保险渠道方面的新
本文介绍了钛以及钛粉的用途以及其重要性,对比了目前生产钛粉的几种方法,着重介绍了生产加工钛粉最常用的方法--氢化脱氢法.柔韧的海绵钛金属颗粒、边角钛或者废钛屑在一定
会议
本文采用仿真邮件系统得到的数据来建立社会犯罪集团网络,提出了基于社会网络中的六度定理的最短路径算法SPLINE,并在此基础上提出了犯罪集团网络核心成员挖掘算法KMM,通过实
阈值分割可分为两种:二值化和多值化.在二值化方法中,传统二维阈值分割算法大部分是在假设双峰情况下研究的,不少人将传统方法推广到多阈值分割,也有采用改进聚类分析的方案
会议
聚类分析是研究和处理所给定对象分类的数学方法,它将对象划分为一系列的子对象(或类),使得每一类中的数据尽量地相似,不同类尽可能有较大差异.广泛使用的聚类算法有K-Means,
会议
这篇文章针对当前Clique聚类算法中划分粒度选取时出现的问题,提出了GC-Clustering算法.GC-Clustering算法要求用户提供的参数分别为描述长度的参数l和密度参数σ,密度参数σ
会议
本文提出了一种新的有效的文本聚类算法RTC,该算法在球形k-means的基础上运用两种不同的策略:优化的初始中心选择和划分调整来解决文本聚类中容易陷入质量差的局部最优状态问
随着互联网的飞速发展,网络上的网页数目也在急速膨胀.面对庞大的Web空间,用户要进行有效的浏览变得非常困难,常常"迷失"在错综复杂的链接中.这样,开发各种浏览导航工具就变
会议