基于粗糙集和数据库技术的知识发现与推理方法研究

被引量 : 0次 | 上传用户:gengkc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于数据库的知识发现(KDD)又称数据挖掘(DM)是一种新的用于对数据库中大量数据进行处理的智能信息处理技术,是构建智能商务、新型决策支持系统等新型智能信息系统的一种基本构件,是当前智能信息技术研究的热点。粗糙集(Roug集)理论是波兰数学家Pawlak提出的一种研究不精确和不确定问题的数学工具。是目前公认的研究数据挖掘、知识约简和粒计算等的理论基础。数据库技术是管理和操纵数据库中大量数据的最先进最有效的技术。充分利用数据库技术所具有的对数据库中数据操作的优势,来改进或设计新的适合于大数据集的高效数据挖掘算法,是许多学者正在探索的一个有效途径。本文以粗糙集理论作为研究的主要理论依据,并充分考虑和运用数据库技术的优越性,对目前数据挖掘中存在的一些问题进行了研究,提出了有效可行的解决方案。本文研究内容如下:1.对属性约简算法中基于分辨矩阵求取核属性的时空代价以及必要性进行了分析,基于Rough集的有关理论和数据库技术对基于粗糙集的属性约简算法进行了改进,实验表明在大数据集上该算法的效率大大高于一些基于主存的属性约简算法,且易于实现和使用。2.针对Rough集中刻画属性分类能力的主要机制正区域等不能全面地反映属性对分类贡献能力的问题,提出了一个在Rough集中刻画属性分类综合贡献能力的测度——属性分类粗糙度,理论分析和实验表明,作为分类算法中选择属性的测度,该测度优于信息增益,且与信息增益率相当,且计算更为简单。并基于该测度和本文其它有关研究提出了一个具有良好可扩展性和适应性的分类算法,该算法可直接生成决策树或分类规则。3.分析了目前数据挖掘算法在处理噪音数据、不一致数据方面存在的问题,基于可变精度Rough集模型提出了一个在基于等价类的分部寻优归纳的分类算法(如决策树算法)中更有效的处理噪音数据的新方法——预剪枝方法;并基于Rough集的有关理论提出了一种可与这种归纳分类方法高度融合的检测和处理不相容数据的简单有效的方法。4.提出了一个利用关系数据库组织逻辑上为树形结构的知识库的方法,以及在这种知识库组织方式的基础上基于数据库查询的推理方法。
其他文献
动力电池组的荷电状态(SOC)是电动汽车能量控制的重要参数.针对串联锂电池组的SOC估计问题,建立电池组的Vmin状态空间模型,电池组内单体电池负载电压的最小值Vmin和电池组的S
近年来,发展海洋石油已经成为国家能源开发的主要方向,海底管道作为连接海洋平台之间安全、经济、快捷的运输方式已经被广泛应用。而我国的海底管道,无论是设计还是施工水平,
ITK、VTK在医学图像处理与显示方面有强大的功能,但是它缺乏友好的交互界面。通过将其与MFC相结合,设计一个用于医学图像配准的可视化平台,并集成大量图像配准算法和开发交互
在全球化经济环境中,竞争的加剧促使学者去识别可持续竞争优势的驱动力。关于驱动力的研究已经从有形资产领域延伸至无形资产领域。近年来,无形资产日益重要。无形资产在创造
博物馆建筑的发展水平是一个国家经济发展水平、社会文明程度的重要标志之一,我国的许多博物馆也已作为精神文明的教育基地。博物馆兴建、新建和扩建是现代博物馆建筑的发展
改革开放以来,我国城乡居民收入水平有了很大的提高,直接导致居民消费水平和消费结构的重大变化。根据目前我国城乡居民的恩格尔系数,食物消费支出仍为居民家庭消费支出的重
随着金融、政务、商务等重要信息网络与互联网互连,互联网这个全球性的信息网络已经在政治、经济等方面起着越来越重要的作用。与此同时,这些重要的信息网络系统面临入侵攻击
高新技术产品出口是衡量一个国家经济实力、科技实力和出口实力的重要指标。我国高新技术产品出口起步较晚,但发展较快,己成为我国出口贸易新的强劲的增长点,对我国国民经济
随着城市建设的快速发展,岩土工程中的环境保护问题已经成为工程设计、施工中应该考虑的重要环节,而且要求也越来越高,由原先的以强度为控制指标逐渐转变为以变形为控制指标
20世纪90年代中期以来,随着世界经济全球化、一体化和信息化趋势的日益发展,国际直接投资发展迅猛,作为国际直接投资主体的跨国公司无论在数量还是在投资规模上都得到了飞速