基于粗糙集与概念格的知识获取方法研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:mao_320
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识获取是人工智能领域最为核心的内容之一,对知识不确定性的研究和探索贯穿于人工智能近半个世纪发展历程的始终,特别是最近20年间,知识获取受到了广泛的研究,各种不同的知识获取方法应运而生。  粗糙集理论是波兰学者Pawlak于1982年提出的一种数据分析理论,其主要思想就是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。经过二十余年的发展,由于其在数据的决策与分析、模式识别、机器学习、知识发现等方面的成功应用,引起了世界范围内各国学者的广泛关注。由德国学者Wille于1982年提出来的概念格理论同样是建立在分类基础上,通过概念的内涵和外延上的依赖或因果关系,建立层次结构来推导规则。概念格已被广泛地应用于软件工程、数据挖掘、信息检索等领域。粗糙集和概念格自产生以来,由于思想新颖,方法独特,不需要任何先验信息,并且推导的规则具有可解释性,目前已成为知识发现的两个重要工具。  本文对粗糙集与概念格中的一些基础理论问题和知识发现方法进行了深入的研究。  论文的主要贡献和创新点如下:  (1)给出了知识粒度的公理化定义,提出了基于知识粒度的粗糙集的精度、粗糙度和粗糙分类的精度的新的度量方法,给出了一个基于知识粒度的属性约简算法,并通过UCI标准数据集对这些度量方法进行了测试。理论分析和实验结果表明,这些度量克服了经典粗糙集不确定性度量的不足,与已有的度量相比,具有形式简单、精度高、可理解性强的特点。这些新的度量对于规则评价和知识获取有着重要的意义。  (2)给出了非完备信息系统中知识粒度的公理化定义,提出了非完备信息系统中粗糙集的精度、粗糙度和粗糙分类的精度的度量方法,统一了完备信息系统和非完备信息系统中的相关度量结果,实验结果表明了这些度量的有效性。同时,针对非完备信息系统,提出了一种基于知识粒度的属性约简算法。  (3)提出了一种新的更有利于规则提取的扩展的概念格模型,即闭标记概念格,给出了相应的基于闭标记的渐进式构造算法。在新的格结构下,提出了蕴含规则、关联规则以及分类规则的获取方法。实验结果表明,基于闭标记概念格能够提取出简洁、有效的规则,与已有的方法相比,减少了规则的数目,提高了规则的可理解性。  (4)建立了优势关系下的扩展概念格模型,即优势概念格,讨论了信息系统中优势关系、偏序集与概念格的关系,给出了优势概念格的构造方法和基于优势概念格的对象全序化方法与属性约简方法。这些结果扩大了概念格的研究领域,为基于优势关系的信息系统的规则获取提供了新思路。  (5)设计并实现了一个基于粗糙集与概念格的知识发现平台,在该平台上对本文所提出的算法进行了集成并通过UCI的标准数据集进行了测试,取得了较好的效果。  总之,本文对粗糙集理论中的不确定性度量与知识约简、基于概念格的知识获取、基于概念格的扩展模型等方面进行了研究,取得了一些有意义的重要结论,并对提出的算法进行了实验分析和讨论。最后,基于本文所提的算法和一些典型算法,开发了一个基于粗糙集和概念格的实验平台。本文的研究成果丰富了粗糙集和概念格的基本理论,在知识发现、模式识别、决策分析等方面具有重要的理论意义和广泛的应用价值。
其他文献
越来越多的企业采用分布式管理信息系统为企业经营管理决策服务.用户(表示的集合)分布、功能(也称处理)分布和数据分布是分布式MIS系统的关键.在这篇论文中,工作人员讨论三个
该文描述了一种当前比较新型的数据库管理系统-面向对象的数据库管理系统(OODBMS)的基本概念及其实现过程.该系统地实现主要是应用于教学实践,参照POSTGRES 95面向对象的数
随着航天技术的飞速发展,星载有效载荷数量不断增加,更多空间图像的采集也成为日益增长的需求,因此下传数据量变得异常巨大。大数据量的图像信息会给星上存储器的存储容量,通
信号检测技术、模糊诊断技术、面向对象专家系统技术和数据库技术在工业控制中的应用越来越广泛,综合运动这些技术开发一个数控机床辅助调试系统,能极大地提高数控机床的调试
基于组件的软件工程(Component-based software engineering,简称CBSE)或基于组件的开发(Component-Based Development,简称CBD)是一种软件开发模型。也是现今软件复用理论实
客户/服务器方式近年来在数据库管理系统方面已得到了广泛的应用.该文深入研究了客户/服务器技术,并对其两层和三层结构在各方面进行了比较,同时又对客户/服务器系统中起着重
该课题对基于Web的CAI软件的开发工具和开发方法进行了一定的研究,并实现了一个示例性的CAI软件系统--《操作系统教程》.该课题所实现的教程可分为教学和考试两个部分.教学部
该文通过对IPSec安全体系及相关安全机制的深入研究,发现并指出了IPSec标准存在的若干安全缺陷.重点讨论了IPSec的两个主要安全协议之一"封装安全有效负载(ESP)的安全缺陷:缺
论文主要根据信息系统总体数据规划的理论和方法以四川石油管理局物资总公司物资管理系统的总体规划设计为案例进行了研究.
通过对国内外报表生成器的调查研究和综合分析,目前报表生成器在应有和方面普遍存在以下的问题:(1)、缺乏用户干预的能力,一旦报表建立以后,用户想修改报表必须由程序员修改