实值信息系统属性约简算法研究

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:iamvp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
属性约简是粗糙集理论的重要应用,也是其核心问题之一。但是,经典粗糙集理论模型建立在不分明关系(等价关系)基础上,它处理的属性值是清晰的离散值,而对现实世界中广泛存在的实值信息系统却不能直接处理,即无法利用连续属性值来建立等价关系,从而使经典粗糙集理论的应用大大受到了限制。因此,探究实值信息系统的有效属性约简方法显得尤为重要,同时发展这方面的理论也是十分必要的。本文首先系统的阐述了粗糙集理论的总体研究情况,深入研究了经典粗糙集的理论框架、概念基础以及粗糙集理论的核心—知识约简,讨论了知识约简与信息系统、决策系统的关系。其次,简单介绍了粗糙集的属性约简理论以及现有的属性约简算法,包括基于可辨识矩阵和逻辑运算算法、基于信息熵的算法和基于信息量的算法。再次,在总结和借鉴前人研究成果的基础上,针对普遍存在的实值信息系统,给出了两种不同的实值属性约简算法:第一种是基于区分矩阵的实值属性约简算法。该方法将经典粗糙集理论对数据空间的等价划分转换为基于邻域关系的粒化,从而形成论域的一个覆盖,通过定义对象之间关于单个属性的相似度以及构造区分矩阵,同时应用集合覆盖和属性约简之间的联系,将实值信息系统的最小属性约简问题转化为最小集合覆盖问题,给出了实值信息系统最小属性约简的算法。并采用UCI机器学习中心库中4个不同的数据集进行实证,实验结果表明,该约简方法可以选择较少的属性而保持或改善分类能力。第二种是基于信息量的实值属性约简算法。该方法在已有典型的基于信息量的属性约简方法的基础上,对其进行拓展。通过构造关于单个属性的相似矩阵,重新定义属性的信息量、联合信息量、条件信息量以及属性的相对重要性。在算法实现上,以空集为起点,逐次选择使属性相对重要性最大的属性添加到约简集中,同时给定一个属性相对重要性的阈值ε,作为算法终止的条件。给出多个实例仿真,验证了该算法的可行性和有效性。此外,针对更一般的信息系统(不完备实值信息系统),在上述提出的两种算法基础上,结合容差关系,给出了适用于更广泛的信息系统属性约简方法。
其他文献
学位
随着科技的发展,图像作为一种重要媒介已经成为获取信息的必要来源。而图像去噪往往是图像处理中最难解决的问题。噪声通常以加性、乘性和混合的形式对图像产生影响。本文考
混沌系统的Lyapunov指数与混沌同步是当今非线性科学研究领域中最热点的问题,本文主要针对混沌系统Lyapunov指数的求法与混沌系统的异结构同步展开讨论,做了如下研究:   首先
学位
中文专业是传统的老牌专业,也应根据社会需求做出调整,尤其在我国即将出台方案,实现两类人才、两种模式高考的背景下,培养技能型人才就显得十分重要。可以建立校企合作机制,使技能
学位
经济增长是指按一定指标测算的经济产出总量的增加。通常情况下,经济增长指一个总经济体的增长,主要是指一个国家或地区的GDP等指标的增长。它意味着一个国家或地区的经济规
To explore the stabilization effect of stabilizing agent GX07 on treating organic soil and the influence of organic matter on the strength development of stabil
在新时期的背景下,为了强化化学实验室大型仪器设备的管理实效,提升自身的综合管理水平,提出现代化、网络化的大型仪器设备管理模式来管理化学实验室。从总体来看,鉴于化学实验设
近年来,无论是从理论研究方面还是实际应用方面,非局部的微分算子都引起了学者们的极大关注。其中,分数阶p-Laplace算子是一类非局部的拟微分算子。具有分数阶p-Laplace算子的方