基于覆盖算法的条件信息熵表示及属性约简

来源 :安徽大学 | 被引量 : 0次 | 上传用户:zhang16432780
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是波兰数学家Z. Pawlak于1982年提出的一种处理不确定和不精确知识的数学工具,它的主要思想就是保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则,从中发现隐含的知识,揭示潜在的规律。其最大的优点是无需提供除问题所需处理的数据之外的任何先验信息,客观描述或处理的不确定性问题,已成为信息分析和数据挖掘的重要方法。  现实中存在着大量不相容决策信息系统。Pawlak最初提出的粗糙集理论是以等价关系为基础的,但是对不相容决策表用传统的等价关系得到的划分其属性约简的速度和最小约简都不理想,限制了粗糙集模型的应用,针对不相容决策信息该系统的约简研究,将更具实践意义。  覆盖算法是一种基于M-P神经元的构造性神经网络算法,具有运行速度快、精度高的特点,在众多领域得到广泛应用。本文利用覆盖算法对数据进行处理,构建论域U的一个划分,从而定义一种基于覆盖的条件信息熵和属性重要性,以新的属性重要性为启发信息设计属性约简算法。主要工作包括:  1.综述了经典粗糙集的基本理论和方法,研究粗糙集理论的属性约简的主要方法,分析各自的特点与存在的问题。简要描述覆盖算法的思想,并分析覆盖领域内样本点的特点。  2.提出基于覆盖算法的条件信息熵表示及属性重要性的计算,并证明了对于一致决策表,它与基于该条件信息熵的属性约简与代数定义下表示是等价的。  3.由新的条件信息熵定义新的属性重要性,以新的属性重要性为启发信息设计约简算法并给出相应的算法。实验表明该约简算法能快速搜索到最优或次优约简。  4.利用基于覆盖算法的属性约简,对1993年到2005年我国石油安全数据建立的决策表进行属性约简,提取决策规则。实例分析得出我国石油安全属于重警区,需加强防范。
其他文献
随着当今时代信息科技的飞速发展,医学图像融合作为图像融合的一个分支,在很多领域都得到了广泛应用,其目的主要是获得多模态医学图像的互补信息,以便融合图像具有更丰富、更有效
本论文共三章,主要研究两类代数数域上的基本单位:我们给出了一些实二次域存在范为-1的基本单位充分条件,并求出一些实三次域大于1的基本单位.  第一章首先介绍了研究背景和基
近年来,灵台县围绕贯彻落实《干部任用条例》和《深化干部人事制度改革纲要》,从建设高素质干部队伍的需要出发,大胆创新干部人事工作机制,努力推进干部人事制度改革,取得了
有限域上的线性递归序列,在密码学中,有非常重要的应用.近年来,序列密码学的发展朝着向量密码学的方向发展,这就需要我们研究多现行递归序列的许多性质,但Fq上的单序列簇的空
数据的强需求催生出传感器新闻“传感器现在是我们获得信息的一种非常重要的方式,记者在做传感器新闻时,需要经过用传感器获得数据、分析数据、将数据用最恰当的呈现方式融入
脉冲现象作为一种瞬时突变现象,在现代科技各领域的实际问题中是普遍存在的,研究此类现象的数学模型往往归结为脉冲微分系统.近十多年来,脉冲微分方程作为一个新的研究领域发展的
本文分四章,研究了几类(次)线性算子及其高阶交换子和多线性交换子在截口上的有界性.   第一章得到了由BMOF(Rn)函数和核K(x,y)满足一定截口条件的奇异积分算子H生成的高阶交
本文从一个3×3谱问题出发,获得了NLS-MKdV方程族。然后利用特征值问题的非线性化方法,得到了一个在Poisson流形R3N上的具有Lie-Poisson结构的有限维Hamilton系统。通过引入A
贝叶斯网络是用来表示变量间概率关系的图形模型,它提供了一种自然的表示因果信息的方法,用来发现数据间的潜在关系.以其独特的不确定性知识表达形式、丰富的概率表达能力、
本学位论文主要利用亚纯函数的值分布理论研究了复线性微分方程的解的增长性问题,建立了复线性微分方程的解的增长性与亚纯函数的值分布理论中一些深刻结果之间的联系.我们考