论文部分内容阅读
概念格以其良好的数学性质已成功地应用于知识发现等诸多领域,但由于概念格自身的完备性,构造概念格的时间复杂度一直是影响形式概念分析应用的主要障碍。概念格应用的前提是概念格的构造。现在概念格的渐进式构造算法表现出了更强的生命力和适应性。但目前基本上都是属于基于对象的渐进式算法,而基于属性的构造算法未见报告。实际上,形式背景中数据的变化应该包括两个方面:一是对象的增减,二是属性的增减。增加属性可能使原来不能区分的对象能够区分,删除属性就可能使原来属于不同类的对象变为同一类。通过对概念格中概念之间的相互关系的了解,和对象和属性之间相互关系的研究,本文提出并实现了基于属性的概念格构造算法,特别是基于属性的渐进式生成算法。它不仅为概念格的生成提供了一种新的方法,而且解决了在已构造好概念格的前提下,增加属性所带来的概念格更新问题,另外,它也为分布式存储的形式背景的概念格横向合并提供了基础。 随着处理的形式背景的增大,构造概念格的时空复杂度也会随着急剧增大。研究采用新的方法和手段来构造概念格,就成为概念格研究的主要内容之一。现在已经提出的构造概念格的多种算法基本上是针对单个概念格的。采用分治策略来构造概念格是解决这一问题的有效途径。概念格的分布处理就是通过形式背景的拆分,形成分布存储的多个子背景,然后同时构造相应的子概念格,再由子概念格的合并得到所需的概念格。 由于概念格是其形式背景中的概念间关系的表现形式,它和对应的形式背景是一一对应的。因此,对概念格的分布处理必然涉及到形式背景的拆分、合并等处理。本文从形式背景的并置和叠置出发,定义了两种类型的形式背景和概念格;并对不一致背景的处理进行了研究;证明了横向合并的子形式背景的概念格和子背景所对应的子概念格的横向并是同构的;结合子概念格中概念间固有的泛化—特化关系,继承已有的概念格渐进式构造的算法,并对其进行改造,形成能满足多个子概念格合并处理要求的算法。 数据挖掘是自动从数据中提取出人们感兴趣的潜在的可用信息和知识,并将提取出来的信息和知识表示成概念、规则和模式。关联规则是发现知识的主要形式。提取关联规则的主要步骤是频繁项集的获取,而一个事务数据库中频繁项集的数量往往很庞大,从频繁项集中提取的规则就会很多,且存在大量的冗余。为了缩减频繁项集的数目同时也不丢失有用信息,现在采用用频繁封闭项集来提取最小无冗余的关联规则。